
OpenAI与硅谷独角兽匆匆“分手”,DeepSeek 是始作俑者吗?_ZAKER新闻

合作不到一年,人形机器人独角兽 Figure AI 创始人兼首席执行官 Brett Adcock 就于日前在 X 上发文,宣布终止与 OpenAl 的合作协议,并表示:"Figure 在完全自主研发的端到端机器人 AI 方面取得重大突破,我们很高兴在接下来的 30 天内向你展示一些从未在人形机器人上见过的东西。"
2024 年 2 月底,估值达到 26 亿美元的 Figure AI 宣布与 OpenAI 合作开发面向人形机器人的下一代 AI 模型,OpenAI 将结合自身研究与 Figure AI 在机器人软硬件方面的深入理解,帮助 Figure AI 的人形机器人提升处理和推理语言的能力。
然而在 1 月 31 日,OpenAI 向美国专利商标局(USPTO)提交了一份涉及人形机器人的商标申请。而在去年 11 月,OpenAI 还被曝正在重建曾在 2020 年解散的机器人团队。因此二者合作的破裂并不难理解。
OpenAI的 " 拧巴 "
作为一家 AI 研究和部署公司,OpenAI 对具身智能也保持着高度关注,除了与 Figure AI 的合作,还投资了具身智能初创企业 1X 和 Physical Intelligence。
据了解,1X 是一家总部位于挪威的实体机器人公司,主要应用于家庭场景,1X 最新一代 NEO 产品已在欧洲和美国进行落地验证,相比早期 EVE 版本的轮足机器人,NEO 双足人形机器人产品完成度更高。通过结合 OpenAI 的多模态大模型,让其在复杂的家庭场景下,具备了一定的泛化操作能力。
而 Physical Intelligence 则专注于研发能够驱动多功能机器人的人工智能(AI)模型和算法,致力于在实体世界中实现类似于 ChatGPT 在数字世界中所做到的变革。通过结合先进的 AI 技术和机器人硬件,Physical Intelligence 旨在创造出能够自主学习、适应各种环境并执行复杂任务的智能机器人。
此前,有分析人士对此表示了担忧,一方面,硬件制造与软件开发之间存在明显差异,如何有效整合软硬件资源,实现技术上的无缝对接,是 OpenAI 需要面对的重要挑战;另一方面,OpenAI 即是投资者,又是参与者,未来如何定位自己是一个需要思考的问题。如果进军人形机器人本体研发,那么 OpenAI 与合作伙伴之间将处于既竞争又合作的矛盾关系。
o1虽好,但使用成本高昂
从上个月开始,中国 AI 创业公司 DeepSeek 推出的 R1 模型抢走了 o1 的风头。R1 是一个高效的开源推理模型,全球任何人都可以免费获取、重新训练和定制,还可以在 DeepSeek 的网站和手机应用上免费使用。
DeepSeek R1 采用宽松的 MIT 许可协议,提供免费的应用和网站服务,并开放代码供人修改,这导致其在消费者和企业市场迅速走红。就连 OpenAI 的投资方微软和 Anthropic 的支持者亚马逊也急于将其变体引入自家云市场。AI 搜索公司 Perplexity 也迅速为用户添加了 R1 的变体版本。
微软 1 月 30 日发文宣布 DeepSeek R1 现已在 Azure AI Foundry 和 GitHub 上提供。微软 CEO 纳德拉在近日的财报电话会议上表示,DeepSeek-R1 模型目前已可通过微软的 AI 平台 Azure AI Foundry 和 GitHub 获取,并且很快就能在微软布局的 Copilot+PC 上运行。
2 月 1 日,OpenAI 推出了 o3-mini,这是其新一代 " 推理器 " 系列的第二款模型。o3-mini 现已在 ChatGPT ( 包括免费版 ) 和 OpenAI 的 API 上线,比此前的高端模型 o1 及其精简版 o1-mini 更便宜、更快、性能更强。
OpenAI 在去年年底推出的 o3 模型被认为是其最强大的人工智能产品,但其运行成本极其高昂,单次任务费用超过 1000 美元。即使是低计算版本的 o3,其在基准测试中得分达到了 76%,但每个任务的成本也达到了约 20 美元,虽然相对而言仍算是个相对便宜的选择,但与其前代产品相比仍然贵了好几倍。
据悉,DeepSeek-R1 的 API 定价低至每百万 tokens 输入 1 元,仅为 OpenAI 的 3%。社交平台 X 的用户 Shubham Saboo 称:"DeepSeek R1 100% 开源,比 OpenAI o1 便宜 96.4%,同时提供类似的性能。OpenAI o1 每 1M 输出 Token 为 60 美元,而 DeepSeek R1 每 1M 输出 Token 为 2.19 美元。拥有 200 美元 ChatGPT 订阅的人,请仔细考虑一下。"DeepSeek R1 的性价比引发了人们对 OpenAI 投资回报率的怀疑。
具身智能究竟需要怎样的大模型
斯坦福大学计算机科学教授李飞飞曾指出,具身智能是 AI 领域的下一个 " 北极星问题 " 之一,它能够在虚拟世界中探测和改变自身环境,与周围环境交互,学习复杂的类人任务。
而具身智能的实现,核心就在于大模型。此前,惊艳亮相的 Figure 02,其语音交互能力是基于 OpenAI 为其定制的大模型实现的。合作骤然破裂,必然有迹可循。
据 TechCrunch 报道,Figure AI 创始人兼首席执行官 Brett Adcock 表示,合作的关键问题在于整合。OpenAI 是一家规模庞大的公司,拥有庞大的业务范围和相应的智能模型。将人工智能嵌入机器人等实体的具身智能并非这家 ChatGPT 制造商的关注重点。Adcock 认为,正确的解决方案是建立一个端到端的人工智能模型,为特定硬件提供动力。" 我们发现,要在现实世界中大规模解决具身智能,必须垂直整合机器人 AI。"Adcock 表示," 我们不能外包人工智能,就像我们不能外包硬件一样。"
据了解,实现具身智能有两种路径,一种是分层决策,另一种是端到端的神经网络系统。Figure AI 在与 OpenAI 合作时采用的是前者,通过不同的神经网络协作,去提高系统的灵活性和实时响应能力。
而端到端架构则通过单一神经网络,将输入任务直接映射为控制信号,形成从输入到输出的无缝连接。但这种模式需要通过海量数据驱动。
2024 年 6 月,智元机器人决定研发机器人具身智能大模型。为了提升机器人的泛化能力,并适应复杂的环境,智元机器人创始人彭志辉曾预计在 2024 年下半年智元会有百台以上自由部署机器人专门用来做端到端的数据采集,同时,AIDEA 平台也计划在同年第四季度对外上线。
乐聚机器人董事长冷晓琨告诉动点科技记者:" 分层决策和端到端模型在具身智能的实现中各有优势,未来可能会呈现融合发展的趋势。理想情况下,合理的分层决策模型应该更加节能高效。就跟人一样,大脑不应该将算力浪费在计算低层级的运动控制反馈或肌肉关节层面的运动跟踪上。算力消耗等同于能源,因此避免不必要的计算十分关键。大家担心的是,不恰当的分层解耦可能会在信息传输过程中造成限制,导致模型泛化能力不足。但这只是分层设计缺陷的问题,所以目前我们还不会去做直接的端到端。"