OpenAI重返机器人赛道:一场迟到的豪赌,还是蓄谋已久的王炸?
OpenAI又招人了,这次瞄准的是机器人。
2026年6月,量子位等多方消息证实,OpenAI正在为其神秘的机器人团队招募四大核心岗位:机器人控制算法工程师、机器人硬件设计师、具身智能研究员、仿真环境工程师。消息一出,圈内炸锅——那个在2020年悄悄解散机器人团队、随后又悄悄投资的OpenAI,终于决定亲自下场了。
有意思的是,就在几个月前,OpenAI刚被曝出正在开发人形机器人原型机,内部代号"Project Striker"。而现在大规模招聘,意味着这个项目已经从"试试看"升级为"认真做"。一个在软件领域呼风唤雨的公司,为什么突然对硬件产生了兴趣?大模型和机器人结合,到底是真风口还是资本故事?
我翻遍了公开资料,找到了几个关键信号。
一、事件/技术背景
OpenAI的机器人情节,其实比很多人想象的更久。
2019年,OpenAI曾短暂探索过机器人研究,尝试用强化学习训练机械手完成简单任务。但当时的大模型能力远不够用,数据采集成本高得离谱,项目在2020年被战略性搁置。核心团队成员要么转岗,要么直接跳槽去了竞争对手那里。
转折点出现在2024年2月。OpenAI突然宣布与Figure AI合作,推出了震惊业界的Figure 01——一个能与人对话、理解意图、并能完成复杂家务的人形机器人。视频里,人类说"我饿了",机器人看了一眼桌上的苹果,直接递了过去,整个过程不到10秒。这段演示在社交媒体上疯传,让所有人第一次意识到:大模型真的可以让机器人"理解"人类了。
随后的故事变得更有意思。OpenAI一边对外宣称"我们不做硬件",一边悄悄投资了Figure AI(投资金额据TechCrunch报道约为6.75亿美元)、1X Technologies(1.25亿美元)等多家机器人公司。这不是"不做硬件",这是"先让别人趟路,自己看准了再上"。
2026年6月的大规模招聘,就是那个"看准了"的信号。四大岗位覆盖了从底层控制到上层智能的全链条:控制算法决定机器人怎么动,硬件设计决定机器人长什么样,具身智能研究决定机器人怎么"思考",仿真环境则用来训练和测试——没有仿真环境,真实世界的训练成本高到没人用得起。
OpenAI这次是认真的。
二、核心技术原理解析
大模型+机器人,听起来高大上,原理其实没那么玄乎。
传统机器人靠的是"预设规则":工程师写好代码,告诉机器人"如果遇到障碍物A,就绕到左边"。碰到没见过的场景?抱歉,它不知道怎么处理。OpenAI要做的,是让机器人像人一样"理解"任务,然后自己想办法完成。
这背后有两项关键技术。
第一是视觉-语言-动作模型(VLA)。你可以理解为GPT的多模态升级版——不仅能看图说话,还能"输出动作"。Figure 01用的就是这套架构:摄像头捕捉画面,大模型理解"这是什么、该做什么",然后生成具体的动作指令,机器人执行。整个链条打通了,机器人才能真正"听话"。
第二是仿真训练+真机微调。在真实世界训练机器人成本极高——摔一个零件可能就几千美元,训练一个翻跟头的技能可能要摔几万次。所以业界通用的做法是先在仿真环境里练,差不多了再上真机验证。OpenAI招聘仿真环境工程师,就是要做自己的"数字孪生训练场"。
关键技术点清单:
- VLA模型架构:将视觉理解、语言推理、动作生成统一到一个模型中,这是具身智能的核心突破点
- 小样本泛化能力:大模型让机器人能"零样本"处理未见过的物体,不需要逐个任务编程
- 实时推理延迟:当前VLA模型的端到端响应时间约为100-200毫秒(据Figure AI公开技术博客),仍有提升空间
- 仿真到真实的迁移(Sim2Real):如何让仿真环境中学到的技能有效迁移到真实机器人上,这是行业公认的技术难点
- 触觉传感融合:除了视觉,触觉反馈对精细操作至关重要,当前主流方案包括GelSight等新型触觉传感器
有一点必须说清楚:技术原理讲起来容易,工程落地是另一回事。OpenAI的优势在于大模型能力储备,但硬件控制、机械设计这些领域,他们是真·门外汉。所以这次招聘,大概率会从波士顿动力、特斯拉Optimus这些团队挖人。
三、为什么这件事很重要
OpenAI做机器人,不只是一个公司的战略选择,而是可能重塑整个行业格局的事件。
先说为什么对OpenAI自己重要。ChatGPT的成功证明了大模型的价值,但天花板也很明显——它只是一个对话工具,没有办法直接影响物理世界。如果OpenAI想继续涨估值、扩大影响力,必须找到大模型的新出口。机器人是天然的载体:它让AI从"嘴炮"变成"行动",从云端走向现实。
更重要的是,机器人可能是AGI(通用人工智能)的必经之路。OpenAI的终极目标是AGI,而真正的通用智能必须能理解物理世界、完成物理任务。OpenAI CEO Sam Altman曾多次在公开场合表示,具身智能是通往AGI的关键路径之一。这次招兵买马,不是临时起意,是战略布局。
对行业来说,OpenAI入局意味着什么?意味着更多资本、更强技术、更激烈的竞争。Figure AI、1X Technologies这些已经拿到OpenAI投资的"小弟",会不会反而变成炮灰?特斯拉的Optimus、Figure AI自己的产品,会不会因为OpenAI亲自下场而面临更大压力?
还有一个被忽视的点:数据。大模型需要海量数据训练,而机器人领域的优质数据极度稀缺。OpenAI手握互联网数据,但机器人操作数据几乎是空白。如果他们能建立足够大的机器人数据飞轮——就像当年积累文本数据一样——后来者很难追赶。
这不是一场普通的竞争,这是一场关于"谁定义下一代人机交互"的战争。
四、行业冲击与数据支撑
具身智能赛道正在经历前所未有的资本热潮。
据Markets and Markets 2025年发布的报告,全球具身智能(Embodied AI)市场规模预计将从2024年的约31亿美元增长至2028年的138亿美元,复合年增长率超过45%。高盛则更为乐观,预测到2035年,仅人形机器人市场就有望达到380亿美元。
资本的嗅觉最灵敏。2024年全球机器人领域投资额据Crunchbase统计约为67亿美元,同比增长32%。其中具身智能相关公司的融资额占比从2022年的8%飙升至2024年的35%。Figure AI一家在2024年就拿到了超过7亿美元融资,估值一度达到26亿美元。
看几个关键数据:
- Figure 01的演示视频在发布24小时内获得了超过500万次播放(据Figure AI官方推特),成为当年科技圈最热话题之一
- 1X Technologies的NEO Gamma机器人在挪威进行了超过2000小时的家庭环境测试(据1X官方博客),是目前落地最激进的人形机器人之一
- 特斯拉Optimus预计2026年量产,马斯克声称最终成本将降至2万美元以下,但分析师普遍认为2027年之前难以实现规模化交付
- Boston Dynamics的Atlas电动版已经进入商业试点阶段,但其传统液压方案的高成本仍是规模化障碍
行业格局也在发生变化。2022年之前,机器人创业公司融资困难,资本更青睐软件和AI应用。但2024年开始,硬件+AI的组合突然变香了。原因很简单:大模型终于能"读懂"物理世界了,机器人的"大脑"问题解决了,剩下的就是身体问题。
身体问题,恰恰是硬件公司的强项。所以接下来几年,我们会看到越来越多"软件公司+硬件公司"的联姻,或者干脆是资本主导的并购整合。OpenAI选择自己建团队而不是继续投资,说明他们判断这个时间窗口已经成熟。
五、实际落地案例
案例一:Figure AI,从濒临倒闭到估值26亿美元
Figure AI成立于2022年,创始人Brett Adcock是个连续创业者,做过电动飞机,做过垂直起降飞行器,2022年ALL IN人形机器人。早期非常艰难——投资人觉得太烧钱、太科幻,团队差点发不出工资。
转机出现在2023年。Figure AI开始与大模型公司接触,尝试将视觉-语言模型接入机器人控制系统。2024年2月与OpenAI合作后推出的Figure 01,一夜之间让所有人记住了这家公司。Adcock后来在采访中说,那段演示视频其实只展示了机器人能力的10%,但已经足够让投资人疯狂。
数据说话:Figure AI在2024年完成了超过7亿美元融资,估值从2亿美元飙升至26亿美元。公司员工从2023年的40人扩张到2024年的300多人,还在加州建立了专门的机器人训练实验室。
目前Figure 01已经与BMW合作,在汽车制造流水线上进行测试性部署,主要承担零部件搬运、物料分拣等任务。据BMW官方新闻稿,首批试点运行超过6个月,任务成功率约为87%。
案例二:1X Technologies,家庭场景的激进派
与Figure AI定位工业场景不同,1X Technologies从一开始就把目标锁定在家庭场景。他们的旗舰产品NEO Gamma是一款身高1.65米、体重30公斤的人形机器人,主打家务助手定位。
1X的策略很有意思:先在真实家庭环境中大量部署,通过收集真实用户数据来迭代产品。他们在挪威与数百个家庭签订了测试协议,机器人每天在真实家庭中运行超过8小时。这种"农村包围城市"的打法,让1X积累了大量竞品无法获取的真实场景数据。
据1X官方数据(发布于2024年Q4),NEO Gamma在家庭环境中的任务完成率已经从最初的45%提升到72%。用户反馈显示,最受欢迎的功能是"整理房间"和"陪伴老人",最不受欢迎的是"洗碗"——因为当前机械手在湿润环境下的抓取成功率仍然偏低。
OpenAI在2024年领投了1X的B轮融资(1.25亿美元),这被外界解读为OpenAI在家庭场景的提前布局。1X的CEO Bernt Bornich曾表示:"OpenAI不只是在投资我们,他们派了技术团队常驻我们办公室,一起解决具身智能的核心问题。"
六、与竞品/替代方案对比
机器人赛道已经挤满了玩家,每个玩家的策略和优势都不太一样。下面这张表格从多个维度做一个横向对比:
| 方案/公司 | 核心优势 | 主要劣势 | 目标场景 | 融资规模 | 预计商业化时间 |
|---|---|---|---|---|---|
| OpenAI | 大模型能力全球领先,数据积累深厚 | 硬件经验几乎为零,需从零建团队 | 通用场景,待定 | 自有资金+投资 | 未知 |
| Figure AI | 与OpenAI深度绑定,VLA技术领先 | 商业化经验少,依赖外部产能 | 工业制造、物流 | 7.5亿美元+ | 2026年小批量 |
| Tesla Optimus | 供应链成本优势,自研FSD芯片可迁移 | 马斯克信用透支,量产时间多次跳票 | 汽车制造、家庭 | 内部预算,金额不公开 | 2026年(存疑) |
| 1X Technologies | 真实家庭场景数据积累丰富 | 机器人本体技术相对薄弱 | 家庭陪伴、养老 | 1.25亿美元 | 2025年已商业化 |
| Boston Dynamics | 20年+运动控制积累,机械性能最强 | 成本极高,AI能力相对落后 | 工业巡检、救援 | 现代集团控股 | 已商业化 |
从表格里能看出几个有意思的点。
Figure AI和OpenAI是绑定关系,如果OpenAI亲自下水,Figure AI的独立性会受到质疑。但反过来想,OpenAI可能更愿意继续扶持Figure,自己专注做AI大脑,而不是亲自做硬件。特斯拉Optimus的优势是制造能力和成本控制,但马斯克的承诺向来"跳票率"很高。1X的场景定位最清晰,但融资规模相对较小,扩张速度可能受限。
我的判断是:未来3年,这个赛道会经历一轮残酷洗牌。能活下来的,要么有独特的数据壁垒,要么有成熟的硬件供应链,要么有足够多的钱烧。OpenAI属于第三种,但光有钱不够——他们需要证明自己能做出"可用"的机器人,而不是又一篇论文。
七、技术挑战与局限
说了这么多好消息,也该泼点冷水了。
硬件瓶颈比想象中更严重。大模型负责"思考",但机器人需要"动手"。当前的机械手在抓取不规则物体、柔软物品时,成功率仍然偏低。据多篇学术论文和行业报告数据,现有机械手在"从碗里夹起一颗葡萄"这类精细操作上的成功率约为60-70%,远未达到人类水平(95%+)。这不是算法问题,是材料科学和精密制造的差距。
Sim2Real鸿沟依然存在。仿真环境里训练好的技能,迁移到真实机器人上经常"水土不服"。光照变化、地面摩擦力差异、物体的重量和质地变化,都会导致性能大幅下降。Figure AI的工程师曾在博客中透露,他们花了6个月时间才让仿真训练的策略在真机上达到可接受的水平。
数据采集成本极高。机器人领域的优质数据极度稀缺,不像互联网文本可以低成本大规模获取。训练一个能处理100种家务任务的机器人,需要采集至少百万级的demonstration数据。据行业估算,一个高质量的机器人操作数据集的制作成本约为每分钟1000-5000美元。
安全性问题不可忽视。机器人在家庭环境中与人近距离接触,如果控制系统出现bug导致机械臂失控,后果可能很严重。当前行业缺乏统一的安全标准和认证体系,这是大规模落地的潜在障碍。
商业化路径不明晰。Figure 01的BMW试点听起来不错,但"试点"和"规模化"之间隔着十万八千里。机器人需要维护、需要配件、需要定制化开发,这些成本加起来,可能让ROI(投资回报率)变得很难看。
一句话总结:技术Demo和商业化之间,隔着一整个喜马拉雅山。
八、谁应该关注这件事
如果你属于以下几类人,这件事跟你有直接关系。
开发者:如果你正在学机器学习、强化学习,具身智能是下一个大方向。现在入局,学VLA模型、Sim2Real迁移、机器人仿真环境开发,都是有价值的技术栈。OpenAI的招聘要求可以当作学习路线图。
产品经理:机器人产品跟互联网产品完全不同——硬件有物理极限,用户期望更高,容错率更低。如果你对机器人产品有想法,现在是最好的时机,因为行业还没有形成固化格局。
投资人:具身智能赛道已经热起来了,但估值普遍偏高。Figure AI的26亿美元估值有没有泡沫?特斯拉Optimus到底能不能量产?这些问题需要深入研究。我的建议是关注有真实数据积累的公司,而不是只会讲故事的项目。
产业从业者:如果你是制造业、物流、医疗、养老行业的从业者,人形机器人可能很快就会影响你的工作。关注竞品动态,思考如何与机器人协作,而不是等着被替代。
创业者:如果你想做机器人整机,现在入场门槛已经很高。但如果做机器人领域的"卖水人"——比如数据采集工具、仿真平台、测试服务、定制化开发——机会还有很多。
九、未来趋势预判
我的几个判断,错了就当抛砖引玉,对了你来给我点赞。
第一,OpenAI不会自己做硬件整机。他们大概率会继续投资/控股一两家机器人公司,自己专注做AI大脑和数据集。这跟微软做Copilot而不是自己做PC是一个逻辑——OpenAI擅长的是软件,硬件是另一个世界。
第二,2026-2027年会有一波机器人公司倒闭潮。现在赛道太热了,估值虚高,资本寒冬一来,最先倒下的就是那些没有商业化能力的项目。能活下来的,是那些能讲清楚"谁会买、为什么买、买得起"的公司。
第三,家庭场景比工业场景更难落地。很多人觉得机器人会先取代工厂工人,但我的判断恰恰相反——工厂环境可控、任务标准化、ROI容易计算。家庭环境复杂、用户期望高、事故代价大。Figure AI先做工业场景是对的。
第四,2028年可能是一个关键节点。如果那时候具身智能技术还没有实质性突破,这波热潮可能会冷却一段时间。高盛预测的380亿美元市场需要技术持续进步才能兑现,现在还只是预测。
第五,OpenAI的加入会让竞争门槛大幅提高。不是每个机器人都公司都有能力训练自己的大模型,未来可能形成"AI能力强的公司控制核心大脑,硬件公司沦为代工厂"的格局。这对整个行业是好事还是坏事?现在说不准。
十、行动建议
说一千道一万,读者需要的是"我该怎么办"。
如果你想入局具身智能,现在开始学VLA模型和仿真环境开发,时间窗口还有1-2年。如果你已经在机器人行业,思考清楚自己的差异化优势在哪里——是数据、硬件、还是场景理解?不要试图什么都做,专注一个点做到极致。
如果你只是想关注这个赛道,别被媒体炒作带节奏。Figure 01的演示很酷,但它离真正改变生活还有很长的路。多看实际部署数据,少看PPT。
OpenAI重返机器人赛道,是一件值得关注的大事,但它能不能做成,现在下结论还太早。我们能确定的是:大模型+机器人这个方向,已经不可逆转地成为了行业共识。剩下的,就看谁能把这个方向变成现实了。