OpenAI重返机器人赛道：一场迟到的豪赌，还是蓄谋已久的王炸？

OpenAI又招人了，这次瞄准的是机器人。

2026年6月，量子位等多方消息证实，OpenAI正在为其神秘的机器人团队招募四大核心岗位：机器人控制算法工程师、机器人硬件设计师、具身智能研究员、仿真环境工程师。消息一出，圈内炸锅——那个在2020年悄悄解散机器人团队、随后又悄悄投资的OpenAI，终于决定亲自下场了。

有意思的是，就在几个月前，OpenAI刚被曝出正在开发人形机器人原型机，内部代号"Project Striker"。而现在大规模招聘，意味着这个项目已经从"试试看"升级为"认真做"。一个在软件领域呼风唤雨的公司，为什么突然对硬件产生了兴趣？大模型和机器人结合，到底是真风口还是资本故事？

我翻遍了公开资料，找到了几个关键信号。

一、事件/技术背景

OpenAI的机器人情节，其实比很多人想象的更久。

2019年，OpenAI曾短暂探索过机器人研究，尝试用强化学习训练机械手完成简单任务。但当时的大模型能力远不够用，数据采集成本高得离谱，项目在2020年被战略性搁置。核心团队成员要么转岗，要么直接跳槽去了竞争对手那里。

转折点出现在2024年2月。OpenAI突然宣布与Figure AI合作，推出了震惊业界的Figure 01——一个能与人对话、理解意图、并能完成复杂家务的人形机器人。视频里，人类说"我饿了"，机器人看了一眼桌上的苹果，直接递了过去，整个过程不到10秒。这段演示在社交媒体上疯传，让所有人第一次意识到：大模型真的可以让机器人"理解"人类了。

随后的故事变得更有意思。OpenAI一边对外宣称"我们不做硬件"，一边悄悄投资了Figure AI（投资金额据TechCrunch报道约为6.75亿美元）、1X Technologies（1.25亿美元）等多家机器人公司。这不是"不做硬件"，这是"先让别人趟路，自己看准了再上"。

2026年6月的大规模招聘，就是那个"看准了"的信号。四大岗位覆盖了从底层控制到上层智能的全链条：控制算法决定机器人怎么动，硬件设计决定机器人长什么样，具身智能研究决定机器人怎么"思考"，仿真环境则用来训练和测试——没有仿真环境，真实世界的训练成本高到没人用得起。

OpenAI这次是认真的。

二、核心技术原理解析

大模型+机器人，听起来高大上，原理其实没那么玄乎。

传统机器人靠的是"预设规则"：工程师写好代码，告诉机器人"如果遇到障碍物A，就绕到左边"。碰到没见过的场景？抱歉，它不知道怎么处理。OpenAI要做的，是让机器人像人一样"理解"任务，然后自己想办法完成。

这背后有两项关键技术。

第一是视觉-语言-动作模型（VLA）。你可以理解为GPT的多模态升级版——不仅能看图说话，还能"输出动作"。Figure 01用的就是这套架构：摄像头捕捉画面，大模型理解"这是什么、该做什么"，然后生成具体的动作指令，机器人执行。整个链条打通了，机器人才能真正"听话"。

第二是仿真训练+真机微调。在真实世界训练机器人成本极高——摔一个零件可能就几千美元，训练一个翻跟头的技能可能要摔几万次。所以业界通用的做法是先在仿真环境里练，差不多了再上真机验证。OpenAI招聘仿真环境工程师，就是要做自己的"数字孪生训练场"。

关键技术点清单：

VLA模型架构：将视觉理解、语言推理、动作生成统一到一个模型中，这是具身智能的核心突破点
小样本泛化能力：大模型让机器人能"零样本"处理未见过的物体，不需要逐个任务编程
实时推理延迟：当前VLA模型的端到端响应时间约为100-200毫秒（据Figure AI公开技术博客），仍有提升空间
仿真到真实的迁移（Sim2Real）：如何让仿真环境中学到的技能有效迁移到真实机器人上，这是行业公认的技术难点
触觉传感融合：除了视觉，触觉反馈对精细操作至关重要，当前主流方案包括GelSight等新型触觉传感器

有一点必须说清楚：技术原理讲起来容易，工程落地是另一回事。OpenAI的优势在于大模型能力储备，但硬件控制、机械设计这些领域，他们是真·门外汉。所以这次招聘，大概率会从波士顿动力、特斯拉Optimus这些团队挖人。

三、为什么这件事很重要

OpenAI做机器人，不只是一个公司的战略选择，而是可能重塑整个行业格局的事件。

先说为什么对OpenAI自己重要。ChatGPT的成功证明了大模型的价值，但天花板也很明显——它只是一个对话工具，没有办法直接影响物理世界。如果OpenAI想继续涨估值、扩大影响力，必须找到大模型的新出口。机器人是天然的载体：它让AI从"嘴炮"变成"行动"，从云端走向现实。

更重要的是，机器人可能是AGI（通用人工智能）的必经之路。OpenAI的终极目标是AGI，而真正的通用智能必须能理解物理世界、完成物理任务。OpenAI CEO Sam Altman曾多次在公开场合表示，具身智能是通往AGI的关键路径之一。这次招兵买马，不是临时起意，是战略布局。

对行业来说，OpenAI入局意味着什么？意味着更多资本、更强技术、更激烈的竞争。Figure AI、1X Technologies这些已经拿到OpenAI投资的"小弟"，会不会反而变成炮灰？特斯拉的Optimus、Figure AI自己的产品，会不会因为OpenAI亲自下场而面临更大压力？

还有一个被忽视的点：数据。大模型需要海量数据训练，而机器人领域的优质数据极度稀缺。OpenAI手握互联网数据，但机器人操作数据几乎是空白。如果他们能建立足够大的机器人数据飞轮——就像当年积累文本数据一样——后来者很难追赶。

这不是一场普通的竞争，这是一场关于"谁定义下一代人机交互"的战争。

四、行业冲击与数据支撑

具身智能赛道正在经历前所未有的资本热潮。

据Markets and Markets 2025年发布的报告，全球具身智能（Embodied AI）市场规模预计将从2024年的约31亿美元增长至2028年的138亿美元，复合年增长率超过45%。高盛则更为乐观，预测到2035年，仅人形机器人市场就有望达到380亿美元。

资本的嗅觉最灵敏。2024年全球机器人领域投资额据Crunchbase统计约为67亿美元，同比增长32%。其中具身智能相关公司的融资额占比从2022年的8%飙升至2024年的35%。Figure AI一家在2024年就拿到了超过7亿美元融资，估值一度达到26亿美元。

看几个关键数据：

Figure 01的演示视频在发布24小时内获得了超过500万次播放（据Figure AI官方推特），成为当年科技圈最热话题之一
1X Technologies的NEO Gamma机器人在挪威进行了超过2000小时的家庭环境测试（据1X官方博客），是目前落地最激进的人形机器人之一
特斯拉Optimus预计2026年量产，马斯克声称最终成本将降至2万美元以下，但分析师普遍认为2027年之前难以实现规模化交付
Boston Dynamics的Atlas电动版已经进入商业试点阶段，但其传统液压方案的高成本仍是规模化障碍

行业格局也在发生变化。2022年之前，机器人创业公司融资困难，资本更青睐软件和AI应用。但2024年开始，硬件+AI的组合突然变香了。原因很简单：大模型终于能"读懂"物理世界了，机器人的"大脑"问题解决了，剩下的就是身体问题。

身体问题，恰恰是硬件公司的强项。所以接下来几年，我们会看到越来越多"软件公司+硬件公司"的联姻，或者干脆是资本主导的并购整合。OpenAI选择自己建团队而不是继续投资，说明他们判断这个时间窗口已经成熟。

五、实际落地案例

案例一：Figure AI，从濒临倒闭到估值26亿美元

Figure AI成立于2022年，创始人Brett Adcock是个连续创业者，做过电动飞机，做过垂直起降飞行器，2022年ALL IN人形机器人。早期非常艰难——投资人觉得太烧钱、太科幻，团队差点发不出工资。

转机出现在2023年。Figure AI开始与大模型公司接触，尝试将视觉-语言模型接入机器人控制系统。2024年2月与OpenAI合作后推出的Figure 01，一夜之间让所有人记住了这家公司。Adcock后来在采访中说，那段演示视频其实只展示了机器人能力的10%，但已经足够让投资人疯狂。

数据说话：Figure AI在2024年完成了超过7亿美元融资，估值从2亿美元飙升至26亿美元。公司员工从2023年的40人扩张到2024年的300多人，还在加州建立了专门的机器人训练实验室。

目前Figure 01已经与BMW合作，在汽车制造流水线上进行测试性部署，主要承担零部件搬运、物料分拣等任务。据BMW官方新闻稿，首批试点运行超过6个月，任务成功率约为87%。

案例二：1X Technologies，家庭场景的激进派

与Figure AI定位工业场景不同，1X Technologies从一开始就把目标锁定在家庭场景。他们的旗舰产品NEO Gamma是一款身高1.65米、体重30公斤的人形机器人，主打家务助手定位。

1X的策略很有意思：先在真实家庭环境中大量部署，通过收集真实用户数据来迭代产品。他们在挪威与数百个家庭签订了测试协议，机器人每天在真实家庭中运行超过8小时。这种"农村包围城市"的打法，让1X积累了大量竞品无法获取的真实场景数据。

据1X官方数据（发布于2024年Q4），NEO Gamma在家庭环境中的任务完成率已经从最初的45%提升到72%。用户反馈显示，最受欢迎的功能是"整理房间"和"陪伴老人"，最不受欢迎的是"洗碗"——因为当前机械手在湿润环境下的抓取成功率仍然偏低。

OpenAI在2024年领投了1X的B轮融资（1.25亿美元），这被外界解读为OpenAI在家庭场景的提前布局。1X的CEO Bernt Bornich曾表示："OpenAI不只是在投资我们，他们派了技术团队常驻我们办公室，一起解决具身智能的核心问题。"

六、与竞品/替代方案对比

机器人赛道已经挤满了玩家，每个玩家的策略和优势都不太一样。下面这张表格从多个维度做一个横向对比：

方案/公司	核心优势	主要劣势	目标场景	融资规模	预计商业化时间
OpenAI	大模型能力全球领先，数据积累深厚	硬件经验几乎为零，需从零建团队	通用场景，待定	自有资金+投资	未知
Figure AI	与OpenAI深度绑定，VLA技术领先	商业化经验少，依赖外部产能	工业制造、物流	7.5亿美元+	2026年小批量
Tesla Optimus	供应链成本优势，自研FSD芯片可迁移	马斯克信用透支，量产时间多次跳票	汽车制造、家庭	内部预算，金额不公开	2026年（存疑）
1X Technologies	真实家庭场景数据积累丰富	机器人本体技术相对薄弱	家庭陪伴、养老	1.25亿美元	2025年已商业化
Boston Dynamics	20年+运动控制积累，机械性能最强	成本极高，AI能力相对落后	工业巡检、救援	现代集团控股	已商业化

从表格里能看出几个有意思的点。

Figure AI和OpenAI是绑定关系，如果OpenAI亲自下水，Figure AI的独立性会受到质疑。但反过来想，OpenAI可能更愿意继续扶持Figure，自己专注做AI大脑，而不是亲自做硬件。特斯拉Optimus的优势是制造能力和成本控制，但马斯克的承诺向来"跳票率"很高。1X的场景定位最清晰，但融资规模相对较小，扩张速度可能受限。

我的判断是：未来3年，这个赛道会经历一轮残酷洗牌。能活下来的，要么有独特的数据壁垒，要么有成熟的硬件供应链，要么有足够多的钱烧。OpenAI属于第三种，但光有钱不够——他们需要证明自己能做出"可用"的机器人，而不是又一篇论文。

七、技术挑战与局限

说了这么多好消息，也该泼点冷水了。

硬件瓶颈比想象中更严重。大模型负责"思考"，但机器人需要"动手"。当前的机械手在抓取不规则物体、柔软物品时，成功率仍然偏低。据多篇学术论文和行业报告数据，现有机械手在"从碗里夹起一颗葡萄"这类精细操作上的成功率约为60-70%，远未达到人类水平（95%+）。这不是算法问题，是材料科学和精密制造的差距。

Sim2Real鸿沟依然存在。仿真环境里训练好的技能，迁移到真实机器人上经常"水土不服"。光照变化、地面摩擦力差异、物体的重量和质地变化，都会导致性能大幅下降。Figure AI的工程师曾在博客中透露，他们花了6个月时间才让仿真训练的策略在真机上达到可接受的水平。

数据采集成本极高。机器人领域的优质数据极度稀缺，不像互联网文本可以低成本大规模获取。训练一个能处理100种家务任务的机器人，需要采集至少百万级的demonstration数据。据行业估算，一个高质量的机器人操作数据集的制作成本约为每分钟1000-5000美元。

安全性问题不可忽视。机器人在家庭环境中与人近距离接触，如果控制系统出现bug导致机械臂失控，后果可能很严重。当前行业缺乏统一的安全标准和认证体系，这是大规模落地的潜在障碍。

商业化路径不明晰。Figure 01的BMW试点听起来不错，但"试点"和"规模化"之间隔着十万八千里。机器人需要维护、需要配件、需要定制化开发，这些成本加起来，可能让ROI（投资回报率）变得很难看。

一句话总结：技术Demo和商业化之间，隔着一整个喜马拉雅山。

八、谁应该关注这件事

如果你属于以下几类人，这件事跟你有直接关系。

开发者：如果你正在学机器学习、强化学习，具身智能是下一个大方向。现在入局，学VLA模型、Sim2Real迁移、机器人仿真环境开发，都是有价值的技术栈。OpenAI的招聘要求可以当作学习路线图。

产品经理：机器人产品跟互联网产品完全不同——硬件有物理极限，用户期望更高，容错率更低。如果你对机器人产品有想法，现在是最好的时机，因为行业还没有形成固化格局。

投资人：具身智能赛道已经热起来了，但估值普遍偏高。Figure AI的26亿美元估值有没有泡沫？特斯拉Optimus到底能不能量产？这些问题需要深入研究。我的建议是关注有真实数据积累的公司，而不是只会讲故事的项目。

产业从业者：如果你是制造业、物流、医疗、养老行业的从业者，人形机器人可能很快就会影响你的工作。关注竞品动态，思考如何与机器人协作，而不是等着被替代。

创业者：如果你想做机器人整机，现在入场门槛已经很高。但如果做机器人领域的"卖水人"——比如数据采集工具、仿真平台、测试服务、定制化开发——机会还有很多。

九、未来趋势预判

我的几个判断，错了就当抛砖引玉，对了你来给我点赞。

第一，OpenAI不会自己做硬件整机。他们大概率会继续投资/控股一两家机器人公司，自己专注做AI大脑和数据集。这跟微软做Copilot而不是自己做PC是一个逻辑——OpenAI擅长的是软件，硬件是另一个世界。

第二，2026-2027年会有一波机器人公司倒闭潮。现在赛道太热了，估值虚高，资本寒冬一来，最先倒下的就是那些没有商业化能力的项目。能活下来的，是那些能讲清楚"谁会买、为什么买、买得起"的公司。

第三，家庭场景比工业场景更难落地。很多人觉得机器人会先取代工厂工人，但我的判断恰恰相反——工厂环境可控、任务标准化、ROI容易计算。家庭环境复杂、用户期望高、事故代价大。Figure AI先做工业场景是对的。

第四，2028年可能是一个关键节点。如果那时候具身智能技术还没有实质性突破，这波热潮可能会冷却一段时间。高盛预测的380亿美元市场需要技术持续进步才能兑现，现在还只是预测。

第五，OpenAI的加入会让竞争门槛大幅提高。不是每个机器人都公司都有能力训练自己的大模型，未来可能形成"AI能力强的公司控制核心大脑，硬件公司沦为代工厂"的格局。这对整个行业是好事还是坏事？现在说不准。

十、行动建议

说一千道一万，读者需要的是"我该怎么办"。

如果你想入局具身智能，现在开始学VLA模型和仿真环境开发，时间窗口还有1-2年。如果你已经在机器人行业，思考清楚自己的差异化优势在哪里——是数据、硬件、还是场景理解？不要试图什么都做，专注一个点做到极致。

如果你只是想关注这个赛道，别被媒体炒作带节奏。Figure 01的演示很酷，但它离真正改变生活还有很长的路。多看实际部署数据，少看PPT。

OpenAI重返机器人赛道，是一件值得关注的大事，但它能不能做成，现在下结论还太早。我们能确定的是：大模型+机器人这个方向，已经不可逆转地成为了行业共识。剩下的，就看谁能把这个方向变成现实了。

OpenAI重返机器人赛道：一场迟到的豪赌，还是蓄谋已久的王炸？

OpenAI重返机器人赛道：一场迟到的豪赌，还是蓄谋已久的王炸？

一、事件/技术背景

二、核心技术原理解析

三、为什么这件事很重要

四、行业冲击与数据支撑

五、实际落地案例

六、与竞品/替代方案对比

七、技术挑战与局限

八、谁应该关注这件事

九、未来趋势预判

十、行动建议

相关推荐

Apple联手Google：Gemini全面入驻iOS，AI生态格局生变

SpaceX的60页PPT凭什么值1.77万亿美元

Harness Engineering：让 AI Agent 从「能聊天」变成「能干活」的关键设计