人形机器人不是新事物,但它的热潮在两年前再次被唤起,随着特斯拉发布人形机器人 Optimus、以及 ChatGPT 的出现,整个行业爆发出巨大的想象力。技术上,它意味着人形机器人可以拥有真正智能的大脑,进化成有自主感知决策执行能力的智能体。而商业上,更智能的人形机器人可能会形成全新的生产力供给,为工业、家庭等场景带来万亿美元规模的产值。
特斯拉的 Optimus 最大的目标是服务特斯拉的汽车产线,这也是众多人形机器人公司在发力的方向。今年 3 月,人形机器人公司 Apptronik 与奔驰工厂合作;8 月,OpenAI 扶持的人形机器人公司 Figure 继续加深与宝马工厂合作。
而和前几次技术革命不同,中国企业在这一进程上并不落后。
在正在举行的 2024 世界机器人大会上,优必选发布了全球首个面向多任务工业场景的通用人形机器人解决方案,把人形机器人在工厂的实训成果直接搬到了现场,让观众现场观摩人形机器人在工厂执行质检、分拣和搬运的任务。
大会现场,优必选还与奥迪一汽和北京具身智能机器人创新中心签署合作协议,三方会共同研发人形机器人智能化解决方案,将人形机器人引入汽车产线的智能搬运、质量检查和过程材料操作等工位,推动人形机器人在汽车工厂的大规模应用。
北京具身智能机器人创新中心总经理熊友军、奥迪一汽工程技术部部长利贝克·托比亚斯、优必选首席品牌官谭旻分别代表三方签署合作协议
奥迪一汽也成为继吉利汽车、东风柳汽、一汽-大众青岛分公司、一汽红旗之后,又一家和优必选达成合作的车企。目前,优必选是全球范围内合作车企数量最多的人形机器人企业,而除了车企之外,与优必选达成合作的企业还包括了全球最大的精密电子制造商富士康,以及全球第四大的综合物流服务提供商顺丰。
在这套解决方案下,优必选先为人形机器人在工厂应用规划了搬运、质检、分拣、螺丝拧紧、零件安装、过程材料操作 6 大任务。目前,工业版人形机器人 Walker S 系列已经进入多家车厂实训,车企付一定费用,人形机器人会通过大约 12-24 个月的实训不断验证产品性能。
这意味着,中国人形机器人行业在走入市场验证(POC,Proof of Concept)阶段,虽然距离想象中人形机器人在工业场景的真正通用、以及商业化落地,还有一定距离。但优必选的选择似乎表明,在人形机器人相关技术还未成熟的今天,通过对客户需求和使用场景的了解和掌握,现有技术依然可以满足工业场景最细小的需求、形成最小的 TPF(技术产品匹配)。
虽然距离想象中人形机器人在工业场景的真正通用、以及商业化落地,还有一定距离。但优必选的选择似乎表明,在人形机器人相关技术还未成熟的今天,通过对客户需求和使用场景的了解和掌握,现有技术依然可以满足工业场景最细小的需求、形成最小的 TPF(技术产品匹配)。
谈及人形机器人星辰大海的未来,有人认为在实验室里研发一个通用具身大模型是关键。但优必选认为,尽可能地把人形机器人安排到真实应用场景里,先把一个垂直细分场景做好,再拓展到其它更多领域,这也许是打造一个通用人形机器人的最终答案。
01 车企需要人形机器人
如果说大模型是技术取得了突破之后、企业急着去找应用场景,那人形机器人则是在技术不断迭代的同时,市场的需求就已经很强烈。这也要求人形机器人企业需要真实地了解市场的真实需求,利用已有技术布局来针对真实需求进行功能研发。
事实上,优必选提出这个工业解决方案的起点,并不是它想落地人形机器人技术、于是找车企合作。恰恰相反,正是汽车企业有了强烈的需求,于是找到优必选看、问是否能为其工业场景提供人形机器人。
这背后反映了汽车行业对人形机器人强烈、真实的市场需求。
汽车制造分为冲压、焊接、涂装和总装四大工艺,其中前三个环节几乎 90% 以上都由传统自动化设备,如机械臂、协作臂或 AGV(自动导引车)等完成。但在总装环节,由于工艺相对非结构化、复杂,其自动化率只有 20% 左右、终究离不开人工,车企招工难、成本高。
比如非结构性的搬运场景,工人整天要搬十几斤重的箱子,不仅枯燥、而且对身体有损伤,岗位很难招人。又比如非结构性的涂料场景,工作环境有高辐射、高粉尘、甚至有害化学物品,招人同样困难。
「大家可能想象不到,一些领先的新能源汽车生产商即便有数十万甚至上百万的工人,但是依然长期处于不满工的状态。车厂工人的流动性实际上非常高。」优必选副总裁、研究院执行院长焦继超表示。
在这些场景中,能像「人」一样干活的人形机器人是急需的。传统的机械臂、简单机器人往往只能完成给定的、被规划好的任务。而人形机器人或具身智能的定义是,其可以自主决策、规划、执行,像人一样行动——而其技术成熟度越高,通用性、泛化性就越强,越能在不同场景、任务中切换,最终降低服务成本。
今年以来,焦继超带着研发团队走访了接近 20 家车企,并与车企研究院和产线的负责人进行了深度、持续的沟通。通过这些调研,他与团队梳理出了大家的一些共同需求,以及车企对于人形机器人的能力要求。
最终,优必选得出了车企对于人形机器人的几个基本能力要求,包括要有足够的自主能力、灵巧操作能力、稳定可靠性等。基于这些要求以及目前已有的技术边界,优必选最终选中了几项任务来开启人形机器人在车厂中的实训,包括第一阶段的搬运、质检、分拣,之后,他们还计划将实训任务拓展到螺丝拧紧、零件安装、过程材料操作等。
优必选人形机器人演示搬运动作|图片来源:优必选
尽管人形机器人领域的基础具身大模型(一般指 VLA 视觉语言动作模型,和基础语言大模型不同,它输出的是动作)尚未有根本的技术突破,但在焦继超看来,这并不十分重要。「在工业里面我不是一定要跑个底座大模型,你可以理解为训个小模型就可以实现了。」他说。
给人形机器人做训练,实际上就是让它在跟真实世界的交互中,提升它自主感知决策执行的能力。
目前,主流的训练路径分为两种,一是大模型加小模型,即大模型作为「大脑」负责多模态感知、理解、规划,而小模型作为「小脑」执行,包括步态和灵巧操作等,这一方式已超过部分通用大模型的表现。另一种方式是端到端,即通过海量的数据训练,让人形机器人看到数据就能输出执行,但这种训练方式更难捉摸。
人形机器人的训练路径 | 图片来源:优必选
优必选表示,目前在工业场景领域,主要还是采用大模型加小模型的技术路线,因为其训练效率更好。不过它也在做端到端的尝试,未来面向更通用的场景,端到端的路线也许会是更好的选择。
以搬运场景为例,大模型先感知环境,判断料箱的大小和重量、搬运点的位置等,接着进行路径规划,下命令给电机,要求调整相应的力度进行抓取,重的货物用大力、轻的货物用小力,最终实现搬运。
在这样的训练框架下,优必选让人形机器人在搬运、分拣、质检等任务上初步验证了可行性。过去,这种之前只能由人类完成的工作,现在都可以由人形机器人完成。
通过智能化的能力,人形机器人执行这些任务时还具有一定的通用性、泛化性。以拧螺丝为例,人形机器人在 A 公司学会了拧螺丝,而切换到 B 公司、螺丝的型号和尺寸发生变化,机器人适配的成本很低、可以做到迅速部署。
在焦继超看来,目前这个阶段的任务在于,通过人形机器人在多个真实应用场景中的数据反馈,不断进行产品的验证、优化,为之后实现人形机器人在工业场景的大规模商用打下基础,「到时候我们把人形机器人交给客户,它们可以直接拿它当工人用。」他说。
02 人形机器人不是一上来就通用,而是场景由点及面地通用
在工业场景的应用落地上,优必选确实觉得自己有一种「急迫感」。这倒主要不是出于商业化的考虑,作为一家成立了 12 年的人形机器人公司,优必选这些年已经探索出了一条成熟的自我供血路径——一条腿研发人形机器人,另一条腿则将相关技术「沿途下蛋」,它最重要的收入来源是 AI 教育、物流、康养等智能机器人服务。
在人形机器人这条腿上,现阶段更重要的意义在于通过在真实场景的落地实训,一是实现技术突破,保持技术领先性,二是争取在细分场景实现应用突破。
原因在于,目前制约人形机器人发展的核心要素是数据。大模型拥有海量的互联网数据,自动驾驶拥有海量的行车数据,但人形机器人的训练数据则少之又少、采集困难、成本也高。
现在尽管目前一些公司提出,可以通过虚拟的仿真数据训练,但这条路也并未形成共识。比如焦继超认为,单纯的仿真数据只是换了信息表达的方式、并不能准确描述物理世界。最终,还是要依靠真实物理世界的数据、并在此基础上形成仿真数据,真实数据的占比至少需要 80%。
考虑到场景的采集是海量的、而采集的成本又是极高的,最合适的方式就是选一个细分场景,既能从技术上收集数据做训练、又能同时商业化。那么目前能跑通的这些细分工业场景,就是不错的起步选择。
「谁掌握了场景,谁就掌握了数据。谁掌握了数据,谁就掌握了做出真正通用人形机器人的关键要素。」焦继超表示。在他看来,和大语言模型不同,机器人的大模型大概率不是一上来就通用,而是由点及面、慢慢实现通用。
谈及率先能够与多家车厂达成合作的原因,焦继超总结为三点:
一是技术积累。作为有 12 年历史的人形机器人公司,优必选在人形机器人全栈式技术,包括硬件、软件等方面都有更多积累。「实训一旦开始就是一两年时间,如果车企对人形机器人公司的技术没有足够的认识和认可,大概率会认为这家公司做不成他们想要的方案,最终不会达成合作。」焦继超表示。
二是对客户真实需求的认识。如果说很多初创公司仍需技术「秀肌肉」,优必选已经经历过了该阶段,更关注客户需求。毕竟在一个现实的工厂环境中,人形机器人最重要的能力是能不能干活。
三是稳定可靠性。早在 2021 年推出人形机器人 Walker X 时,优必选就将它用于大型展馆等场景,例如,在迪拜世博会中国馆,Walker X 和熊猫机器人优悠就稳定服务了六个月。在中国科学技术馆,Walker 也服务了超过两年。这种稳定服务的能力,对于车厂来说尤为重要。
从小到大、从垂直到通用,优必选将人形机器人的应用场景扩张分为三步:
一、今年底,从新能源汽车厂切入,在搬运和分拣等任务进行测试,持续稳定性和可靠性,并实现小批量交付;
二、明年起,从车厂逐步扩展到更多的场景,并推动人形机器人完成中等难度任务,提升产品性能,逐步实现规模商业化;
三、从 2028 年起,进一步拓展更复杂的任务场景,成为多任务通用性工业人形机器人。
人社部、工信部、教育部联合发布的《制造业人工发展规划指南》中给出的预测数据显示,到 2025 年,中国制造业工业缺口将接近 3000 万人,这也会是人形机器人的一个巨大的潜在市场。优必选就表示,目前已收到来自车厂的 500 台人形机器人意向订单。他们认为,随着人形机器人等技术的引入,工业场景会形成「721」的格局:70% 是传统机械臂、20% 是人形机器人、10% 是人工。这 500 台走入工厂的「钢铁实习生」,正是人形机器人成为那「20%」的第一步。
那时,制造业的用工短缺将不再是问题、成本也会进一步降低,我国先进制造的竞争优势也将继续保持。而当工业场景实现突破之后,人形机器人将向家庭场景进发,这是所有公司的最终目标。
一位人形机器人创业者感慨道,从来没有碰到过这样一个时刻,国家的需求、市场的需求、技术的可行性,这三件事完美地聚焦在了当下这个时间窗口,因此预示了一个庞大市场的到来。这也许正是优必选等人形机器人公司,如此积极地投入、力图抢占先机的原因。
*头图来源:优必选
本文为极客公园原创文章,转载请联系极客君微信 geekparkGO