原标题:马斯克开造人形AI 变形金刚要成真的节奏?
当5个人形机器人迎面走来,你会下意识地期待它们具备怎样的能力。最近公布的视频给出答案,它自研的机器人“擎天柱”(Optimus)能够探索环境,复刻人类动作,自主操纵物品。
CEO埃隆·马斯克对这些与《变形金刚》汽车人领袖同名的机器人充满期望,预测比电动汽车更有市场需求,未来会人手一个。
当前,工厂里“机械臂”已经稀松平常,餐厅、酒店的过道里跑着送餐机器人,家里还能安个扫地机器人,但这些结合具体场景的机器人,大多是给程式化运行的智能芯片和传感器装上了胳膊腿,显示屏“脑袋”也实在很不“人”。
特斯拉要造的是一体多能、可自主行动的人形机器人。虽然这个领域的传奇公司波士顿动力已经研发了运动能力强大的双足机器人,但它有两个致命硬伤:智商低、造价高。
能理解自然语言、与人类互动的ChatGPT们一定程度上弥补了机器人的智商缺陷。马斯克要着手解决的是造价问题。
特斯拉释放5个“擎天柱”
“狂人”埃隆·马斯克总是能提出各种令人不可思议的计划,并一步步让梦想照进现实。近期,马斯克又抛下一颗重磅炸弹,他要造出未来“每个人都要配备”的人形机器人。
5月16日的2023股东大会上,马斯克公布了该公司人形机器人的最新研发动向。公开视频里,5个人形机器人在的工厂中直立行走,它们能够探测周围环境,还能通过传感器实时复刻真人的动作,并且能够执行分拣物品等任务。
这些机器人有一个霸气的代号——“擎天柱”(Optimus),熟悉《变形金刚》的影迷一定对它印象深刻,擎天柱是汽车人领袖,带领着正义军团维护和平。
“擎天柱”这个名字倒是和造车企业的属性很搭,而他们打造机器人的方式也与造车异曲同工。根据官方数据,擎天柱躯干处搭载了2.3kWh、52V电池包,高度集成了充电管理、传感器和冷却系统。“从传感到融合、再到充电管理都汇集到这一系统内,这借鉴了我们在汽车设计方面的经验。”工程师表示。
这意味着,当电动汽车的智能化程度越来越高时,擎天柱也会进化。马斯克也说,已经试着打通电动汽车的辅助驾驶软件(FSD)系统和人形机器人的底层模块,形成“汽车人”组合。
对于造出高度智能的机器人,马斯克自豪地表示,大量的电动车已经能够观察并理解周围的世界,且能够根据采集到的信息进行决策。而利用在计算机视觉方面的技术进步,未来也能够对人形机器人进行进一步的部署。也就是说,擎天柱的“眼睛”也有谱了。
擎天柱并不是近期才开展的项目,早在2021年,马斯克在“特斯拉AI日”上发布了通用机器人计划。当时,他给出了一张概念图,展示了该机器人的基本形态。说来有趣,当时机器人还没有研发出来,但马斯克安排了工作人员穿上了特制的服装,扮成机器人的样子跳了段舞。
特斯拉2021年发布的机器人概念图
不得不说,马斯克的执行力惊人。一年后,初代“擎天柱”亮相了,它缓缓走出舞台,还和观众们挥手致意。
可别小看了这个简单的动作,有机器人研发工程师解释,开发性能优异的人形机器人时,一个很大的困难就是双脚直立行走。人类在行走时,为了保持平衡需要运用到视觉、内耳、小脑等多个器官进行感知与调节,让机器人通过技术模拟这个过程,实现起来是个大工程。
从特斯拉最新发布的视频来看,即便是现在,擎天柱们走路还是较为缓慢。视频下的一个高赞评论称,“它们走路的样子,就和我试图不拉裤子时差不多。”
人手一个?马斯克得把价格打下来
尽管“擎天柱”目前看起来还很笨拙,但马斯克对它抱有巨大期望。他表示,未来人形机器人的市场需求将达到100亿台,每个人都会拥有一个,比汽车更有市场。他还半开玩笑地宣布,特斯拉“大部分的长期价值”最终将来自“擎天柱”。
不管马斯克的预言能不能实现,但可以确定,人类对机器人的追求几乎贯穿了整个文明史。在古希腊神话时代,就有很多关于人造人的故事,比如工匠之神赫菲斯托斯曾经打造过黄金少女作为宫殿的侍女;文艺复兴巨匠达芬奇留下的手稿中,也曾找到一张有关仿人机器人的设计图。
在科技时代,人类更是一直在探索机器人的研发,希望有一个忠实的仆人减轻工作量。近年来,各式各样的工业机器人其实已经应用了,但人形的基本没有,它们大多以智能机械臂的样貌呈现,在工厂、物流等领域从事重复的单一动作。而在餐馆和酒店,也有一些送餐机器人,但它们更像是滑行的餐盘,并不具备自主端菜、上菜的能力,只能够在特定环境中移动。
相比生成式AI的快速发展,人类在打造软硬件结合、具备自主能力的人形机器人上一直进展缓慢。目前,仍然没有一个机器人能够像人类一样,具备可以完成打扫卫生、洗衣做饭等多项任务的能力。
目前,机器人在传感器的作用下已经可以做到感知环境。AI时代下,想要实现的是人形机器人能理解人类后自主行动,包括准确抓取物品。一旦智商在线了,机器人的能力将提升一大截,GPT等大模型很可能成为提升机器人智商感的主要方案。
在人形机器人领域,其实也是后来者,这个赛道的传奇是成立于1992年波士顿动力。
最初,波士顿动力为美国军方服务,生产了可在泥地、水中负重行走的四足机器人“大狗”,用以在地形复杂的环境中运送弹药、食物等其它补给品。后来,该公司又研发了双足仿真机器人,它的职能是为美军实验防护服装。
经历了数十年的研发积累,波士顿动力最终在2017年带来了巅峰之作,其研发的人形机器人Atlas在不同高度的箱子之间跳跃、旋转,并完成标准后空翻的视频在全网疯传。正是这个视频,让人们看到了机器人梦想落地的曙光。
近期,一位工程师又将ChatGPT 和波士顿动力公司的机器狗Spot结合起来,使得Spot能够和人类进行语音交流,还能通过点头和摇头来回应问题。
到了这一步,人形机器人的软件、硬件和智商,有史以来第一次接近齐备了。但要达成马斯克所说的“人手一个”,更大的挑战在于价格。
强如波士顿动力,也无法压低机器人的成本。
该公司的四足机器人Spot Mini定价约52万元,上线半年后仅售出了大约400台。人形机器人Atlas并没有被摆上货架,但业内预估其售价高达200万美元左右。由于持续研发投入但鲜有现金回流,波士顿动力命途多舛,在2013年被谷歌收购后,它又于2017年被变卖给软银。仅仅3年后,波士顿动力再次易手至现代汽车麾下,旗下机器人成为了现代汽车工厂的“打工仔”。
高昂的成本摆在眼前,马斯克要实现他的豪言壮语,必须大幅削减造价。他曾公开表示,“擎天柱”的售价要打到2万美元以下,用更低廉的技术解决方案,实现人形机器人产品标准化、低成本和可量产。
马斯克曾乐观预测,“擎天柱”3至5年间即可量产上市,但从它当前迟缓的步伐和动作来看,这些机器人现在还只能低效处理简单的任务。
不过,一旦核心技术被突破,上市不过是时间问题。要知道,的第一代运动型跑车Roadster的推出只用了5年;Model 3从公开到交付只花了1年。“狂人”马斯克从不让人失望。