原标题:200亿新风口突然爆火 “AI 智能体硬件”概念是否在形成泡沫?
2022年ChatGPT爆发至今,生成式AI已经从模型走向应用,因此,基于生成式AI软件的智能体硬件正逐步成为新风口。
估值2680亿美元(约1.9万亿元人民币)的字节跳动豆包近日发布首款AI智能体耳机Ola Friend,采用开放式设计,无需打开手机,便能通过语音唤起豆包进行对话,能够在信息查询、旅游出行、英语学习及情感交流等场景为用户提供帮助。这是字节跳动首款基于豆包大模型的AI硬件耳机设备产品,同时也是字节跳动旗下首款生成式AI硬件设备。豆包相关负责人表示,这款耳机是豆包在AI场景的一个探索和尝试。
与此同时,另一家芯片大厂联发科技也于日前发布天玑9400,采用台积电第二代3nm工艺打造。这是全球首款旗舰5G智能体AI芯片,也是今年国内首个大幅提升智能手机AI能力的旗舰芯片。
更早之前,前苹果首席设计师Jony Ive证实,OpenAI CEO奥尔特曼(Sam Altman)正在与其建立公司计划推出一款AI硬件。奥尔特曼称,AI杀手级应用应该是一个超级能干的同事,“它绝对了解我一生的一切,包括我的每封电子邮件、每一次对话,此外,它还能立即解决一些复杂任务”。
从耳机设备到芯片,从AI PC到AI手机,基于在传统硬件基础上融入AI应用能力,“智能体”似乎成为生成式AI硬件新载体。
据华经研究数据显示,全球自主智能体市场规模从2019年的3.45亿美元增长至2024年的29.29亿美元(约合207.61亿元人民币),超过200亿元,期间年复合增长率达54%,未来仍会出现大量Agent(智能体)产品。
传统硬件寻路,AI智能体成新风口
不久前,OpenAI列出实现通用人工智能的五级路线图:L1是聊天机器人;L2是推理者,即像人类一样能够解决问题的AI;L3是智能体,即不仅能思考,还可采取行动的AI系统;L4是创新者;L5是组织者。
究竟什么是AI智能体?“通俗来讲,AI智能体就像一个有智商、有情商、能理解、会帮忙的‘小助手’。”北京通用人工智能研究院先进技术中心副主任陈浩表示。
对于科技和消费行业而言,AI无疑是近两年来的重中之重。根据IDC统计,中国生成式AI产业生态主要包括基础设施层、算法模型层、平台层、场景应用层、服务层,面向业务、行业搭建各种生成式AI解决方案和生态。在这其中,芯片、手机、电脑等传统硬件设备都会受益于生成式AI技术变革。
以智能手机为例。
据IDC今年7月发布的最新预测,智能手机行业未来将发生改变,报告预计2024年全球生成式AI手机出货量将同比增长363.6%,达2.342亿部,出货总量占2024年整个智能手机市场的19%。展望2028年,IDC预计生成式AI手机出货量将达到9.12亿部,期间年复合年增长率(CAGR)78.4%。
早前某家上市公司的私下交流中,多位AI硬件负责人对钛媒体App表示,就现在来看,机器人似乎是生成式AI技术的一个“载体”,但制造和采购成本很高。因此,在成本有限下,如何利用硬件把生成式AI技术变得“好玩和有用”正成为行业新课题。
实际上,基于AI智能体“软件助手”形态,耳机成为生成式AI软件技术的重要落脚点之一。
今年10月10日,字节跳动豆包发布首款AI智能体耳机Ola Friend,采用开放式设计,单耳6.6克同类最轻,耳机接入豆包大模型,并与豆包APP深度结合。用户佩戴Ola Friend后,只需直接触摸耳机或者说出唤醒词“豆包豆包”,就能够通过语音,调用手机上的豆包App进行交流,在接入豆包后耳机拥有了通用智能,可以在旅游、英语学习、聊天等场景中进行体验,该设备10月17日开卖,售价1199元。
豆包相关负责人表示,这款耳机是豆包在AI场景的一个探索和尝试,希望Ola Friend能成为随时陪伴用户耳边的朋友。豆包的各种能力也会在后续持续迭代,为用户在生活中各个场景提供帮助。
Ola Friend耳机的硬件部分由字节跳动不久前收购的原Oladance团队完成,Oladance成立于2019年,由前BOSE高管李浩乾与多名BOSE工程师共同创立,该团队是最早提出OWS(Open Wearable Stereo)专利技术的专业耳机厂商,主打全开放式OWS耳机。今年9月前后,字节跳动证实收购开放式耳机品牌Oladance,完成100%控股。本次交易中,黑蚁资本和蓝驰创投等原股东已全部退出。据晨哨并购,此次并购交易总额在3亿-5亿元。
“我们将这款耳机命名为Ola Friend,是对新朋友的一种问候,也是希望用户能够像与真正的朋友交流一样与AI进行互动。我们希望AI能够突破传统的设备和场景限制,进一步探索更多空间的可能性,为用户带来全新的体验。”豆包相关负责人表示。
不止是字节豆包。未来智能也是一家智能消费终端厂商,其研发的科大讯飞AI会议耳机可实现智能翻译、文字生成等多个AI功能。
未来智能CTO王松对钛媒体App等表示,“大厂下场的原因还是在抢占未来的入口,现在的入口是手机,未来可能是耳机,可能是其它穿戴式设备。大厂的进入一定会带热这个(AI耳机)赛道,当下这个赛道还没有到寡头垄断的时候,未来很长一段时间也不会。”
数据显示,线上销售方面,2024年截至10月15日零点,讯飞AI会议耳机在京东平台的AI耳机全品类中稳居销售榜首;线下销售方面,销售门店超过1000家,激活量为同期2.5倍。自2022年5月iFLYBUDS Pro发布至今,讯飞会议耳机的月活跃用户增长911%,用户留存率也提升至76%,未来智能产品已在全球154个国家有使用记录。
谈及“把大模型塞进耳机里”话题时,王松表示,目前AI耳机的主要难点还是在于耳机的算力和电池续航,耳机现在的算力从主频上看大约相当于25年前的奔腾3系列PC处理器,主频大约在200-300Mhz,虽然不能只看主频,但可以想象的出来性能有多孱弱。现在的主流手机也只能跑一些参数量比较少的大模型,所以想直接在耳机上运行大模型还是需要比较长的时间,当然大模型本身的运行效率也在提升,需要的算力越来越少。
“两者双向结合可能也要至少5年的时间才有可能看到耳机上直接运行大模型。”王松认为,OTA是AI耳机带来的重要方案。硬件产品本身是存在硬迭代周期的,以耳机为例,至少要6-9个月才能完成一款新品的研发,同样AI也在快速的迭代,但是软件迭代的周期就没有硬件那么固定,所以一款硬件在生命周期内如果能持续提供给用户更有价值的功能,能够匹配到相应的AI和软件能力,那么就会持续提供OTA更新。
王松强调,现在的“AI耳机”大部分都是依赖手机的AI,还没到真正的AI耳机时代。至少要具备独立运算和网络能力,有耳机本地的操作系统,那样才能称为真正的AI耳机。
上市公司洛图科技最新发布的报告显示,2024年8月,AI耳机对比去年同期销量增长763.3%,销额增长1447.2%。自今年5月以来,国内AI耳机产品均价一直稳定在千元以上,月度销售金额也迈上了2000万元的新台阶。2024年全年,国内AI耳机的电商市场销量有望突破20万副,同比增长预计可达488.7%。
此外,芯片也是AI技术的重要应用领域。
联发科方面表示,基于NPU(神经网络处理器),天玑9400集成第八代AI处理器NPU 890,其端侧多模态AI运算性能高达50 Tokens/s。与前代相比,在大模型提示词处理性能中实现80%的提升,文生图Stable Diffusion的执行性能提升了2倍,AI模型文本长度提升达8倍,但功耗同比下降35%。
“在联发科的第八代NPU上,我们将这个硬件算子的指令集,将这种训练的指令集融入到硬件能够支持的加速指令上,使得我们可以实现端侧快速、低功耗和高性能的生成。”联发科高管表示。
IDC中国高级分析师杨雯在报告中表示,生成式AI正高速渗透进人们的日常生活,从生活到工作,其影响力无处不在,生成式AI在消费端市场(C端)的影响力正迅速扩大,已经开始重塑消费者体验,企业需要抓住这一技术浪潮带来的机遇。
生成式AI热潮是否在形成泡沫?
10月14日晚,2024年度诺贝尔经济学奖颁给三位学者:麻省理工学院(MIT)教授达龙·阿西莫格鲁(Daron Acemoglu)、MIT教授西蒙·约翰逊(Simon Johnson)、芝加哥大学教授詹姆斯·A·罗宾逊(James A.Robinson)3人共同获得这一奖项,以表彰“对制度如何形成以及如何影响繁荣的研究”。
其中,阿西莫格鲁是反对AI快速发展的重要学者。他认为,目前AI发展已误入歧途,许多算法的设计是尽可能地取代人类,但技术上取得进步的方式是让机器对人类有用,而不是取代人类。
阿西莫格鲁曾指出,未来AI进步带来的生产力提升可能并不大,预估今后十年AI对全要素生产率(TFP)的增长上限不超过0.66%。
不过早前,诺贝尔物理学奖、化学奖颁给了共五位AI学者,市场认为AI正在成为一种“泡沫”,本被质疑“泡沫破灭”的AI未来可能会持续引爆资本热潮。
据Gartner技术周期显示,AI已经度过了过度预期的高峰,将进入幻灭的低谷。报告预测,到2025年,30%的当前AI项目将在概念验证后被放弃,同时,许多AI项目将由于数据质量差、风险控制不足、商业价值不明确或成本不断上升而失败。
Gartner指出,实施生成式AI项目可能耗资数百万美元,并产生巨大的持续成本。例如,推出新一代AI虚拟助手的成本可能为500万-650万美元,每位用户每年的经常性预算支出为8000至11000美元。
IBM watsonx.ai产品管理总监Maryam Ashoori认为,Gartner对失败的新一轮AI预测与IBM预测一致。她指出,三分之一的公司在试点阶段后放弃了AI用例,但这意味着另外两家公司看到了足够的希望,可以继续实施下去。
“有很多很酷的AI解决方案比生成式AI更便宜。当我们与客户进行规划会议时,他们需要的三分之二的解决方案不一定适合生成式AI模型,有的已经是与AI无关的解决方案。”IT咨询公司Alliantgroup公司总经理Chris Stephenson强调,“从早期开始,人们的期望就被过高地夸大了,而且这种期望一直持续,我认为这将是一个相当深的幻灭低谷。上涨必然会下降。”