原标题:制造业AI也迎来大模型时刻?大模型的落地存在哪些难题?
在通用领域,以ChatGPT为代表的预训练大模型,正在被大众所熟知。业内也在频繁示意:大模型在企业级或更多行业细分场景中,能不能短时间内带来巨大的生产力改变。
钛媒体注意到,目前在工业制造领域,大模型主要应用的场景可大致分成两大类:一类是产线运营效率环节,如产品设计研发、质量控制检测、供应链管理、安全生产等;另一类则是企业内部的信息智能,如人机交互。
在工业制造领域,大模型的落地存在哪些难题?目前普遍一个共识是,参数越高、模型越大,模型的泛化能力就越强,但在训练这样一个大模型的初期算力成本非常之高,同时,能不能将Prompt用好,也直接决定了微调后的模型在特定任务上的性能和准确性。
最近一段时间,创新奇智也计划构建面向制造领域的预训练大模型,挑战与市场空间皆有。钛媒体走进创新奇智,对外界所关心的大模型产业落地问题,以及企业在过去一年的业绩情况进行了交流。
深入行业的大模型布局
以AI质检为例,据钛媒体观察,其落地主要存在以下难点:
一是缺陷样本不足的问题。现场的传感器和采集设备往往受到环境和设备等因素的干扰,导致数据采集不稳定、噪声干扰等问题。同时,每家制造企业的设备型号、状态都不一样,可获取的数据标准不统一,数据质量也比较差。
二是在模型优化及迭代的困难。工业生产过程中存在各类复杂多样的产品和生产线,不同产品及生产线的质检标准和要求不同,因此需要建立相应的质检数据库和模型库,针对不同的产品和生产线开发不同的质检方法和算法,模型量是巨大且碎片化的。
在此之前,小样本学习的解决方案在工业界普遍尝试,创新奇智提出基于双注意力机制的少样本学习和基于原型的分类器学习方法,并且还通过技术创新,扩充数据弥补工业视觉中训练样本不足的问题。
2022年底,伴随ChatGPT走热,创新奇智也看到背后AIGC在工业场景中的应用空间,如交互式动态业务报表生成、智能产线设计等。但以ChatGPT和LLM为代表的泛场景大模型,不能有效的解决行业中大客户对大模型的专属需求。
“ChatGPT大模型训练时使用的数据是公开的互联网数据,大模型内部并不含有行业的或某大客户内部业务数据知识,而行业大客户一般不愿意把数据公开给外部技术服务商。”,而且,“现在市面上也没有现成可用、适用的通用大模型。”创新奇智CTO张发恩表示。
为此,创新奇智着手研发AIGC产品AInnoGC(奇智孔明),其核心是正在训练的工业预训练基础大模型,预计参数规模在百亿级别。
据介绍,AInnoGC产品目前具备以下五个核心能力:
支持Zero/Few-Shot In-Context Learning,支持客户私有化部署;
企业级Fine Tune机制,通过无缝对接、高效处理企业自有数据并进行高性能微调计算,为企业客户量身打造具备私域知识的专有大模型;
企业级Prompt工程支持,通过提示扩展、提示增强、结果融合等技术手段,协助客户获得更好的生成效果,同时实现反馈闭环,促进大模型迭代、优化;
提供丰富的API/SDK以及Model as a Service(MaaS)服务,充分释放大模型算法和工程化能力,加速生成式AI应用开发进程;
具备多模态,支持工业缺陷样本生成、交互式报表生成、交互式故障诊断、产线设计生成等文本/视觉/多模态内容生成,驱动AI 2.0应用和解决方案的开发与落地。
谈及训练大模型可能存在的高研发投入,张发恩解释称,虽然训练一个GPT大模型消耗了大量算力,但达到同样训练精度,需要的算力其实是在快速地下降,可能算力只需要原来的几十分之一,可以理解成第一次交付周期和成本会比较高,后面实现批量化后逐渐下降,“在工业预训练大模型这件事情上,不会搞军备赛,务实就好。”
读财报:毛利率提升至32.6%,平均客单价 1903万元
但是,大模型只是个引子,在AI技术浪潮尚未席卷产业之前,创新奇智依然面临AI公司存在的常见商业难题:产品通用性,怎么拓展更多场景,在AI领域毛利较低。
2022年1月,创新奇智在港上市,根据其不久前公布的截至2022年12月31日止的年度业绩,可以梳理出几个关键信息:
2022年总收入达15.58亿元,同比增长80.9%。从2018年到2022年,总收入复合年增长率达154.4%。
扣除股份支付及上市开支等项目后的经调整净亏损为1.38亿元;经调整净亏损率为8.9%,较2021年度降低7.6个百分点。
毛利方面,整体毛利润实现5.07亿元,同比增长89.7%;整体毛利率实现32.6%,较2021年度提升1.6个百分点。财报指出毛利实现增长的几点原因:1、产品的标准化提升及交付周期成本减少;2、规模化带来采购的降低;3、头部客户到腰部客户的发展。
从业务成分上看,「AI+制造」业务板块收入达9.48亿元,同比增长111.2%,营收占比60.9%;其次是「AI+金融」业务板块收入达3.82亿元,同比增长39.5%。
创新奇智CEO徐辉在媒体交流会上表示,“创新奇智不会做系统集成商,希望深耕行业,也不会完全依赖于一两个场景,期望到2025年覆盖到16个细分领域,其中13-15个都集中在制造业,金融行业不会放弃。”目前,创新奇智的客户领域覆盖了钢铁冶金、面板半导体、汽车装备、能源电力、食品饮料&新材料、智造实训、金融等。
客户数量上,从上一年的159家增长至2022年的292家。公司将一个财政年度内收入贡献超过450万元以上的客户定义为白金客户,2022年白金客户71家,共计贡献13.51亿元收入。另外,平均客单价增长至1903万元,最大客户的客单价占比不超过10%,这种做法避免单一客户的风险。
过去一年,创新奇智还新收购两家子公司进而拓宽业务领域,旗下经营奥利普奇智、赛迪奇智、浩亚智能、慧眼奇智等子公司。
AI+制造的硬实力
结合上述公布的数据信息,能够发现,在制造业场景的AI能力的可标准化落地,是创新奇智毛利率和客单价得以提升的重要原因。
产品层面,除了正在研发的AInnoGC之外,创新奇智还构建了MMOC人工智能技术平台——ManuVision机器视觉智能平台、MatrixVision边缘视频智能平台、Orion分布式机器学习平台、Cloud云平台,已经实现云边端一体化AI交付。平台内置了产品缺陷质量检测、生产现场安全管理、智能生产计划、智能化运维等垂类场景算法模型和功能模块。
为了提升行业壁垒,创新奇智实现了1+N扩展和1*N复制的商业路径:1+N扩展,从某一具体应用场景切入,通过首个项目标杆,鼓励客户用AI解决更多场景问题;1*N复制,则是从某个灯塔客户案例,复制到同领域的更多客户,实现AI产品及解决方案的网络效应。
此外,创新奇智还计划在一些客户场景联合探讨应用落地。例如,智慧铁水运输系统方案已在多个钢铁厂得以应用,智能液晶半导体生产方案也被多家客户采用。
不过,从同一时期的百度、阿里等科技大厂,到商汤、旷视等独立AI公司,它们先后宣告投入大模型,也在逐渐折射出一个现状:并不是所有企业都适合投入基础大模型,无论是多模态还是深入行业,大模型背后的核心商业化问题依然无法忽略。