对话浪潮信息：AI大模型“源”炼造客服大脑-对话|浪潮|信息|AI-鹿科技

　　原标题：对话浪潮信息：AI大模型“源”炼造客服大脑

　　2018年至今，NLP领域经历了非常大的变化，Transformer、ELMO、BERT、GPT-3，再到最近的ChatGPT（GPT 3.5的微调）的突破，NLP在预训练大模型的暴力拆解路上越走越远，这也让各行业开始相信：很多之前无法做到的场景、效果，现在可以有新的解法和落地。

　　智能客服，是NLP和深度学习技术落地的重要领域之一。客服可以基于提前设定好的规则，对用户意图进行判断并生成对应的固定话术。文本机器人、外呼机器人，可以替代掉原有重复性比较强的人工动作，逐渐转变为相对日常的落地场景。比如你日常所接听到的快递客服电话，订单咨询的对话框等等，背后都有来自客服机器人的驱动。

　　但在对客服要求比较高的企业级场景中，对多轮对话理解用户意图和知识专业度要求较高，现有的客服机器人仍有很高提升的空间。

　　一是系统整体搭建的维护成本比较高，效率比较低，因为大多数的企业级智能客服的知识库不是流程化的，而是技术知识库，需要人工/半自动的方式进行搭建。

　　二是业务场景复杂，专门知识门槛会更高，往往会涉及不同客户的应用场景，与业务流程相关的复杂场景。

　　三是持续突破比较难，边际效益递减明显，一般在良好技术知识库的支撑下，企业级智能客服的起步较快，但受制于方法论的影响，前期需要投入的大量人力、算力和数据，而到一定阶段则会陷入提升的瓶颈。

　　这样的问题也曾经困扰浪潮信息的客服系统研发人员。

　　近日，钛媒体App对话浪潮信息服务总监陈彬、浪潮信息AI软件研发总监吴韶华，围绕智能客服市场当前解决的难题，以AI大模型的实际落地应用为视角，进行深入交流。

　　具体来讲，浪潮信息以AI大模型“源”为智能引擎，和InService智能服务平台，搭建出了“智能客服大脑”。

　　据介绍，“智能客服大脑”学习了2万余份产品文档和用户手册的数据，并结合百万条浪潮信息专家工程师服务对话、数十万份日志、工单数据等算法训练，具备语言理解、数据分析、自主学习和智能推理等能力，支持自然语言交互服务、已授权IT设备的智能运维与诊断、以及备品备件等资源的智能管理和调度。

　　AI大模型在应用过程中必然会面临各个行业的应用落地。在此之前，浪潮AI大模型“源”已经在人机交互、知识检索、语言翻译、文学创作等领域有所应用。

　　以大模型作为基础能力，通过大模型的蒸馏实现相关的小模型，不仅实现的速度更快，智能化水平更高，从技术角度来讲，大模型在落地过程中呈现出了与以往模型非常不同的技术特征，也带来了更好的智能化水平。不论对大模型进行微调，还是引入领域知识库的方式，均是业界在探索的路径。

　　在浪潮信息AI软件研发总监吴韶华看来，“大模型想要在某个方向上训练得更好，智能化水平更高，确实需要在具体落地场景引入额外的领域知识，才能解决实际问题。AI大模型有其自身特点，训练时使用的数据集主要来自互联网，在通用知识和领域知识的分布上存在不均，会影响其在具体行业的应用。”

　　举个例子，在浪潮信息服务所面临的主要客户问题，包括咨询和故障报修两大类：前者如各类的产品服务政策、设备使用、以及复杂的技术咨询，如技术咨询方面其实比较常见的是如何做系统安装、Raid配置等，因为这个过程比较复杂，常出现各种问题；产品咨询包括购买产品的内存配置、保修时长等等；故障报修相对会比较有针对性、更多元，例如无法开机、硬盘故障、内存故障等等。

　　在浪潮信息的咨询客户中，有80%的用户为非专业工程师，智能客服需要在准确理解用户、精准定义问题的基础上，通过多轮回答解决技术问题，给予客户满意的答案。对于客户而言，如若智能客服所给予的答案过于标准和冗余，却无法快速帮客户解决具体问题，客服所给予的答案只可被定义为对的答案而不是好的答案。

　　实际上，浪潮信息从4、5年前就开始进行客服的数字化转型和探索，并且在2019年开始着手应用业内在探索的FAQ、任务式对话、知识图谱等NLP领域相关技术，对客服系统进行了一定程度的改造和提升。

　　但当时遇到的瓶颈也十分明显，主要在于两方面：“一是企业产品信息更新快，造成模型训练任务非常大，加之模型知识库的封闭，在训练效果上也受到制约；二是机器人需要对上下文结合语境进行语义理解，引导客户提问并且精准识别问题，在专业知识领域的IT行业，难度非常高。”浪潮信息服务与实施部总监陈彬指出。

　　除了在大模型的落地中引入领域知识外，浪潮智能客服在研发过程中还重点考虑了其他几点因素：

　　第一，客服系统是不是真正地理解客户，是否能够通过多次对话了解到客户真实的服务意图。企业级场景中，客户有个报修问题，但无法用专业的技术语言对服务场景进行准确描述时，就非常考验客服系统的理解能力。

　　第二，是否需要投入额外和高昂的人力成本让客服机器人具备自主学习、迭代的能力。让专业工程师做重复的模型训练工作，既不符合企业成本要求，也不符合企业建设专家型团队的长期规划。

　　第三，B端客户对企业的服务体验、服务口碑要求高，训练出的客服系统是否能够让更多的客户接受、信任并满意地使用。相较于传统的智能客服采用多模型、多数据库的架构，浪潮信息智能客服系统最终实现统一架构支持多任务解决问题。而此前完成一套客服动作，往往涉及FAQ、任务式知识图谱、知识检索等模块，需要在多个知识库、模型之间进行任务调度，架构复杂且维护难度比较大。

　　此外，由于在模型训练上实现了自进化、快进化学习，而不是原有需要人工或半人工搭建和训练模型的过程，在人工标注和训练成本上得到了极大降低。

　　从浪潮信息数据中心服务的成效来看，在应用智能客服系统后，客户问答的匹配率（即覆盖率）达到92%，对常见的复杂问题的解决率目前能达到80%以上，平均解决率是65%左右。此外，服务整体人员规模占浪潮信息总人员规模的4%，而业内一般都占比15%到20%左右，在整体人均效能上得到了一定提升。

　　“服务作为一个公司的重要窗口业务部门，也是和客户交互最紧密的平台。所以我们首先考虑的是怎么把实际业务和AI算法结合在一起。本身IT的服务场景非常复杂，且面对是更多大量的B类客户，我们当初也在讨论，是否真的需要花这么大的精力，把传统的服务场景，做AI的相关技术和算法的落地，在项目初期也是比较有争议的。”陈彬表示。

　　但从目前取得的成效来看，当初的投入是值得的。

　　结合钛媒体的观察，客服机器人的背后仍是复杂的AI技术栈作为支撑。涉及语音识别、语义理解和生成、人机交互等等，存在系统搭建成本较高。如AI的边际成本，模型训练中对人工标注数据的成本，加之企业多数存在二次开发的定制化要求，导致部署交付成本也难以避免。

　　企业对技术的投入和成熟与否直接决定了体验的高低，而如今浪潮AI大模型“源”在智能客服场景的实际落地应用，为业界提供了一种另一种可参考的解决方案。