北 京 通 信 学 会

    010-66499190

基于人工智能驱动的客服场景智能化应用的研究与探索


基于人工智能驱动的客服场景智能化应用的研究与探索


高洁程新洲宋春涛,成晨,高伟

中国联通研究院


一、概述


随着网络技术的发展,中国联通的网络能力能够基本满足用户对业务的使用需求,但是在客户服务方面,特别是处理网络类投诉的生产流程中,仍然面临着无法快速定位网络问题、生产效率偏低、智能化工具手段不足等痛点问题。


以ChatGPT为代表的新一轮人工智能通用型、基础型大语言模型的“走红”,大模型技术已经成为各行各业关注的焦点。但是,目前的通用大模型技术与通信运营商生产场景之间仍然存在着知识不通用、领域不匹配、语言不兼容等问题,当前缺少通信领域的专业型知识库、以及具备专家能力的通用大模型和场景小模型。


在此行业发展和需求的背景下,联通研究院网络智能运营研究中心以O域数据自主解析能力的沉淀为基础,聚焦客户服务生产经营环节,深入一线开展穿透调研,以网络类投诉处理为切入点,重点梳理从一线客服到网络运营工作的诉前、诉中、诉后等环节中的痛点和堵点问题,率先将行业热点的大语言模型技术与中国联通网络运营相结合,以AI大语言模型、知识图谱、NLP、大数据等技术手段,自主研发了一套基于AI的客服智能化工具产品集,包括全栈信创的实时湖仓一体融合数据底座、“知策应答”工具及插件、移网投诉分析支撑系统等,支撑并赋能网络运营、客户服务等场景,提供数字化、智能化的工具手段,提升中国联通在网络运营以及客户服务管理的新范式。


二、研究背景


用户投诉是客户感知的重要表征,也是高品质服务提升的主要抓手之一。但当前投诉内容的价值挖掘和发挥不够,投诉解决手段、效率和智能化程度也不足,亟待提升投诉分析和挖掘的前后端数字化赋能水平。

基于中国联通省投及客服大区生产一线调研,研究团队的研究目标是充分挖掘客户服务全链条中的典型痛点,通过梳理各环节耗时、低效的典型业务场景,重点聚焦诉中处理环节,率先将行业热点的大语言模型技术与中国联通网络运营、客户服务场景相结合。以大语言模型、知识图谱、NLP、大数据等技术手段,对在/热线语料进行意图识别,并关联后续的处理流程、策略及解决方案,并利用AI算法构建策略的智能匹配模型,实现面向典型场景客户问题的智能化策略匹配。同时,对当前网络类、业务类知识库进行语料化处理,面向用户意图及诉求,结合坐席常用应答方式,构建智能应答推荐模型,形成问题及解决建议的摘要性描述,为坐席推荐辅助的带有解决建议的推荐性应答。


基于以上的痛点和诉求,研究团队主要研究内容及结构如图1


图1 主要研究内容及框架


目前,项目团队自主研发了一套客服智能化工具产品集,重点解决省分网络运营及客服大区一线在诉中等生产环节中的对智能化工具手段的迫切需求,致力于提升网络运营及服务效能,改善服务指标,形成“近悦远来”的服务口碑。具体包括以下3项客服智能化工具及平台:


(1)全栈信创的湖仓一体融合数据底座

(2)AI大模型“知策应答”工具及插件

(3)基于AI及大数据的移网投诉分析支撑系统


以下为三项研究成果的具体展开。


三、支持信创的实时湖仓一体数据底座


当前,客户对网络服务、客服服务的诉求和要求与日俱增,网络运营商对于数字化、智能化工具平台的实时响应需要愈发迫切;同时运营商的数据涉及用户隐私、数据安全、技术自主可控,亟需打造一套支持信创的全栈解决方案。为满足大体量数据和高实时场景化的综合需求,坚持自主可控目标,本项目团队攻关打造面向网络运营场景的湖仓一体信创全栈解决方案。


本方案构建了兼容国产化设备接口的全实时Omega架构,其中包含流数据处理系统和实时数仓两部分构成。技术架构中,融合了Lambda架构和Kappa架构处理流数据的技术优势,增加了实时按需和离线按需的智能数据处理能力,以及高效处理可变更数据实时快照的能力。整体交互方案如图2


图2 全栈信创的湖仓一体融合数据能力底座


该解决方案具备以下技术优势:


技术优势

技术内容

支持多类型数据

实现支持与国产化通信设备厂家、国产化网管厂家的数据接口兼容性

兼容云原生部署

适配中国联通的一点式集中采集,自由增减计算和存储资源,弹性扩容,节约成本

支持超高并发能力

支持数万级用户使用复杂分析查询并发访问同一份数据

支持实时T+0响应能力

通过全量数据 T+0 的流处理和实时按需查询,满足基于数据的事前预测、事中判断和事后分析

支持一份数据实现管理

所有用户(BI 用户、数据科学家等)可以共享同一份数据,避免数据孤岛

支持数据一致性管理

通过完善的事务机制,保障不同用户同时查询和更新同一份数据时的一致性


结合各生产应用场景构建流式离线混合架构的实时数据仓库,主要分为以下四层,数据从左到右依次流动参见图3


图3 实时融合数据仓库技术架构图


1数据获取层:数据来源约为三类流式数据、数据库、文件,流式数据,来源可以来自消息队列、Socket、WebSocket,如基站告警数据;数据库,例如地理场景数据一般存放于PGSQL;文件数据,目前为数据量最大的来源,包括已解析数据如CM数据,未解析数据Trace数据、MR数据等。


2数据集成层:数据集成层主要包含两大类工具,一类是流处理工具,本方案针对数据使用Apache Flink的CDC(Change Data Capture)动态获取增量数据;一类是ETL工具,本案例采用ETL具备路径实时扫描的功能,对于新增文件动态捕获。区别于传统ETL即为数据集成层,该层皆使用类事件驱动机制,加速数据流动及传输,提高数据仓库整体实时性。


3数据仓库:数据分层业务逻辑层次,分为原始数据层(ODS)、数据明细层(DWD)、数据中间层(DWM)、数据服务层(DWS)、维度层(DIM)以及数据应用层(ADS层)。该层次为核心能力,特别说明,层次划分同时适用于离线数据和实时数据,并且实时数据都将会落盘至离线数据。


4数据分析层:数据分析层主要包括若干各OLAP工具用于分析人员进行数据分析,将结果写入数据应用层。本方案构建了兼容国产化设备接口的全实时Omega架构,其中包含流数据处理系统和实时数仓两部分构成。技术架构中,融合了Lambda架构和Kappa架构处理流数据的技术优势,增加了实时按需和离线按需的智能数据处理能力,以及高效处理可变更数据实时快照的能力。


图4 TPCH测试性能对比图


通过行业通用的TPCH性能测试方案对比,本方案实现计算和存储资源自由调度,支持秒级在线动态扩容,性能为Greenplum的8倍以上参见图4


四、基于大模型技术的“知策应答”工具及插件


基于对客服大区生产一线调研,本产品的研究目标是充分挖掘客户服务全链条中的典型痛点,通过梳理各环节耗时、低效的典型业务场景,重点聚焦诉中处理环节,率先将行业热点的大语言模型技术与中国联通网络运营、客户服务场景相结合。从而降低坐席知识及技能要求,提升坐席的工作效率,提升在线办结率、提升工单建单质量,实现效能提升及数智化赋能。


通过对客服一线的调研,当前客服代表主要工作包括用户对话、信息获取、来话问题总结、策略及知识应答、建单派单等。基于此背景需求,本产品的研究目标是以AI大语言模型为技术基础,以减少坐席操作环节,降低操作时长、提高客服知识性信息辅助为目标,开展基于对话上下文的用户意图识别及问题总结,优秀案例提取策略及解决方案,客服应答知识精准匹配,应答内容推荐及自动生成辅助等研究,并自主研发了“知策应答”工具。


“知策应答”工具主要解决语义理解准确率低、意图识别不精准、问题分类分拣准确度及效率低,应答环节精准匹配的解决策略少等问题。基于在/热线对话语料及工单全流程处理数据,构建意图识别模型及问题分类模型,抽取优秀坐席对话中的话术、方法、策略及知识并形成策略图谱,构建智能匹配模型,为坐席提供意图参考、问题分类参考及解决策略参考。面向建单场景的意图打标,初步完成识别模型,并持续收集在线对话语料,训练意图识别模型并调优,提取优秀坐席会话数据并沉淀其典型对话方法及解决方案,与策略图谱、知识库任务对接。

“知策应答”工具主要解决语义理解准确率低、意图识别不精准、问题分类分拣准确度及效率低,应答环节精准匹配的解决策略少等问题。基于在/热线对话语料及工单全流程处理数据,构建意图识别模型及问题分类模型,抽取优秀坐席对话中的话术、方法、策略及知识并形成策略图谱,构建智能匹配模型,为坐席提供意图参考、问题分类参考及解决策略参考。面向建单场景的意图打标,初步完成识别模型,并持续收集在线对话语料,训练意图识别模型并调优,提取优秀坐席会话数据并沉淀其典型对话方法及解决方案,与策略图谱、知识库任务对接。


“知策应答”工具基于主流NLP及LLM模型,实现投诉用户的实时意图识别、情感分析,并根据用户的基础属性、用户等级等信息,实现智能化应答生成、最优策略推荐等,提升在线客服人员的工作效能。目前,“知策应答”工具已实现3600余篇、2.4万余条知识的推理查询能力


五、基于AI及大数据的移网投诉分析支撑系统


本产品从一线在处理网络类用户投诉时数字化、智能化工具手段不足等痛点问题出发,基于对O域数据自主解析能力,将用户投诉数据与实时网络信令数据、用户属性信息进行关联分析,形成从属性、行为、轨迹、业务、感知的全息用户洞察,打造用户级业务轨迹回溯的实时数据模型,并结合投诉用户描述的语义理解,形成知识图谱对网络问题进行定界初判,提升针对用户投诉的快速、全面、深度的问题和原因掌握,并通过分布式解析能力的移网投诉分析支撑系统对一线进行赋能,具体包括以下功能:


1、投诉语义理解及智能化分拣

客户投诉的问题描述是移网投诉处理的最初依据,也是客户的直接问题体现信息。客户投诉的问题描述方式千差万别、表达内容复杂度及冗余度高,同时存在人工分拣成本高、易出错、流程复杂等问题,因此投诉语义理解主要研究内容包括:构建面向电信投诉领域的中文语料库和多级规则库,并基于自然语言处理技术研发投诉语义识别及智能化分拣系统。


(1)投诉语义理解数据源

投诉语义理解的主要处理对象包括投诉工单、投诉文本记录、投诉语音记录等基于语音识别技术转化而成的文本记录。


(2)智能语义理解技术架构

采用基于规则库及深度学习技术的融合模型,同时引入模糊条件逆向判决机制及词法分析融合算法,针对嵌套性及模糊语义问题,提升分拣及校验准确性;引入多模式模糊匹配模型提升低质投诉文本识别及信息抽取准确性。


(3)投诉语义识别及智能化分拣系统功能

• 问题分拣校验:采用基于规则库及深度学习技术的融合模型,实现移网投诉问题分层分类的自动化分拣,并与客服派单系统的分解结果,进行智能化校验,实现投诉问题校正、投诉分类重拣和投诉信息增录。


关键信息抽取:研发基于关键字规则库及深度学习技术的融合模型,实现用户投诉文本的分层级信息抽取,抽取内容包括:用户网络基本诉求、网络使用体验、网络及终端制式、问题发生场景、问题复现频率等。


投诉信息分析:研发智慧语义模型,针对投诉语音(转文本)或记录文本内容进行客户情感分析、热点问题挖掘、关联分析及预测。


目前投诉语义理解及智能化分拣已实现模块化开发并内嵌入投诉数据底座层,可在有需求的场景下进行直接部署。


2、投诉用户业务轨迹数字化回溯及洞察


基于B+O融合数据汇聚形成的数据底座,将用户投诉数据与实时网络信令数据、用户属性信息进行关联分析,形成从属性、行为、轨迹、业务、感知的全息用户洞察,打造用户级业务轨迹回溯的实时数据仓库,并结合投诉用户描述的语义理解,形成知识图谱对网络问题进行定界初判,解决“用户投诉什么问题”、“用户感知为什么差”和“还有哪些潜在投诉”等痛点问题,提升针对用户投诉的快速、全面、深度的问题和原因掌握,逐步改善用户对移动网络服务、客户服务的整体感知。


(1)用户投诉必要信息画像

用户基础信息画像部分主要以投诉用户关键信息“一屏清”整合为目标,一线工程师在接到投诉工单后,通过工单进行用户基础信息查询,一次性掌握投诉用户的工单信息、用户等级、终端状态、业务状态、套餐情况、投诉内容相关等信息。


(2)用户级业务轨迹及网络洞察

轨迹及洞察主要构建投诉用户级的业务轨迹回溯,并以此业务轨迹为基础拟合用户级、时空级的网络侧性能指标。需要综合算力、传输带宽等因素,设置在接收到移网问题投诉后,会计算以投诉受理时间为基准,追溯历史N小时的核心网及无线网信令数据,提取用户身份标识及网络ECI等信息,形成用户业务轨迹的准确回溯。


以该业务轨迹为基础,将MRO数据、告警数据、KPI数据与之进行关联分析,计算用户vs小区vs时段的弱覆盖比例、高干扰比例、是否断站退服、是否负荷过高等信息。


(3)网络端到端问题初步诊断及定位

基于用户业务轨迹回溯及洞察,能够发现投诉问题,在此基础上,构建专家经验的知识图谱,从而将用户描述的感知问题映射为网络问题并提供解决建议。


本研究成果有效助力一线实现投诉用户轨迹回溯、弱覆盖、故障、高负荷等问题场景的准确定位,实际验证,问题定位的准确率超过80%,现场复测的有效压降,尤其是直接解决了不能进场测试场景的问题复现。


六、总结


本文的研究内容重点聚焦客户服务生产经营环节,深入一线开展穿透调研,以网络类投诉处理为切入点,重点梳理从一线客服到网络运营工作的诉前、诉中、诉后等环节中的痛点和堵点问题,率先将行业热点的大语言模型技术与中国联通网络运营相结合,以AI大语言模型、知识图谱、NLP、大数据等技术手段,自主研发了一套基于AI的客服智能化工具产品集,包括湖仓一体融合数据底座、“知策应答”工具及插件、移网投诉分析支撑系统等。本文中的研究成果助力试点省分公司投诉处理平均时限从10小时以上缩短至2小时内,效率提升400%。应用效果显著,打造了AI对生产赋能实践的新范本。



【作者】


高洁,高级工程师,中国联通战略人才,联通研究院网络智能运营研究中心主任研究员,ICSINC Track Origanizer,Trustcom 审稿专家。主要专业领域为大数据、人工智能驱动的网络智能运营应用研究。授权发明专利三十余项,发表IEEE/EI论文二十余篇,中国通信企业协会、中国质量协会国家级赛事等多项荣誉奖励。


程新洲,教授级高级工程师,享受国务院政府特殊津贴专家。联通研究院网络智能运营研究中心总监、联通集团大数据领域首席专家。研究方向为网络大数据及网络智能运营体系构建,研发成果获国际、省部、集团、业级奖项40余项。北京邮电大学兼职教授、研究生导师;机械工业出版社专家咨询指导委员会委员;IEEE/SPRINGER多个国际会议TPC Chair。


宋春涛,工学硕士,教授级高级工程师,中国联通研究院网络智能运营研究中心算法工程师,主要研究方向为大数据及AI技术赋能网络运营。在国际期刊及会议发表论文二十余篇,申请发明专利三十余项。


成晨,高级工程师,联通研究院网络智能运营研究中心主任研究员。研究方向为网络大数据、人工智能算法。在国际、国内期刊及会议发表论文多篇,授权发明专利数十项,研制ITU国际标准多项,获中国科协、中国电子学会、中国质量协会等多项奖励。


高伟,工学硕士,中国联通研究院图神经网络人工智能团队工程师。研究方向为多模态人工智能、图神经网络、大模型等,主要从事人工智能前沿技术在通信网络及运营商业务中的落地应用研究。相关研究成果在国内外期刊及会议发表论文十余篇,申请多项发明专利,输出10余项国际及行业标准文稿。



文章分类: 期刊
分享到: