摘要:当今时代, 人工智能以及各种各样的语音识别系统在不断的发展, 语音识别慢慢地走进了人们日常生活的各个方面, 并凭借语音识别的准确度和识别的新颖化, 让广大的用户的从习惯变成了喜爱, 也成为了人工智能领域的主要研究方向。为了提高客服系统的使用满意度, 基于语音识别的人工智能客服系统被引入, 论文将探讨如何引入这种客服系统并实现其广泛推广。
关键词:人工智能; 深度学习; 语音识别;
一、前言
(一) 项目研究的背景及意义
随着社会经济的飞速发展及电力体制的不断改革, 电网企业的核心价值正在由“以电力生产为中心”向“以客户为中心”转变, 并将最终落脚在“如何更好地服务于全社会”与“以客户为中心的营销理念”这一根本任务及营销理念上。电网公司需要开启“自助+人工”帮助的新模式。
面对如今电力服务人员工作量大, 不能实现实时及时的为用电客户及电力企业员工提供服务的现状, 营销业务应答服务包括用电查询、停电公告、网点查询、用电知识、用电业务办理须知等问题, 对电力企业员工来说, 包含内部消息通知, 业务知识查询, 业务接口推送, 运维服务工单查询等问题, 在实际生产环境中是一项工作量非常庞大的业务, 全部都靠人工来解决不能做到及时处理, 会产生很多的问题[1,2].
语音作为人类最自然, 最快捷的信息传递方式, 智能语音的研究出现在了世界国的各行各业中, 而且越来越多的进入了人们的日常生活中。作为业务量如此庞大的电力服务行业, 为了提升用户感知, 降低人工成本, 实现服务质量的持续优化, 所以使用深度学习人机交互的模式来自动的给客户提供常见问题的解决方案[3,4].
(二) 传统客服模式与AI智能客服对比分析
传统客服模式即人工操作模式, AI客服模式是通过智能语音进行交互的模式。通过两种模式的对比分析 (见表1) 和OA问题处理的示例 (见图1) , 得出如下结论:针对占客服热线业务量70%以上的用户自助查询办理服务, 由智能语音交互模式实现是最优选择[5,6].
二、人机语音交互技术
(一) 人机交互技术
人机交互是人指通过自然语言与机器进行某种特定的沟通方式, 其具体技术表现在机器通过各种设备或方式向人提供信息或者人反过来通过输入设备向机器传达自身的思维想法等等, 通过机器完成一些人力很难完成或无法完成的工作[7,8].
(二) 人机交互模型
GOMS? (goals?operatorsmethods?selectors?) 模型, 是一个较早提出的有一定影响力的模型, 它描述了任务之间的关系。主要分为四个阶段。
a) 目标 (goal) , 用户执行任务想要实现的系统状态;
b) 操作 (?operator) , 为了完成目标而执行的一系列基本活动, 操作的类型有感知操作、认知操作、动机行为或者这几种操作的结合, 每个操作都有一个预定的执行时间;
c) 方法 (method) , 是描述如何完成目标的过程, 一个方法本质上来说是一个内部算法, 用来确定子目标序列及完成目标所需要的操作;
d) 选择规则 (?selection?rule) ?, 当完成同一目标有多种方法时, 需要设置一种规则标准来判断在何种使用情境中应该选择什么样的方法。
GOMS?模型是一种用户的认知模型, 主要用来描述任务在实践过程中?执行的。它的基本思想是, 首先确定目标, 将目标进行分解, 当完成同一目标的方法多于一种时, 根据使用情境, 通过选择规则来选择合适的方法, 每种方法是通过一系列的操作序列集合来实现的[9,10].
人机交互系统整个流程分为用户、输入、系统、输出四个步骤。首先把用户的语音识别成机器可以理解的语言传送给系统, 系统根据规则完成流程, 用户和系统之间就有了沟通的机制和渠道;流程完成后系统结果反馈给用户。如图?2所示。
(三) 人机交互的基本实现流程
人机交互的基本流程主要包含四个阶段, 其中还有一个循环, 具体流程如图3所示。
(1) 用户需求:以用户的要求作为标准, 建立交互需求;
(2) 需求分析:在一定条件下, 分析用户提供的信息, 重点联系后期工作;
(3) 系统设计:在标准设计规则的基础上, 重点增强系统的可交互性, 最大化系统的实用性;
(4) 迭代和原型化:对设计的交互式系统进行测试和评估, 重点关注该系统的可用性、功能性、可接受性等, 发现其中可能存在的问题并对此提出解决方案;
(5) 系统实现和系统推广:按照设计流程进行安全制造, 并向市场推广系统[11].
(四) 人机语音交互技术研究
从受广泛关注的苹果语音Siri出现开始, 语音识别在商业迅速地推广开, 重点推广领域包括搜索, 通信和手机等服务上。同时, 由于成本等因素, 这种语音交互技术已经成为各类公司客服中心的首选。
1. 语音识别技术
语音识别技术是语音人机交互平台的核心技术, 客服中心的语音识别系统的技术路线包括一下几个部分:
(1) 命令词的识别:开发人员设定专用的命令词, 与用户语音进行匹配;
(2) 关键词检出:检索出客户语音里的关键词;
(3) 自由说语音识别:把用户的语音识别成文字, 然后对文本进行语义理解。
2. 自由说式导航技术要求
声学模型建模、语言模型建模和分类算法是实现自由说式导航技术地重要手段。
在声学模型方面, 使用声学模型建模方法, 这种方法是语音识别领域中的主流, 同时结合上下文相关的建模单元、区分性特征、区分性模型训练等技术, 实现在随意说环境下的声学模型[12].
在语言模型方面, 目前最主流算法是语言模型建模算法, 通过对文本数据进行数据设计、收集、清洗、分类及质检等开展语义训练, 不断提升语言模型的适应性。
在分类算法方面, 分类目标必然是主要业务选项, 通过对主流的分类算法进行实现与分析, 比对多种算法如文本分类器的区分性训练、支持向量机、最大熵、神经网络、集成学习等优秀分类算法, ?通过数据研究出可解决当前复杂任务的分类算法;根据实际分类技术的使用情况, 以多分类器实现为目标, 用以解决实际业务中可能的路由问题。
三、智能语音技术的具体应用
主要实现目标是以新颖的智能交互模式代替传统的人工交流, 使得用户能够以自然语言 (未来的工作包括各国外语与各地方言) 和机器进行交流, 传达用户的思想, 为客户提供便利的同时使得整个服务过程变得轻松、愉快, 极大的提高用户的满意度和客服工作的效率。这种新颖的智能技术必将推进业界产业链的发展。
(一) ?交互平台分析
1. 业务流程的设计
用户使用1000号智能语音客服, 当用户说出其问题如“使用OA系统时, 点击‘不归档’提示:‘归档回调出错’”, 系统识别出关键词“OA”、“归档”和“归档回调出错”对应到OA里的归档节点, 找出里面关于“归档回调出错”相关的解决方案, 然后反馈给用户, 用户可继续说出其他诉求或退出, 完成一次智能语音服务[13].
当无法识别或是问题无法找到解决办法时, 系统会自己询问用户该问题无法解决是否转人工或智能客服无法解决必须由人工解决、无法识别用户提出的问题等场景。
2. 业务范围的选择
人机语音交互平台能实现1000号里的业务查询, 业务办理, 业务咨询和问题反馈与投诉等问题。
四、智能语音客服平台架构
在深度学习人工智能的大趋势下, 互联网已经介入人类生活的各方各面, 1000号人机语音交互平台的建设势在必行, 只有这样才能既可实现云南电网公司在人工智能方面的需求, 也可满足电网公司其他业务的客服中心的需求, 代替人工, 降低成本, 可以做到24小时全时段工作, 无需投入人力, 提高运维支撑效率, 技术更新、部署更加高效。
(一) 系统架构
人机语音交互平台接入到1000号客服中心。作为云南电网里的主要系统, 平台主要由3?个模块来构成:语音接入控制;语音识别、合成和语义理解;对接业务支撑系统, 实现用户的业务查询、业务办理、业务咨询。
五、人机语音交互平台未来部署展望
智能语音客服核心功能是提供自然语音对话服务, 在此基础上可以在业务拓展和语音数据的深度挖掘方面取得更加深入的研究。
(一) 在语音资源、知识库方面:
依赖多年沉淀的丰富客服知识库, 和语音音频资源, 配置电力行业专业的术语, 即可能更好的融入云南电网公司的各个业务域。
(二) 在语音能力、业务能力方面:
从多方面入手提升语音合成能力和语音转文本能力, 提高识别率, 更好的服务于电网行业。
(三) 在语音数据的挖掘方面:
通过对整个电网公司用户的语音数据进行分析, 挖掘出用户潜在的需求, 对发展业务的建议等。
六、结语
本文人机语音交互系统集成了百度语音的语音识别、语音合成技术, 系统主要由语料知识库管理模块、语音识别、语音合成, 人机交互等模块组成, 用户只需说出自己的命令, 系统即可完成指定的操作。语音交互系统以移动平台为基础, 识别率达85%以上, 单次语音交互时间小于?3?秒, 使语音技术的使用与移动设备系统很好的结合在一起。
参考文献
[1]孟祥旭, 李学庆。人机交互技术-原理与应用[M].北京:清华大学出版社, 2004.
[2] 龚媛, 雄于然。语言处现的语音识别后文本处理[D].硕士学位论文, 北京:北京邮电大学, 2008, 03.
[3] P. Zhou and F. Xing. Analysis of cognitive behavior in software interactiveinterface[A]. In:Proceedings of the 9th International Conference on Computer-Aided Industrial Design and Conceptual-Des ign[C]. Kunming, China, Nov. 2008.
[4]王秀景。语音识别技术研究与实现[D].硕士学位论文, 山东科技大学, 2011, 05.
[5]高新涛, 陈乖丽。语音识别技术的发展现状及应用前景[J].甘肃科技纵横, 2007, 36, 04.
[6] 龚媛, 基于然语言处理的语音识别后文本处理[D].硕士学位论文, 北京:北京邮电大学, 2008, 03.
[7] 陈志刚, 中文语音合成系统中文本分析的若干关键技术[D].合肥:中国科学技术大学, 2003.
[8]李波, 王成友。语音转换及相关技术综述[J].通信学报, 2004, 5.
[9] 王聪修。语音转换及其相关问题的研究[D].中国科学院声学研究所博士学位论文, 2001.
[10]刘幺和, 宋庭新。语音识别与控制应用技术[M].北京:科学出版社, 2008, 02:2-3.
[11]朱维彬, 王士楠。基于语义的语音合成-语音合成技术的现状及展望[J].北京理工大学学报, 2007.
[12]王登峰, 曹晓琳, 于吉龙。智慧语音语音识别系统设计与实验[J].农业机械学报, 2010.
[13] 维基百科。自然语言处理[EB/OL].[2016-07-25]