和美大家说 | 浅谈智能聊天机器人的设计及应用
1. 什么是智能聊天机器人
智能聊天机器人,是一种通过自然语言模拟人类进行对话的程序,它可以解放企业中相对固化、重复的密集型任务或流程所需的人力。典型的聊天机器人应用有以下几种:
• 问题咨询:基于业务知识库进行业务问题解答
• 数据检索:纵跨各业务系统或数据库,检索数据或文档
• 业务处理:对接相关业务系统转达指令,完成相应业务操作
• 闲聊:回答用户的一些问候、情感及娱乐信息等开放性问题
2. 智能聊天机器人的交互设计
智能聊天机器人交互设计的本质就是CUI(会话式交互界面)。最好的人机交互界面就是没有界面,CUI基于这样的理念尽可能减少人机交互的复杂性,通过会话形式将已有数据、功能、服务展示给用户,相比于传统的GUI(图形式用户界面)有非常独特的优势。
• 提高用户注意力:在信息碎片化的今天,用户注意力持续集中的时间不多,人们很容易为各种事情分心,而在CUI的设计中,信息是根据用户的指令需求逐步提供的,用户就不容易被无关的信息干扰。
• 减少用户操作的挫败感:在CUI中,用户能进行的操作相对有限,这也避免了因用户行为带来不可控的错误。让用户做简单的选择题,能降低用户思考的成本和系统错误率,最终能够实现让用户快速聚焦他们想要的东西,减少因操作带来的挫败感。
• 降低用户的学习成本:CUI用户界面上线后立即就能投入工作,用户不需要刻意学习,降低了使用成本,并且可以根据业务变化及应用场景随时将对话设计进行调整和修改。
当前语音识别的准确性及机器人设备所处环境的干扰(如环境杂音干扰),聊天机器人的CUI交互设计中在允许的情况下也会加入少许的GUI交互界面,以提升用户的产品体验。另外基于聊天机器人与业务系统紧密集成的趋势下,在CUI的基础上添加一些简单的GUI元素也是有必要的。
3. 智能聊天机器人的核心技术
智能聊天机器人最核心的部分是对话引擎,对话引擎包括自动语音识别(ASR)、自然语言理解(NLU)、对话管理(DM)、自然语言生成(NLG) 和文本到语音合成(TTS),大部分聊天机器人系统的模型可以抽象成下图所示的结构。
上图可以很清晰的看到对话引擎每个模块的输入输出,以及各模块之间的协作关系。我们解释一下每个模块的功能。
ASR: 语音识别技术,即语音转文字,其目标是让机器通过识别和理解过程把语音信号转变为相应的文本或命令。
NLU: 自然语言理解,NLU是对话引擎的基础,其目标是将文本信息转换为可被机器处理的语义表示。对于机器而言,理解一句话中的每个词语的确切含义并不重要,重要的是理解这句话表达的意思。简单来说,就是将人的语言转化成机器可以理解的结构化的完整语义,让机器理解人的语言。
DM: 对话管理,DM是对话引擎的大脑,它主要处理两个方面的事情。一方面是维护和更新对话的状态,对话状态是一种机器能够处理的数据表征,包含所有可能会影响到接下来决策的信息,如NLU的模块输出、用户的特征等;另一方面是基于当前的对话状态,选择接下来合适的动作。
NLG: 自然语言生成,目标是将结构化数据转换为文本、图表等形式展示给用户。
TTS:文本到语音合成,目标是将自然语言文本转换为语音输出给用户。
总的来说,这些技术都是属于自然语言处理技术(NLP,Natural Language Processing),本质上我们需要使用NLP技术来解决聊天机器人的问题。对于用户的一个问题,需要将这个自然语言问题通过一个模型(这个模型是利用机器学习基于大量数据训练和归纳得到),转换为机器能理解的数据形式(我们将这种数据形式称之为向量)。
4. 智能聊天机器人系统的架构
智能聊天机器人系统主要目标是提供回答问题的能力,即在理解自然语言的基础上,解答用户提出的问题。进一步的,可以提供基于任务的对话能力及判断用户的意图,通过多轮对话收集必要的信息,完成如业务办理、天气查询、预订酒店等服务。下图展示了一个简单的智能聊天机器人系统架构,对于一个智能聊天机器人系统,其核心部分是智能对话模块,其次基于业务的需要对接第三方的业务系统,提供知识管控台界面做语料录入、模型训练及测试和发布功能。
为了提升系统的可靠性,很多情况下我们会加入人工后台服务,人工服务在系统中扮演着三种角色。
其一,在智能对话服务出现错误时或者无法理解用户的问题时,人工纠正或者直接接管智能对话服务;
其二,在智能对话服务的辅助下执行动作,比如NLP生成候选动作但不执行,由人工判断决定最终的执行动作;
其三,产生标注数据使得聊天机器人更加聪明,例如人工每一次纠错和执行动作都是一个标注样本,可以用于训练智能对话服务的机器学习模型。
上图所示智能聊天机器人系统架构中有以下一些重要的组件:
• 客户端应用:客户使用的设备及其应用,如微信公众号、实体机器人、手机app或运行于浏览器的H5聊天应用等。
• ASR/TTS:语音转文本/文本到语音技术,需要语音对话功能的客户端使用到,如实体机器人、语音客服等。
• 认证服务:客户端的连接系统提供认证功能。
• 路由服务:针对不同类型客户端的差异化处理。
• 智能对话:聊天机器人系统核心组件,主要涉及到我们在第三章节提到的NLU、DM和NLG三大技术的整合。
• 人工后台:为了提升对话系统的可靠性,在智能对话系统无法回答客户问题时,人工介入处理。
• 第三方内容服务:弥补自身系统的不足,对接第三方的内容服务,如系统本身主要处理客户业务场景的需求,若客户也需开放领域的聊天功能,可对接百度UNIT、腾讯的AI开放平台等。
• 客户应用内容服务:因系统业务需要对接客户的内部系统。
• 知识管控台:客户管理控制智能对话服务的界面。企业客户可以在控制台中添加业务语料、设置意图,训练、测试和发布自己的对话服务。
5. 智能聊天机器人的应用场景
从应用场景的角度看,可以将聊天机器人分为客服、娱乐、教育、私人助理和智能问答5类。
客服类聊天机器人
主要功能是自动回复用户提出的与产品、服务和业务相关的问题,以降低企业客服运营成本、提升用户体验。其服务通常是以网站、手机终端、实体机器人为载体而实现的。
娱乐场景下的聊天机器人
同用户进行不限定主题的对话(闲聊),从而起到陪伴、慰藉等作用。其应用场景集中在社交媒体、儿童陪伴及娱乐、游戏陪练等领域。除了能够与用户进行开放主题的聊天,还能提供特定主题的服务,如支持用户询问天气、回答用户关于生活常识的疑问等。
教育场景下的聊天机器人
可以根据教育内容的不同进一步划分。例如,通过构建交互式的语言使用环境,帮助用户学习某种语言的聊天机器人;在用户学习某项专业技能时,指导用户逐步深入地学习并掌握该技能的聊天机器人;在用户的特定年龄阶段,帮助用户进行某种知识辅助学习的聊天机器人等。这类聊天机器人的应用场景为具备人机交互功能的学习、培训类产品,以及儿童智能玩具等。
个人助理类型的机器人
主要功能是帮助客户管理社交日程表、网上购物、订票、预定酒店等。如果你是在金融行业工作,那么机器人可以帮你做费用跟踪,如果你是在健康行业工作,那么机器人可以帮你做健身跟踪。总的来说这类场景的机器人就是如何处理好用户的生活细节,成为一位优秀的客户私人助理。
智能问答类机器人
被广泛应用在客服、营销等重复性对话频繁发生的场景,或者作为GUI的补充,为用户提供高效、个性化的体验,甚至是直接集成到智能音箱、智能家居、智能导航等硬件设备中,独立承载人机交互的重担。
和美信息智能服务机器人
6、和美信息智能机器人平台介绍
和美信息智能机器人交互平台是和美信息机器人平台研发团队与IBM团队联合打造的一款智能机器人AI平台,经历了将近两年的打磨后,已为建设银行、农业银行、民生银行、浦发银行等多家银行及政务部门提供服务。和美智能机器人平台2.0版本自去年10月份推出后,成为业界第一款AI+人工接管的双平台产品。其主要功能包括以下几方面:
• 支持实体机器人、手机app、微信公众号、网页端等多渠道前台接入。
• 支持多类型任务,包括问答、业务办理、技能、闲聊等。
• 支持复杂情景会话,多轮对话等功能。
• 完善的人工后台,同一客服可同时接管多台实体机器人,后台客服可以通过语音、文字等方式通过实体机器人为用户服务。
• 知识库分级管理功能,支持设置不同层级部门的知识库读写权限,另外也支持设置不同角色的知识库权限。
• 支持多租户功能,一套服务可同时支持多个不同银行的客户。
• 会话管理功能,可以查看机器人的历史聊天记录,检索并定位回答不好或回答不上的问题,并可快速补充新问题。
• 提供统计分析功能,可按热点问题、知识问答、知识总量、机器人应答状态等方式进行分析。
• 可配置使用多种机器学习模型。
• 支持对接客户内部系统进行业务处理。
• 平台支持双活部署、高可用性和及热部署方式。
• 引入第三方闲聊可支持更多开放域的问题。
和美信息交互平台