如何让对话机器人更优秀？ .docVIP

下载本文档

1
0
约3.79千字
约 9页
2022-03-01 发布于江西
举报
版权申诉

如何让对话机器人更优秀？ .doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

如何让对话机器人更优秀？除却自然语言理解，对话机器人应该如何通过产品设计来变得更加优秀？本文将通过几个核心的产品设计技巧为您介绍如何让对话机器人更加优秀。话接前文《?机器人是如何实现对话的？》，在上一篇文章中，梳理总结了如何打造一个对话机器人的完整流程，以及给大家介绍了整一个对话机器人设计所涉及的核心功能。而本文，则将在上文的基础上（如何打造一个对话机器人），与大家分享另一个话题：如何让一个对话机器人设计的更优秀？一、知识挖掘：解决一个企业没有成体系知识库的难题对话机器人，有一个很重要的任务就是为各类用户排忧解惑；而要做到排忧解惑，机器人就必须事先掌握相关的知识，即用户可能会问的问题以及这些问题的答案。对于一些大企业来说，由于多年的规范管理与积累，一般都会有一个成体系的知识库：总结了在服务客户的过程中，客户常问的问题，以及这些问题的答案。但是，对于一些中小企业，或者管理不规范的大企业（还真别笑，市值千亿的大企业，客服部门都没有成体系的知识库这类事情我碰到了好几回），服务客户的过程是没有成体系的知识库的，都是靠大家口口相传，自我学习。所以针对这部分企业来说，想要解放人力，引入对话机器人，第一步需要解决的问题就是知识库的问题。而这个问题又可以分为两类：第一类是有着丰富的人工服务经验，只是一直未把这些经验总结梳理；第二类是从未有过任何的服务经验，一切从零开始。对于后者，系统无法很好的辅助知识总结；但对于前者，只有客户的服务记录还在，就可以通过系统辅助人工做知识的总结和梳理。下面将通过一个具体来说明系统是如何帮助企业梳理过往服务记录，并整理成知识库的。 A企业常年通过企业QQ连接客户和客服人员，多年来的对话记录全部存在QQ后台，可通过后台系统直接导出所有的客户对话记录。有了对话记录后，可通过系统，把所有相似的问题进行分组与整合，并给出这些问题（或者叫问法）分组的关键词——知识挖掘通过标注师对这些问题分组进行校验，校验这些分组是否正确，是否需要调整，并在此基础上生成一条条知识——对问题分组建立一条标准问题，并给出该问题的答案。如图，这个是我之前的产品原型，涵盖了从知识材料的上传到算法的解析（相似问题分组），再到人工标注的过程。整个功能的设计核心思路在于：利用分类算法，把相似的问题进行分组，并提取问题分组的关键词，最后交给标注师做问题的创建与检验。整个过程对企业来说最大的价值在于系统通过历史数据帮助企业完成过往经验的总结。因此，最核心的部分也正是算法解析的部分，这部分一般使用文本聚类的方法，由于术业有专攻，笔者在此不展开描述。二、知识发现：解决机器人知识库更新的难题就像一个孩子去上小学，他所懂得的知识一定是一个逐渐增长的过程，而对话机器人的知识库也是一样的。我们一开始虽然设置了一版的知识库，但是在服务客户的过程中，他必定会遇到一些无法解答的问题。而承认自己的无知只是求知的第一步，第二步，我们需要对我们的无知进行填充，填补这块知识的空白。这样，在以后遇到相同的问题的时候，我们的机器人就不再哑口无言了。顺着上面这个思路，我们系统需要补充的一个功能就是知识发现：系统对所有无法回答的问题进行梳理与整合，而在这里，所谓的系统无法回答的问题，即针对这个问题，系统给出的答案最高的准确率低于某个水平的，我们则视为系统无法回答的问题。系统对这些问题按照相似程度进行分组，然后提取出对应问题分组的关键词。标注师对这些系统已经完成了初步整理的“未知问题”进行标注：如果这个问题在知识库中已经存在，只是系统无法识别而已，那我们就把这个问题放到已有的知识中就好；如果这个问题是原来的知识库没有的，那我们就需要新建一条知识来完成这部分空白的填充。长此以往这样不断的迭代下去，我们的机器人几乎就可以做到在当前领域无所不知，知无不言的地步了（当时是夸张的说法啦gt;.lt;）。但从这样一个解决问题的思路来看，我们也不难发现：利用这种原理的知识库和机器人，无法回答超出自身认知意外的问题，以及无法从自身已有的知识上进行推理，得到新的知识（回答新的问题）——而这个推理与认知能力，也正是我们生而为人所最宝贵的能力。所以那些担心机器人超越人类智商的小伙伴们，只要现在的人工智能还是在走现有路径，即从历史数据中学习以往的经验（机器学习流派），那它将永远无法达到超越人类的境界。而当前业内公认的，也许能够让机器实现知识的推理与认知的，被讨论的最多的就是知识图谱了；但是，也只是也许而已。因为当前知识图谱所谓的知识推理，更多的也只是遵从人的所设定的规则来进行推理罢了，这个以后我们在讲到知识图谱这个领域的时候再讲。三、对话端的优化：让客户用的更加省心以上的技巧都属于系统后台端的设计技巧，那接下来我们来讲讲真正和客户进行对话交互的对话端又