- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
智能客服——聊天机器人*问题解决型实现技术解决方案架构及开发流程小Y(智能机器人)*问题解决型机器人*问题解决型机器人,存在的目的是为了帮用户解决具体问题,例如:售前咨询、售后报修、订机票、酒店、餐厅座位等等需要提供给用户自己都不知道的信息--知识库1.理解用户问题,知道用户在问什么2.将用户的问题转化为对知识库的查询*问题理解查询知识库构建知识库查询多轮对话的上下文管理提问:今天北京多少度啊?回答:35度提问:有雾霾吗?(北京有雾霾吗?)回答:空气质量优。提问:那上海呢?(上海有雾霾吗?)回答:空气质量也是优。结合上下文*聊天机器人解决方案*自然语言处理、文本挖掘、知识图谱*知识库中存储的是一对对的“问题-答案”对(QAPair)。这些Pair可以是人工构建的,源于客户系统或者旧有知识库的,也可以是从互联网上爬取下来的。当用户输入问题后,将其和知识库现有的标准问题进行一一比对,寻找与用户问题最相近的标准问题,然后将该问题组对的答案返回给用户。用户问题-标准问题-答案解决方案一*用户问题-标准问题的匹配方法可以是关键词匹配(包括正则表达式匹配);也可以是先将用户问题和标准问题都转化为向量,再计算两者之间的距离(余弦距离、欧氏距离、交叉熵、Jaccard距离等),找到距离最近且距离值低于预设阈值的那个标准问题,作为查找结果。但关键字匹配覆盖面太小。距离计算的话,在实践中比对出来的最近距离的两句话,可能在语义上毫无关联,甚至满拧(比如一个比另一个多了一个否定词)“关键词”*解决方案二知识库中存储的不是问题-答案对,而仅存储答案(文档)。当接收到用户问题后,直接拿问题去和知识库中的一篇篇文档比对,找到在内容上关联最紧密的那篇,作为答案返回给用户。用户问题-答案*解决方案三从用户的问题当中识别出用户的意图,并抽取这个意图针对的实体。相应的,知识库内存储的知识,除了包含知识内容本身之外,还应该在结构上能够表示知识之间的关联关系。在提取了意图和实体后,构造出对知识库的查询(Query),实施查询,得出结果后生成回答,回复给用户。用户问题-语义理解-知识库查询-查询结果生成答案*聊天机器人实现技术*语义理解NLU意图识别实体抽取用来识别用户所提问题的意图,也就是用户希望做一件什么事用于提取用户对话中所提供的和意图相关的参数(实体),例如时间、地点等*Case1:有粉色的手机壳吗?——意图:商品推荐;实体:商品类型-手机,商品颜色-粉色。Case2:00183号商品快递到伊犁邮费多少?——意图:查询邮费;实体:目的地-伊犁,商品Id-00183。Case3:02465号商品有保修吗?——意图:保修查询;实体:商品Id-02465。举个例子,小明是一家小淘宝店主,他要为自己的淘宝店开发一款客服机器人,主要回答和商品属性(品牌、价格、邮费、售后等)相关的问题。Case2’:00183号商品快递到伊犁邮费多少?——意图:商品查询;实体:目的地-伊犁,商品Id-00183,商品属性-邮费。Case3’:02465号商品有保修吗?——意图:商品查询;实体:商品Id-02465,商品属性-保修。具体怎么定义,要与知识库的结构及中间控件(语义理解+对话管理)结合起来决定,怎么简单怎么来*意图识别-分类模型分类模型和seq2seq判别模型的训练都属于有监督学习,因此,所有的训练数据都是标注数据。因此,在进入训练阶段前必须要经过一个步骤:人工标注。如果大家真的在工作中应用机器学习,标注就是无法逾越的脏活累活。实体抽取-Seq2Seq判别模型*人工标记语料(Utterance)意图(Intent)[00183]{商品Id}号商品快递到[伊犁]{目的地}[邮费]{商品属性}多少?商品查询[02465]{商品Id}号商品有[保修]{商品属性}吗?商品查询订[一张]{数量}[2018.12.1]号{时间}[北京]{出发地}到[南京]{目的地}的机票订机票*知识库、知识查询和结果返回知识库用于存储知识,本身可以是各种形式:数据库,API,或者文本文件等。用户的问题经过语义理解,被提取成了意图和若干实体。知识库类型构造查询回答生成关系型数据库根据意图和实体,确定tabmeName,where条件,和目标column等要素,构建SQLQuery将SQLQuery的结果填注到答案模板中,生成回答问题的自然语言API根据意图和实体,确定要调用的API类型和参数,构造Http
文档评论(0)