- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于senence-ber的智能问答咨询问题提示列表
摘要:[目的/意义]咨询问题提示列表能引导咨询者在智能问答和智能咨询系统进行咨询并为动态咨询引导提供基础。目前,关于问题提示列表构建的研究大多采用专家咨询法、访谈法,这些方法无法满足智能咨询服务要求,本文以有问必答网中糖尿病问答为例,提出了基于Sentence-BERT语义表示的咨询问题提示列表自动构建模型。[方法/过程]本文首先在糖尿病相关文献调查和分析的基础上确定糖尿病类目体系,并人工标注咨询问题类别;其次使用LDA模型对每类问题集进行主题聚类;然后各主题下通过Sentence-BERT预训练模型进行问题语义表示,text Rank算法计算问题重要性并排序;最终冗余处理后构建出咨询问题提示列表。[结果/结论]实验结果表明,本文提出的模型能有效构建出信息质量较高的、内容丰富的咨询问题提示列表,对咨询引导有促进作用。
十八大以来,面对新一轮的科技革命和产业变革,党中央确立了人工智能发展国家战略,积极推动人工智能与各产业融合,实现智能化服务。随着社会经济和信息技术的快速发展,咨询活动已融入社会经济的各个方面,如何利用信息技术优化咨询过程,实现智能咨询已成为重要研究内容。智能咨询通过智能咨询系统实现,以解决咨询者的实际问题为目标,需要咨询者的充分参与,然而由于专业知识的限制,咨询者在进行专业咨询时,可能面临不知如何提出问题或者不能充分描述咨询意愿的状况问题提示列表(Question Prompt List,QPL)是用于咨询者在访谈过程中进行问题咨询以获取特定信息的结构化表格,表格中列出咨询者最常见的需要咨询的系列问题,可以用于引导咨询者进行咨询目前,问题提示列表大多基于访谈方式构建根据问题提示列表的特点,本文参考自动文本摘要等研究,提出了基于Sentence-BERT语义表示的咨询问题提示列表自动构建模型,同时最新研究表明糖尿病是我国重要的公共卫生问题,糖尿病患病率为12.8%,患病人数约为1.3亿,但是很多成年人对该疾病并没有正确的认知1 相关研究1.1 问题提示列表问题提示列表按主题列出了某一特定领域的一系列咨询问题,结构清晰、内容全面、表达简洁,能够引导咨询者进行问题咨询,提高咨询效果,目前已在多种医疗环境中使用,包括癌症、糖尿病、冠状动脉疾病、老年医学、普通实践、妇科和皮肤病学、外科等目前,有关问题提示列表的研究分为理论研究和方法研究两种。问题提示列表理论研究主要是有关问题提示列表对于优化咨询结果、增强医患双方沟通、提高咨询满意度的有效性。如Lim L等将患者随机分为QPL组和对照组进行实验,结果显示QPL患者在初次就诊与手术前一日之间的焦虑明显减轻,术后更大程度地减少焦虑,问题提示列表能够提高咨询的满意度并减少患者焦虑问题提示列表方法研究主要是关于基于具体领域如何构建问题提示列表,如廖瑶姬等通过文献回顾和深度访谈确定了哮喘病儿童父母信息需求主题,并通过两轮专家咨询法确定哮喘病问题提示列表1.2 自动文本摘要针对特定疾病,问答社区中存在大量咨询文本,其中许多咨询问题内容相似,文本摘要技术能够解决这类文本信息过载问题,在保持原有信息的情况下,对原有咨询文本进行凝练表达,形成问题摘要,减少咨询者的参考负担,目前该技术已经在新闻摘要、学术文献摘要、社交媒体摘要、电子商务评论摘要以及答案摘要等多个领域得到很好的应用。如林莉媛等在充分考虑评论情感与主题两者的情况下,提出了一种基于情感的PageRank算法框架,从评论语料中抽取文本情感摘要2 基于Sentence-BERT语义表示的咨询问题提示列表自动构建模型根据问答社区和问题提示列表的特点,本文提出了基于Sentence-BERT语义表示的咨询问题提示列表自动构建模型,该模型主要包含4个模块,分别是数据预处理与人工类别标注模块、基于LDA的咨询问题主题发现模块、咨询问题重要性排序模块以及咨询问题提示列表生成模块,该模型如图1所示。2.1 数据预处理与人工类别标注2.1.1 数据预处理由于问答社区用户提问的自由性,问答社区问句存在表述不规范、语意模糊等问题,本文的数据预处理操作是将从此处获得的文本数据转化为规范化文本,以便下一步的操作。数据预处理主要包括:数据获取:用Python编写网络爬虫,从问答社区中获取问题标题、详细问题描述、回复个数等字段信息。由于本文的目标是构建咨询问题提示列表,问题标题相对于详细问题描述具有噪音少、描述清晰简洁的特点,故将问题标题作为研究对象。数据清洗:咨询问题无回复,则认为咨询问题质量不高,故删除无回复的记录,同时删除重复记录;由于问答社区用户提问的自由性,人工去除无意义的噪音数据,同时对标点符号不用、乱用等问题进行修正;若问
原创力文档


文档评论(0)