基于文本挖掘自动答疑系统研究.docVIP

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于文本挖掘自动答疑系统研究

基于文本挖掘自动答疑系统研究   【摘要】以一种基于文本挖掘的自动答疑系统为研究对象,分析了目前教学软件中老师自动答疑系统的现状,提出了自动答疑系统的体系结构和关键技术,并进行了初步设计。还提出了针对学生提问与回答对自动答疑进行自动优化的思想和方法。   【关键词】自动答疑系统;文本挖掘;数据挖掘;数据仓库   【中图分类号】TP392 【文献标识码】A 【文章编号】1672—5158(2012)08—0124-02   随着各种教学网站的出现以及基于网络教学研究的不断深入,老师与学生的在线信息交流也日益丰富起来。在很多教学系统中,在线答疑已经成为师生交流的基本工具。然而伴随着信息量的增加,教师对于大量问题进行一一回答的方式已经明显不能满足学生学习的需要,在交流中学生更加希望能够给予及时有效的回答,于是一种智能化的自动答疑系统成了迫切的需要。所谓自动答疑系统,就是充分利用教学网站中所有学习与辅导的信息,利用数据仓库和数据挖掘的相关原理及算法,对已有的信息进行整理和提取,实现相关问题的自动解答。   1.自动答疑系统的现状   随着Internet的发展与应用,智能化信息技术得到迅猛发展。网络成了人们获取信息的有效工具,面对面的提问解答已经不是主要的学习方式,基于网络的自主性学习已经成了学生的另一主要学习方式,这使学生由听众变成了知识的主动索取者,所以遇到不能解决的问题时,及时有效的答疑便成了同学们必不可少的需求。最初学生可以通过电子邮件直接与老师交流,或者通过系统留言板发布公告消息;接着有了BBS聊天室,教师和学生同时进入聊天室可以进行“面对面”的交流;后来又出现了专门的在线答疑,仍以聊天室的形式出现的,但是由后台数据库管理员或专家在一定的时间内针对所有问题统一做出回答,这种答疑方式已经成了教学平台的重要组成部分,更加方便了师生交流,也为质疑和解答提供了优良的渠道;接着又出现了进行纯文本的关键字查询的在线答疑系统,这种系统已经初步具有自动答疑的特征,其后台数据库含有问题和与其对应的答案,学生可以输入问题的关键字对问题进行搜索,这要求用???具有一定的抽取关键词的能力,输入关键字若不够精确,可能查到许多与其无关问题及其答案。   虽然以上几种交流方式一直在进步,但是每一种都要付出一定的人力与时间,给出的答案形式单一,准确性也不高。这几种答疑方式通常采用发帖子方式或者搜索匹配方式,没有将解答和评价有效的结合起来,所以难以给同学们有效的解答。随着学校学生规模的不断扩大,学生索取指示的需求积聚增加,网络内容的不断丰富,非常有必要设计—种有效的答疑系统一即基于文本的自动答疑系统。   2.自动答疑系统的特征   所谓自动答疑系统,关键在于“自动”二字,体现了其智能性。就目前的智能系统应用来看,智能系统可以总结为一个记忆系统、计算系统、逻辑系统、感知系统、交互系统、学习系统、思维系统及进化系统。因而自动答疑系统应该是一个具有知识记忆、数据计算、逻辑推理、知识学习和实现友好人机交互的智能系统,其本质是一个具有智能性的知识系统。这种系统应该具有以下特征:(1)支持自然语言的提问;(2)自动抽取并检索问题呈现有效答案;(3)通过学习自动更新答案知识库;(4)提供有自动特征的人工答疑;(5)具有知识库和用户信息库的管理功能;(6)具有统计功能来评价有效性。   自动答疑系统中,用户不仅可以根据关键字进行提问查询,而且可以通过自然语言来描述自己的问题。系统通过切词对自然语言抽取出关键词,根据关键词到数据仓库中检索问题,并在用户界面中显示相应的答案。管理员通过对后台数据库的原始数据进行一系列的处理,将其转换成有用信息,定期更新知识库。自动答疑系统后台数据库虽然也需要人工管理,但是呈现给用户的已经不是一般意义上的人工答疑了,可以称作具有自动特征的人工答疑系统。数据仓库中不仅有答疑知识库,而且还有教师个人信息库,如专业特长、研究方向、发表文章、所授课程等内容,学生对自己的问题进行提问时,可以根据这些信息来指定某一位老师的解答,这样提高了答案的有效性。用户可以根据不同答案进行评价,这个评价结果会返回到后台数据库中,每一种评价对应着—个分数,系统进行累计计分,并返回一个分数最高的答案呈现在某一个特定区域作为该问题在某一时刻的最优答案。   3.自动答疑系统的详细设计   自动答疑系统关键在于它的自动性和智能性,包括抽取问题的智能化、对答案评优的智能化和对信息维护的自动化。这一特点使得用户可以更加方便的使用系统,管理员可以更加容易的管理系统,系统返回的答案具有更高的有效性。简而言之,查询更省时,管理更方便,答案更有效。   3.1 系统总体设计   从应用的角度看,自动答疑系统共分为3大部分:提出问题部分、解答问题部分和在线讨论部分。而就系统的体系结构而言

文档评论(0)

317960162 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档