在线答疑系.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
在线答疑系

在线自动答疑系统 设计与开发的研究 报告内容 毕业论文做什么 选题背景 教育部质量工程的启动,各高校加大了精品课程建设的投入.在线自动答疑系统是精品课网络平台中不可缺少的部件,对提高课程的教学质量有着重要的作用.然而目前一些精品课网络平台中的在线自动答疑系统非常”简陋”, 因此构建一个实用性和学习性,检索速度和准确度都有所提高的在线自动答疑系统是一个非常值得研究的课题。 本文在已有研究的基础上提出了一种以课程知识点树为导引的在线自动答疑系统,脱离简单的数据库自身查询方法,采用Lucene对信息进行检索.问题紧扣课程知识体系,将问题与知识点相关联,缩小了搜索范围.在系统设计上注重系统的学习性和实用性。 毕业论文做什么 研究内容 资源以知识点树构建 系统功能模块设计的研究 利用Lucene构建系统的答疑模块 答疑系统的中文分词 问题自动分类(研究的重点及难点) 已完成的工作—系统设计 目前已经设计实现了一个一般的基于Lucene在线自动答疑系统,即基本完成了前三个研究内容。 系统设计:除了一些常用的功能外,为了方便学生的使用,对其学习带来更有效的帮助,提高系统的实用性以及学习性,设计了“集思广益”、”提问导航”、“统计分析”以及“重点难点热点问题浏览”,这四个功能模块。其中“统计分析”还未实现,目前还只是对问题点击数的简单统计。 已完成的工作—Lucene构建答疑模块 完成了对数据库中数据建立索引,在索引库中进行问题检索,返回结果的排序以及关键词的高亮显示。 Lucene的工作流程: 1.使用IndexWriter,在指定的目录里建立索引的文件。 2.将需要检索的数据转换为Document的Filed对象,然后将Document用IndexWriter添加到索引的文件中。 3.处理索引信息,关闭IndexWriter流。 4.创建搜索的Query。 5.给IndexSearcher指定索引文件的路径后,用Query检索后返回Hits对象作为结 果。 已完成的工作—Lucene构建答疑模块 Lucene在答疑系统中的应用如图所示 已完成的工作—Lucene构建答疑模块 排序算法分析 Lucene默认按相似度排序,按多条件排序时效率差10倍,尤其是索引文件很大(50M)的情况下。 本文解决方法:对准备建立索引的数据预先按照查看次数和时间进行排序,检索时对检索结果按照索引记录的ID进行排序。 优点:查看次数从某种程度上而言反映了一个问题的价值,高效的实现了多字段排序。 已完成的工作—中文分词 中文分词:Lucene自带两个中文分词器其中一个实现了双字切分,但是会产生大量的无实际意义或无检索意义的垃圾词汇;另外一个实现了单字切分,但生成的索引库相当庞大,检索效率低,误检率比较高。 本文采用的方法:采用正向最大匹配算法进行分词,词典有待完善 正在进行的工作—问题自动分类 问题自动分类是论文研究的重点与难点,也是有别于一般答疑系统的地方。 对于问题与知识点的关联,可以在添加问题时关联也可以在教师对问题进行解答时选取,这样分类比较准确,不过却也以牺牲人工为代价。尤其是在向系统中批量导入问题后,手工分类会很费时。所以在我的论文研究中希望实现问题按知识点的自动分类. 正在进行的工作—问题自动分类 加入分类处理后的答疑系统模型 正在进行的工作—问题自动分类 分类体系:按一级知识点(即章)对问题进行分类。 原因:首先,分类越具体,误差越大;其次,可以将章下面的二级以及三级知识点所包含的关键词作为相关类别的特征核心词。 分类算法:朴素贝叶斯分类 原因:朴素贝叶斯适用于训练数据集比较大的情况,另外它有着坚实的数学基础,以及稳定的分类效率 正在进行的工作—问题自动分类 算法公式: 其中,P(xk|Ci)表示xk在Ci中发生的概率,对于P(xk|Ci)于的计算我们采用词频型的计算公式,即 从上面的公式我们可以看出xk在cj类中的词频对确定数据样本的类别有着重要的作用。 正在进行的工作—问题自动分类 关键问题: 特征核心词 词频一般比较大 增加其重要程度 目前的想法 相似类别处理 论文发表情况 已发表: 《在线自动答疑系统的设计与实现》 ----全国高校计算机基础教育2008论坛学术论文集 《关于在线答疑系统设计的研究与思考》 ----第四届“大学计算机课程报告论坛”(武汉) 《基于Lucene的自动答疑系统的研究与设计》 ----电脑编程技巧与维护 拟发表: 《基于朴素

文档评论(0)

af60068 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档