- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
山西大学论文 编号:2011241***
论文题目 面向数据库原理课程开放式问答系统的设计与实现
姓 名 * * *
院系、专业 计算机与信息技术学院、计算机科学与技术
学习年限 年 月至 年 月
指导教师
学位级别 学士
2015年4月15日
面向数据库原理课程开放式问答系统的设计与实现
学生姓名:*** 指导教师: **
内容提要 设计并实现了面向山西大学的精品课程数据库原理的开放式问答系统.介绍了开放式问答系统与传统的搜索引擎及自动问答系统的区别.介绍了本系统的主要原理、数据库的设计和主要模块的实现。本文重点是对用户提问时输入的信息进行的处理。用NLPIR汉语分词系统对用户输入信息进行分词。然后利用系统已有的停用词表对分词结果进行去除停用词处理。对处理结果通过建立向量空间模型将语句相似度进行向量转换便于计算。利用TF-IDF计算分词项的权重。运用余弦夹角相似度与数据库中的问题进行相似度计算。通过同义词词林的编码规则,对分词项进行词语语义相似度计算,弥补VSM没有考虑语义的缺陷。最后在数据库中选出与用户输入信息相似度高的问题集,显示到问答系统的搜索结果中。
关键字 开放式问答系统 VSM TF-IDF 相似度计算
引言
1.1论文研究的背景和意义
随着互联网的迅速普及和日益发展,越来越多的人们使用互联网的同时,网络上的信息也是呈指数型膨胀。互联网上的信息也变得良莠不齐。另外,搜索引擎返回的文档并不是用户需要的准确信息。用户仍需时间寻找精确信息。为解决这个问题,问答系统应运而生。问答系统的优点在于对用户提出的问题,不再像搜索引擎一样需要用户自己去甄别,从中省去了用户从搜索结果中再次寻找信息的繁琐步骤,从而更受迎。然而,传统的自动问答系统由于是依靠提前输入的题库,对用户输入的问题只能从已有的题库中匹配。由于题库不可能包含所有的问题,这样不可避免的自动问答系统并不能针对性的对用户提出的问题进行详细准确的回答。开放式问答系统用户自己回答其它问答者的问题,不再依赖知识库,增强了用户间的互动性。更好地交互性使得用户能够更有效快捷准确的解决问题。本文便是针对目前计算机专业学生的必修课数据库原理这门课程实现的一个开放式问答系统,能够帮助同学们更好地学习这门课程。
1.2问答系统综述
1.2.1问答系统
从知识领域,答案来源等方面可以将问答系统分为“开放式”及“封闭式”两种系统。封闭式主要是用于回答特定领域的一些专业问题。由于问题域受限,系统可以提前有针对性的将相关领域的知识装入题库,从而取得不错的效果。值得一提的是由IBM公司研发的沃森人工智能电脑问答系统。于2011年参加综艺节目危险边缘击败了最高奖金的得主和连胜保持者获得100万美元的奖金。
开放式的则是不设限问题的范围,所以系统中的所有知识必须尽量做到与任何领域不相关,从而也一定程度上提升了难度。
1.2.2开放式问答系统研究现状
Google Answers 是一个开放式问答平台,使用收费模式,回答者是由Google公司聘请的专家团队。Google在2002年4月开始此项服务,但随着互联网技术的日益发展,越来越多的网站开始免费提供开放式问答系统的服务,因此此项服务于2006年12月停止。后来,Google又推出了类似的服务,Google Baraza。
Yahoo!Answers开放式问答平台,当用户提问时系统会先进行答案搜索,如果已经有用户提出过类似的问题,并且已经得到较满意的回答,则利用已有的回答用户可以迅速解决问题。这样可以实现不同用户间的知识共享。由于用户对日常问题需求的共性,很多用户可能存在同一个或一类问题,则只要这类问题在问答平台得到过回答,其他用户也可以利用已有的回答更具有针对性的并且快捷的解决了这类问题。Yahoo!Answers是目前国外最大的开放式问答平台。
“百度知道”是目前最大的中文开放式问答平台。百度知道结合自身的百度搜索引擎,将传统的关键字搜索和问答系统结合在一起,强有效的解决数以亿计的用户的问题。随着用户的进行提问和回答,问题库的不断增大,用户的不断累积。百度知道已经成为众多互联网用户获取知识重要途径。
2数据库设计
2.1 数据库的需求分析
本文是实现面向数据库原理课程的开放式问答系统。主要是针对学生们在学习数据库原理课程时遇到的问题由老师和同学们进行有目的地解答。由于主要是针对数据库原理课程的,所以在问题分类方面没有采用对用户提出的问题进行语句分析自动分类,而是人工根据
您可能关注的文档
最近下载
- 湖北省武汉市十一初级中学2024-2025学年七年级上学期10月月考英语试卷(含答案,无听力音频听力原文).pdf VIP
- T_ZJATA 0033-2025 塑胶玩具中双酚类和烷基酚类物质迁移量的测定 液相色谱-串联质谱法.docx VIP
- 《“探界者”钟扬》精品教案精品教案.doc VIP
- 知识点汇总_古代汉语.pdf VIP
- 活动执行质量保障措施方案.pdf VIP
- 2024年新课标人教版小学体育水平三全册教案.docx
- 2025年注册安全工程师《法律法规》30个必考点终极预测与高仿真模拟题库.pdf
- 2024-2025学年初中数学六年级上册(2024)鲁教版(五四学制)(2024)教学设计合集.docx
- T_ZJATA 0033-2025 塑胶玩具中双酚类和烷基酚类物质迁移量的测定 液相色谱-串联质谱法.pdf VIP
- T_ZBXH 141-2025 甜菜旋幽夜蛾防控技术规程.pdf VIP
文档评论(0)