- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
ISSN 1009-3044 E-mail: wltx@
第 卷第 期 年 月 电脑知识与技术
7 12 (2011 4 ) 与技术 Computer Knowledge and Technology
Computer Knowledge and Technology 电脑知识
Vol.7, No.12, April 2011,pp.2865-2868 Tel:+86-551-5690963 5690964
中文问答系统中答案抽取的研究
刘宁锋,史晓东
(厦门大学,福建厦门 361005 )
摘要:答案抽取是开放领域问答系统中的关键部分,主要由检索结果句子的重排和最终候选实体的抽取构成。 通过把依存分析到引
入到这两个步骤中,并结合改进的关键词密度算法,增强了对句法和语义知识的利用和系统的鲁棒性,在实验中答案抽取的效果明
显提高。
关键词:问答系统;答案抽取;依存分析;语义角色标注
中图分类号: 文献标识码: 文章编号:
TP391 A 1009-3044(2011)12-2865-04
Answer Extraction Research for Chinese Question Answering System
LIU Ning-feng, SHI Xiao-dong
(Xiamen University, Xiamen 361005, China)
Abstract: Answering extraction is the key component of open domain question answering system, which contains sentences reranking and
final candidate entity extraction. Through introducing dependency parsing into these two procedures incorporating keywords density algo -
rithms, the system uses more syntactic and semantic knowledge as well as the enhancement of the systems robust and at last get a significant
improvement in the experiment.
Key words: question answering system; answer extraction; dependency parsing; semantic role labeling
互联网的高速发展使得网上的信息越来越丰富,人们足不出户就能利用互联网得到自己所需要的各种信息,而搜索引擎便是
人们快速获取信息和资源的重要手段之一。 但是, 目前的互联网搜索引擎还是存在很多缺陷,并不能帮助用户很快很准确地找到自
[4-5]
己想要的知识,主要反映在以下的几个方面 :
① 返回相关信息太多,用户不易使用;
② 使用关键字进行检索,对用户经验要求较高,不符合用户日常生活的习惯,对于互联网新手来说,门槛较高;
③ 检索结果差强人意,由于索引没有以关键词发基础,没有涉及语义、语用,所以它有5148 天的缺陷;
④ 表达方式的差异问题,世界不同国家或者同一国家不同地区的人都同一种意思的不同的表达方工使得现有的搜索引擎处理
起来也比较困难。
相
您可能关注的文档
- 902《土力学》-河北建筑工程学院.PDF
- AcTc一种基于改进的蚁群算法的中文文本聚类算法.PDF
- Centos5.2搭建Postfix邮件系统.PDF
- ch02关联式资料库系统综览.ppt
- CNN与人工特征提取快速识别斑马线的方法-电子设计工程.PDF
- DIC原材料调查填写指导EntryGuideforDICRAWMATERIALSURVEY.PDF
- I_@橡胶沥青混合料的疲劳性能-筑路机械与施工机械化.PDF
- NEAT七级考试大纲-NEAT测试.doc
- NO.7商务英语翻译.PDF
- N、P、K调控对野菊药用部位性状及活性成分含量的影响.PDF
- 五神娃新能源有限责任公司环境影响评价公众参与说明.doc
- 年产 1.65 万吨纤维染色生产线建设项目环境影响评价公众参与说明.PDF
- 民用航空运输机场消防站与通用航空机场消防站的火警受理系统与火警录音系统和火警图文信息系统以及火警受理联动控制装置的集成与融合.doc
- 14一次性使用无菌手术包类产品注册审查指导原则2023年修订版公开征求意见稿.pdf
- 2025年华为质量考试试题及答案.pdf
- 2025年电力设备运行维护与管理制度.pdf
- 人教版八年级生物上册课件《激素调节》.pptx
- 人教版八年级生物上册课件《神经系统的组成》.pptx
- Unit+4+Amazing+Plants+and+Animals+Section+A+2a-Grammar+Focus课件2025-2026学年人教版(2024)英语八年级上册.pptx
- Unit+4+Section++A1a~pronunciation课件++-2025-2026学年人教版(2024)英语八年级上册.pptx
文档评论(0)