- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
情报工程 ISSN 2095-915X TECHNOLOGY INTELLIGENCE ENGINEERING
ISSN 2095-915X
第2卷 第5期 50-57 2016 年 10 月 Vol.2 No.5 50-57 Oct 2016
doi:10.3772/j.issn.2095-915x.2016.05.006
生物医学文献检索方法与问答系统
潘昊杰,周芳 ,张博文,张乐乐,方帆,殷绪成
( 北京科技大学计算机科学与技术系 北京 100083 )
摘要:如何有效的进行生物医学文献检索和信息挖掘,是计算机技术和生物信息技术研究领域中的一
个经典课题。本文对生物医学文献中自然语言问题文档,片段,概念和 RDF 三元组,构建了高效的检
索和问答系统。特别的,在文档检索中,我们搭建了基于顺序依赖模型,词向量,和伪相关反馈相结
合的通用检索模型;同时,前 k 个文档被分离为句子和片段,并以此建立检索索引,并基于文档检索
模型,完成片段检索;在概念挖掘中,提取生物医学的概念,列出相关的概念属于网络服务的五个数
据库链接,通过得分排名得到最终的概念。在 CLEF BioASQ 几年的评测数据上,我们构造的检索系统
都取得了不错的性能。
关键词:生物医学文献检索,序列依赖模型,词向量,伪相关反馈,排序学习
中图分类号:TP391
Query Processing in Biomedical Literature RetrievalandQuestion Answering
System
Pan HaoJie, Zhou Fang,Zhang BoWen, Zhang LeLe,Fang Fan,Yin XuCheng
( School of Computer and Communication Engineering, University of Science and Technology Beijing, Beijing 100083, China)
基金项目:本研究得到国家自然科学基金“结合前馈和反馈机制的自然场景文本识别技术”(编号的资助,并在此基
础上展开后续理论及应用研究。
作者简介:潘昊杰(1991-),硕士,研究方向:信息检索,数据挖掘,haojiepan@;周芳(1972-),博士,副教
授,研究方向:机器学习、信息检索,zhoufang@;殷绪成(1977-),博士 / 教授 / 博导,北京科技大学计算机
与通信工程学院计算机科学与技术系模式识别技术创新实验室主任,信息检索与推荐系统等应用技术国内知名青年专家;张博文
(1992-),博士生,研究方向:机器学习、信息检索;张乐乐(1987-),硕士生,研究方向:信息检索;方帆(1992-),硕
士生,研究方向:信息检索。
050
生物医学文献检索方法与问答系统
Abstract: How to effectively carry out the biomedical literature search and information mining is a classic topic
in the field of computer technology and biological information technology research.This study constructed an
efficient retrieval and question answering system refer to the related problem of natural language problems in
biological medical literature documents,including snippets, concepts and RDF triplets.In particular, this research
built a general search model based on Sequential Dependence Model, WordEm
您可能关注的文档
- 生物发电厂锅炉安装方案优化.pdf
- 生物法去除水中土臭素和2-甲基异莰醇的研究进展.pdf
- 生物反应带修复技术试剂注入条件对接触效率的影响模拟.pdf
- 生物防火林带营建及其存在问题与建议.pdf
- 生物防治技术在森林虫害防治中的应用研究.pdf
- 生物防污剂聚苯乙烯复合微球的细乳液聚合制备方法研究.pdf
- 生物非光滑耐磨表面仿生应用研究展望.pdf
- 生物废弃物改良盐碱地的研究进展.pdf
- 生物废水处理系统的细胞自动机模型.pdf
- 生物沸石处理低含量氨氮水影响因素研究.pdf
- 专题02+时事热点(精讲课件)2025年中考地理二轮复习讲练测(安徽专用).pptx
- 专题10+经济建设 2025年中考道德与法治二轮复习讲练测(广东专用).pptx
- 专题02+西游记【名著概览】+-+2025年中考语文必读名著演练.pptx
- 专题七+认识国家(课件)-【省心备考】2025年中考地理一轮复习优质课件.pptx
- 第22课《礼记》二则——《大道之行也》(课件)-2024-2025学年八年级语文下册同步备课精品资源.pptx
- 跨学科实践15:制作“龙骨水车”(课件)-2024-2025学年八年级物理下学期项目化课程案例.pptx
- 第13课_辽宋夏金元时期的对外交流(课件)2024-2025学年七年级历史下册同步教学课件.pptx
- 选择题专项讲解——综合类(课件)2025年初中道德与法治中考选择题练习.pptx
- 第21课《庄子》二则——《北冥有鱼》(课件)-2024-2025学年八年级语文下册同步备课精品资源.pptx
- 7.3+感受澳大利亚(第二课时)-2025学年七年级地理下册同步精品课堂(晋教版2024).pptx
文档评论(0)