网站大量收购独家精品文档,联系QQ:2885784924

面向文本挖掘植物生长发育实体识别研究.PDF

面向文本挖掘植物生长发育实体识别研究.PDF

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数字图书馆 面向文本挖掘的植物生长发育实体识别 研究* 汪 润 何 琳 王东波 黄水清 范远标 (南京农业大学信息科学技术学院 南京 210095 ) 摘要:【目的 】研究从文本中识别植物生长发育实体(Plant Growth and Development Stage Named Entity ,PDSE ) 的抽取。【应用背景 】PDSE 从本质上来说是一种命名实体。目前有关命名实体的识别已经成为自然语言处理领 域最有价值的基础技术之一,被广泛应用于多种自然语言处理系统中。【方法 】采用基于条件随机场和规则的混 合策略,提出并实现针对 PDSE 特征的 CRF 特征模板、特征函数以及抽取规则的方法,并利用 PubMed 数据库 收录的论文进行抽取效果测试。【结果 】实验表明本文提出的混合策略能取得较高的准确率和召回率。【结论 】 本研究对生物学文本抽取具有一定的借鉴意义。 关键词:植物生长发育时期 命名实体识别 条件随机场 特征选择 分类号:TP391 提取、信息检索、文本自动摘要等自然语言处理系统 1 引 言 中。专门针对植物生长发育时期进行命名实体识别的 植物的生长是指植物的营养生长,包括种子萌发 研究还非常少见。本文通过对植物生长发育时期命名 及根、茎、叶等营养器官的出现和生长,“发育”则是 实体的特性识别和分析,利用已有的命名实体研究成 通常指生殖生长,包括成花、开花、结实的过程。植 果,将植物生长发育时期视作包含时间表达式的命名 物整个生长发育时期涉及到不同细胞间信号代谢通 实体进行研究和抽取,专门针对植物生长发育时期的 路、不同基因的表达以及基因网络的调控,因此,从 识别和抽取进行研究。 文本中抽取相关的植物生长发育时期对于生物医学文 2 相关研究综述 本挖掘研究具有重要的意义,不仅可以辅助建立植物 基因表达数据库、规范化实验过程数据,而且更有助 对时间信息的关注最早出现在消息理解会议 于基于文本的非相关文献知识发现,为科研人员提供 (Message Understanding Conference ,MUC )的评测, 潜在的研究方向。 随后MUC 把时间信息识别作为命名实体识别的一个子 植物生长发育时期从本质上来说是一种命名实 任务。MUC-7 会议上相对时间的识别扩展成为时间信 体 , 目 前 有 关 命 名 实 体 的 识 别 ( Named Entity 息抽取命名实体的时间识别子任务。真正推进时间信息 Recognition ,NER ),如地理行政、产品和基本名词短 抽取研究的是美国政府高级研究计划署( Defense 语实体 [1-3]等的识别已经成为自然语言处理领域最有 Advanced Research Projects Agency ,DARPA )的跨语言 价值的基础技术之一,被广泛应用于自动问答、信息 信息检测、抽取和摘要项目(Translingual Information 收稿日期:2013-09-10 收修改稿日期:2013-12-19 *本文系国家社会科学基金“面向知识服务的科学数据组织与应用研究”(项目编号:13CTQ035 )、中央高校基本科研业务费资助项目 “面向qRT-PCR 实验的内参基因挖掘技术研究”(项目编号:KYZ201159 )和南京农业大学SRT 计划项目“基于混和策略的植物生长发育 时期识别”(项目编号:1219A11 )的研究成果之一。 22 现代图书情报技术 总第 242 期 2014 年 第 1 期 Detection ,Extraction and Summarization ,TIDES )以及

您可能关注的文档

文档评论(0)

***** + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档