基于BLSTM的科技文献术语抽取方法-情报工程-中国科学技术信息.PDFVIP

基于BLSTM的科技文献术语抽取方法-情报工程-中国科学技术信息.PDF

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于BLSTM的科技文献术语抽取方法-情报工程-中国科学技术信息

DISCOVERY AND RESEARCH 探索与研究 doi:10.3772/j.issn.2095-915x.2018.01.008 基于BLSTM的科技文献术语抽取方法 赵东玥 1 杜永萍 1 石崇德 2 1. 北京工业大学信息学部 北京 100124; 2. 中国科学技术信息研究所 北京 100038 摘 要 术语抽取是研究科技文献领域的重要技术,为进一步提高科技文献术语抽取的准确率和召回率, 本文采用了基于 BLSTM(Bidirectional Long Short-Term Memory)的神经网络模型。使用预先 训练的词向量字典将中文分词结果映射为向量作为 BLSTM 模型的输入,使用序列标注的方法将输出 分类结果映射为术语的边界进行术语抽取。在自动化技术、计算机技术领域的数据集上,设计实验对 比了使用词为特征的 BLSTM 模型和条件随机场模型的抽取结果。结果表明基于 BLSTM 模型的科技 文献术语抽取得了更优的性能,在中文数据集上精确率最高 0.7821,召回率最高 0.8020,F1 值最高 0.7860,在英文数据集上分别达到 0.8525,0.8677 和 0.8543。 关键词:术语抽取;科技文献;长短时记忆 中图分类号:TP391,G35 开放科学(资源服务)标识码(OSID) Scientific Literature Terms Extraction Based on Bidirectional Long Short-Term Memory Model 1 1 2 ZHAO Dongyue DU Yongping SHI Chongde 1. Faculty of Information Science, Beijing University of Technology, Beijing 100124, China; 2. Institute of Scientific and Technical Information of China, Beijing 100038, China Abstract Term extraction plays an important role in the field of scientific literature. In order to improve the accuracy and recall of the term extraction, this research designed a neural network model based on BLSTM (Bidirectional Long Short-Term Memory) model. The segmentation results in Chinese were mapped into the vectors via pre-trained word vector dictionary, and the output of classification results were 项目基金: 国家自然科学基金青年基金项目“面向科技监测的实体识别与关系抽取研究”。 作者简介:赵东玥(1992-),硕士研究生,研究方向:自然语言处理,Email:zdy@;杜永萍(1977-),博 士,副教授,研究方向:信息检索,自然语言处理;石崇德(1979-),博士,副研究员,研究方向:自然语言处理、机器翻译。 TECHNOLOGY INTELLIGENCE ENGINEERING 2018 年第 4 卷 第 1 期 067 探索与研究 DISCOVERY AND RESEARCH doi:10.3772/j.issn.2095-915x.2018.01.008 mapped as the term boundaries

文档评论(0)

suijiazhuang1 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档