- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于BLSTM的科技文献术语抽取方法-情报工程-中国科学技术信息
DISCOVERY AND RESEARCH 探索与研究
doi:10.3772/j.issn.2095-915x.2018.01.008
基于BLSTM的科技文献术语抽取方法
赵东玥 1 杜永萍 1 石崇德 2
1. 北京工业大学信息学部 北京 100124;
2. 中国科学技术信息研究所 北京 100038
摘 要 术语抽取是研究科技文献领域的重要技术,为进一步提高科技文献术语抽取的准确率和召回率,
本文采用了基于 BLSTM(Bidirectional Long Short-Term Memory)的神经网络模型。使用预先
训练的词向量字典将中文分词结果映射为向量作为 BLSTM 模型的输入,使用序列标注的方法将输出
分类结果映射为术语的边界进行术语抽取。在自动化技术、计算机技术领域的数据集上,设计实验对
比了使用词为特征的 BLSTM 模型和条件随机场模型的抽取结果。结果表明基于 BLSTM 模型的科技
文献术语抽取得了更优的性能,在中文数据集上精确率最高 0.7821,召回率最高 0.8020,F1 值最高
0.7860,在英文数据集上分别达到 0.8525,0.8677 和 0.8543。
关键词:术语抽取;科技文献;长短时记忆
中图分类号:TP391,G35
开放科学(资源服务)标识码(OSID)
Scientific Literature Terms Extraction Based on Bidirectional Long
Short-Term Memory Model
1 1 2
ZHAO Dongyue DU Yongping SHI Chongde
1. Faculty of Information Science, Beijing University of Technology, Beijing 100124, China;
2. Institute of Scientific and Technical Information of China, Beijing 100038, China
Abstract Term extraction plays an important role in the field of scientific literature. In order to improve
the accuracy and recall of the term extraction, this research designed a neural network model based
on BLSTM (Bidirectional Long Short-Term Memory) model. The segmentation results in Chinese were
mapped into the vectors via pre-trained word vector dictionary, and the output of classification results were
项目基金: 国家自然科学基金青年基金项目“面向科技监测的实体识别与关系抽取研究”。
作者简介:赵东玥(1992-),硕士研究生,研究方向:自然语言处理,Email:zdy@;杜永萍(1977-),博
士,副教授,研究方向:信息检索,自然语言处理;石崇德(1979-),博士,副研究员,研究方向:自然语言处理、机器翻译。
TECHNOLOGY INTELLIGENCE ENGINEERING
2018 年第 4 卷 第 1 期 067
探索与研究 DISCOVERY AND RESEARCH
doi:10.3772/j.issn.2095-915x.2018.01.008
mapped as the term boundaries
您可能关注的文档
- 优质矮紧型白梗同源四倍体不结球白菜的诱导及-南京农业大学学报.PDF
- 会展法律资讯-东方律师网.PDF
- 伟迪捷43s墨水手册.DOC
- 传感器与执行元件基础.PPT
- 传统蒙药苏木六味汤散的质量标准-世界中医药.PDF
- 会走路的树走路早晨有趣陪美丽大概激动角告别当然好奇送.PPT
- 低VOC低成膜温度水性聚氨酯分散体的合成与表征-中国科技论文在线.PDF
- 低损宽频高双折射太赫兹光子带隙光纤鄢-物理学报.PDF
- 低温气调贮藏下氧气含量对双孢蘑菇品质的影响-农业机械学报.PDF
- 低温处理凡纳滨对虾仔虾全长cDNA文库及troponinI基因-水产科学.PDF
- 8 黄山奇石(第二课时)课件(共22张PPT).pptx
- 22《纸船和风筝》教学课件(共31张PPT).pptx
- 17 松鼠 课件(共23张PPT).pptx
- 23《海底世界》课件(共28张PPT).pptx
- 21《大自然的声音》课件(共18张PPT).pptx
- 第12课《词四首——江城子 密州出猎》课件 2025—2026学年统编版语文九年级下册.pptx
- 第2课《济南的冬天》课件(共42张PPT) 2024—2025学年统编版语文七年级上册.pptx
- 17 跳水 第二课时 课件(共18张PPT).pptx
- 第六单元课外古诗词诵读《过松源晨炊漆公、约客》课件 统编版语文七年级下册.pptx
- 统编版六年级语文上册 22《文言文二则》课件(共27张PPT).pptx
原创力文档


文档评论(0)