引文元数据的自动发现和标注方法研究-北京玛格泰克科技发展有限公司
总第1 期 2017 年 第1 期
引文元数据的自动发现和标注方法研究
—— 以外文引文为例
姜 霖 1, 2 王东波 3
1( 南京大学信息管理学院 南京 210023)
2(江苏省数据工程与知识服务重点实验室 南京 210023)
3( 南京农业大学信息科学技术学院 南京 210095)
摘要: 【目的 】在总结当前引文元数据抽取方法的基础上, 结合语义学知识和机器学习方法, 对引文元数据的自
动抽取方法进行探索。【方法 】实验中采用神经网络模型对人工分割过的语料进行词向量训练。利用相同类型的
元数据会相对集中地出现在向量空间中某一位置的现象, 通过支持向量机分类算法实现对元数据的自动归类和
标注。【结果 】在以外文引文数据作为测试集的实验中, 本文方法取得了较高的准确率和召回率, 特别是针对引
文中含有多种语言和缩写的现象, 具有较好的处理能力。【局限 】在对于引文元数据时间内容的细粒度抽取中存
在一定的局限性。【结论 】实验结果表明, 此方法在引文元数据的自动发现和标注上具有良好的效果, 并能很大
程度地提高方法的适用性和容错率。
关键词: 引文元数
您可能关注的文档
- 国小二年级学童主题式阅读之行动研究.PPT
- 国文老师间无论情感或知识交流都更紧密愿有效推动阅读.PPT
- 国小学生参与休闲活动对身J心健康差异之研究-真理大学.PDF
- 国有企业宏观效率论辨析-中国科技论文在线.PDF
- 国有大型总分公司式企业集团决策控制评价及实证分析.PDF
- 国有经济含义即全民所有制经济.PPT
- 国有股股利股息.PPT
- 国民乐派与音乐家的介绍.PPT
- 国民健康保险手册2018.PDF
- 国民收入扩张.PPT
- 2026年酒店业精益管理提质减耗报告.docx
- 2026年智能穿戴设备行业报告及市场潜力评估.docx
- 2026年旅游行业报告:NFT在数字藏品与版权保护中的应用前景.docx
- 2026年虚拟现实行业研究报告:后疫情时代应用场景拓展与市场前景.docx
- 2026年金融科技物联网监控安全报告.docx
- 2026年医药行业原材料采购、库存监控与呆滞料处理指南报告.docx
- 2026年房地产经纪行业线上引流与线下成交策略报告.docx
- 2026年数字文创产业发展报告:NFT、数字藏品、版权保护策略.docx
- 2026年人工智能产业报告:行业竞争格局与CR3、CR5、CR10动态解析.docx
- 2026年互联网教育行业市场趋势分析与研究报告.docx
最近下载
- 经传指标公式最新(文档4篇).doc VIP
- DB31T1400-2023 药品生产全过程数字化追溯体系建设和运行规范 (2).pdf VIP
- 300MW汽轮机本体检修作业指导书.doc VIP
- 医院预防艾滋病、梅毒和乙肝母婴传播培训.pptx
- D-Z-T 0070-2016 时间域激发极化法技术规程(正式版).docx VIP
- 三合一分类方案.doc VIP
- 康力D10C804扶梯电气图.V1.0.pdf VIP
- Unit+4+Section+B+(1a-1f)+课件+2025-2026学年人教版(2024)八年级英语上册.pptx VIP
- 肺癌术后胸腔闭式引流护理查房.pptx VIP
- 人教版英语七年级下册期末试卷(含答案).pdf VIP
原创力文档

文档评论(0)