面向学术文献知识挖掘方法研究.docVIP

下载本文档

13
0
约1.1万字
约 20页
2018-09-22 发布于福建
举报
版权申诉

面向学术文献知识挖掘方法研究.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

面向学术文献知识挖掘方法研究

面向学术文献知识挖掘方法研究　　〔摘要〕学术文献中包含的大量有价值的知识往往无法在摘要中体现出来。本文提出一种基于位置加权的核心知识挖掘方法，旨在以句为知识处理粒度，抽取正文中的核心句子作为独立的知识单元。该方法通过量化句子间的关联，将正文表示成一个以句子为节点，句子间关联为边的文本关系网络，提出基于章节的位置加权算法，结合社会网络分析方法，挖掘出文本中核心知识单元部分的句子。实验结果表明，该方法可以实现对文章核心章节中重要句子的抽取，达到初步预期效果。　　〔关键词〕学术文献；知识挖掘；方法；位置加权；知识抽取；文本网络；社会网络分析　　DOI：10.3969/j.issn.1008-0821.2017.05.009 　　〔中图分类号〕G203〔文献标识码〕A〔文章编号〕1008-0821（2017）05-0047-05 　　Research on Method of Knowledge Minning in Academic DocumentsWang KaiSun JiqingLi Nan 　　（Institute of Science and Technology Information，East China University of 　　Science and Technology，Shanghai 200237，China）　　〔Abstract〕There is abundant valuable knowledge inside academic documents that is not revealed in abstracts.This paper promoted a method of core knowledge discovery based on position weights，aiming to extract the core sentences as separated knowledge units in the main text with the processing size of sentence.By measuring the connection between sentences，the paper transformed main text into a text network that considers sentences as dots and connection between sentences as sides.An algorithm to compute position weights based on chapters was promoted in this paper.With the help of social network analysis，the paper could find sentences that revealed the core knowledge of the text.The result of the experiment showed that this method could realize the extraction of key sentences in the core chapter from the text，which is primarily expected. 　　〔Key words〕academic documents；knowledge minning；method；position weight；knowledge extraction；text network；social network analysis 　　互联网技术的发展使得信息，尤其是文本信息呈爆炸式的发展，在海量的文本信息面前，人们希望可以从中抽取出最关键最有价值的信息，并转化成知识进行存储应用。学术文献中包含大量有学术价值的知识，特别是期刊论文，凝聚着科学家的研究成果与智慧，论文中知识点非常丰富，而且比较新颖，实现自动对学术文献中的关键知识进行提取并利用是一个研究趋向。学术文献与其他类型的文献，如新闻、博客、网页等文献不同，学术文献具有独特的结构化特性，其基本形式为标题、摘要、关键词、正文、参考文献组成；而正文又通常包括引言、相关研究、方法、实验、结论几大部分。早期的研究主要是针对学术文献的题录信息来研究学术文献中所包含的主题内容，利用标题、关键词、参考文献以及摘要作为研究对象。摘要和关键词虽然可以对文献的内容进行高度概括和总结，但是却往往没有体现文献中的核心知识，这些核心知识往往包含在正文之中。为更好地挖掘文献中内涵的知识，本文提出一种位置加权的方法，以句子为粒度，将学术文献正文表