公共管理HITS算法在文本聚类结果特征提取中地应用.pdfVIP

公共管理HITS算法在文本聚类结果特征提取中地应用.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
公共管理HITS算法在文本聚类结果特征提取中地应用

四、 五、 .上 /、、 ·中文论著摘要· HITS算法在文本聚类结果特征提取中的应用 目 的 Search)算法,对高被引论文进 本次研究基于HITS(Hypertext.InducedTopic 行同被引聚类分析,提取出聚类结果中每一类的特征词,客观的描述聚类分析结 果。开发出能够自动提取关键词的程序,排除分析者的阅读能力、理解能力和归 纳能力等主观性,不受所研究的文本量大小的限制,使科研人员更准确更容易的 分析聚类结果,为进一步做研究服务。 材料与方法 of traumaticcord spinalinjury)有关的文献,并套录每篇文献的引文。采用书目信息 Matrix ItemCo-Occurrence 共现挖掘系统(Bibliographic 文数据,截取被引次数超过某一阈值的论文,处理得到这些论文的同被引矩阵。 11.5for 导入到SPSS 文献的摘要信息。对摘要中的词汇进行预处理,截词根,去停词。依据TFIDF算 法为每个词赋予其在每一类论文集的权重。基于HITS算法提取关键词。然后将 算法提取的关键词和PUBMED标引的主题词分别与对照论文相比较。 镗 毋 耋口7尺 检索得到219条文献,5320篇引文。得到70篇高频引文,分成四类。通过 14,web框架是strutsl.2开发出关键词提取程序。 java程序,JDK版本是JDKl.6 对于每一类,算法提取的关键词和PUBMED标引的主题词的准确率分别为:30 %,40%;50%,50%;10%,20%;20%,0。对于算法提取出的关键词,每一 类中的词与其它类中的词均不相同。这说明,HITS算法提取出的词能够区分各类 别的特点。而对于PUBMED标引的关键词,除了第三类能够代表该类以外,另外 三类都不能与其它两类更好的区分开。 结论 HITS算法用于聚类结果的特征提取是可以实现的,并且能有效的发现关键 词,提取出聚类结果中每一类的特征词,客观的描述聚类分析结果。使科研人员 更准确更容易的分析聚类结果,为进一步做研究服务。 关键词 HITS算法;关键词提取;同被引聚类分析;聚类树图 2 ·英文论著摘要· HITS infeature of algorithm extracting text results clustering Purpose the to This isbasedon HITS extractthe foreachcluster study algorithm keywords todescribethe results aimedto results,and clusteringanalysisobjectively.We deve

文档评论(0)

yyongrjingd7 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档