基于高频词汇的英文文本可视化.docVIP

  • 12
  • 0
  • 约8.45千字
  • 约 7页
  • 2017-12-27 发布于天津
  • 举报
基于高频词汇的英文文本可视化.doc

基于高频词汇的英文文本可视化 刘春江 杨世瀚 杨宁 (国家科学图书馆成都分馆,四川 成都 610041) [摘要] 为探索高频词汇间上下文关系的远近,本文研究了一种基于英文文本中高频词汇的可视化算法流程,并进行了可视化实现。我们首先用统计算法从英文文本中抽取出高频词汇及词汇间的上下文,然后定义了三种词汇间的连接方式,计算出有上下文关系的词汇间的关系度,并通过k-means算法对词汇间的关系度进行聚类,以体现出词汇间关系的远近,最后利用放射状树布局对聚类结果进行可视化。通过这种可视化形式,我们能够快速理解英文文本的内容。 [关键词] 文本可视化;高频词汇;k-means聚类算法;放射状树布局 Visualization Based on High-frequency Words for English Text Liu Chunjiang Yang Shihan Yang Ning (Chengdu Branch of the National Science Library, CAS, Chengdu 610041, China) [Abstract] Targeting at exploring whether high-frequency words’context relations are close or distant,this paper studies on the

文档评论(0)

1亿VIP精品文档

相关文档