- 12
- 0
- 约8.45千字
- 约 7页
- 2017-12-27 发布于天津
- 举报
基于高频词汇的英文文本可视化.doc
基于高频词汇的英文文本可视化
刘春江 杨世瀚 杨宁
(国家科学图书馆成都分馆,四川 成都 610041)
[摘要] 为探索高频词汇间上下文关系的远近,本文研究了一种基于英文文本中高频词汇的可视化算法流程,并进行了可视化实现。我们首先用统计算法从英文文本中抽取出高频词汇及词汇间的上下文,然后定义了三种词汇间的连接方式,计算出有上下文关系的词汇间的关系度,并通过k-means算法对词汇间的关系度进行聚类,以体现出词汇间关系的远近,最后利用放射状树布局对聚类结果进行可视化。通过这种可视化形式,我们能够快速理解英文文本的内容。
[关键词] 文本可视化;高频词汇;k-means聚类算法;放射状树布局
Visualization Based on High-frequency Words for English Text
Liu Chunjiang Yang Shihan Yang Ning
(Chengdu Branch of the National Science Library, CAS, Chengdu 610041, China)
[Abstract] Targeting at exploring whether high-frequency words’context relations are close or distant,this paper studies on the
您可能关注的文档
最近下载
- 2026年上海徐汇区高三下学期学习能力诊断(二模)历史试卷含详解.docx VIP
- GB50235-2010 工业金属管道工程施工规范.pdf VIP
- 年产5000吨白葡萄酒工厂初步设计方案.pdf VIP
- 16D401-5 水下及潮湿环境电气设备设计与安装.docx VIP
- 编译原理期末考试试卷及答案.pdf VIP
- 天津市蓟州区八年级下学期期中语文试卷及答案.docx VIP
- NB∕T 31026-2022 风电场工程电气设计规范(2-1).pdf
- 编译原理期末考试试卷与答案.docx VIP
- 中国精神心理疾病家庭治疗指南(2025).docx VIP
- 汕头市2026届高三(二模)数学试卷(含答案).pdf
原创力文档

文档评论(0)