- 179
- 0
- 约2.4万字
- 约 9页
- 2018-10-05 发布于天津
- 举报
基于LDA主题模型的文献关联分析及可视化研究-中国科学院文献情报.PDF
应用论文
基于LDA 主题模型的文献关联分析及
可视化研究
王 丽 邹丽雪 刘细文
( 中国科学院文献情报中心 北京 100190)
( 中国科学院大学 北京 100049)
摘要: 【目的 】基于机器学习进行有效的科研主题发现与分析建模研究。【方法】以 LDA 主题模型为基础进行
科研主题发现, 通过Python 语言实现分析建模, 关联分析科研主题的年代、机构、基础研究与应用研发等信息,
对比披露了各年代、机构的研发重点及基础研究和应用研究的差异, 并对结果进行可视化。【结果】基于101 813
条石墨烯领域的论文和专利数据进行实证分析, 结果表明通过建模进行12个主题的发现、关联分析及其可视化
全流程可在很短时间(约2分钟) 内完成, 通过机器学习的手段突破了传统分析工具以及数据分析体量的局限性,
提升了针对大量文本数据信息挖掘及分析的效率。【局限】尚未探讨主题间关联关系权重及主题演进等涉及复杂
网络分析的内容。【结论】机器学习对情报分析有着无限可能, 需要基于实际需求开发更多有效的分析模型, 满
足大文本分析和可视化。
关键词: LDA 主题模型 数据分析 机器学习 Python 数据可视化
分类号: TP393
DOI : 10.11925/infotech.2096-3467
原创力文档

文档评论(0)