《科学数据管理办法》语词分析.docx

? ? 《科学数据管理办法》语词分析 ? ? 温亮明 李洋 张丽丽 摘 要 文章分析了《科学数据管理办法》的文本语词,有助于把握国家对科学数据管理的政策导向。文章对《科学数据管理办法》的文本内容进行分词、词频合并、词性筛选、虚词剔除等预处理操作,基于文本预处理结果筛选得出频繁词和热词,构建“语词—条款”共现矩阵并可视化展示。研究发现:《科学数据管理办法》共有11个核心频繁词、9个重点频繁词、8个主要频繁词和若干个一般频繁词,各主题语词在文本中均有对应的核心条款,但主题语词和核心条款分布不均。 Key 《科学数据管理办法》? 自然语言处理 词频统计 关联分析 分类号 G322.0 DOI 10.16810/ki.1672-514X.2020.05.015 Abstract Analysis of the text words of Measures for Managing Scientific Data can help to grasp the policy orientation of national scientific data management. Firstly, this paper performs some pre-processing operations such as word segmentation, word frequency mergi

文档评论(0)

1亿VIP精品文档

相关文档