基于论文自动分类的社科类学科跨学科性研究.PDF

基于论文自动分类的社科类学科跨学科性研究.PDF

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于论文自动分类的社科类学科跨学科性研究

研究论文 基于论文自动分类的社科类学科跨学科性 研究* 刘 浏 1,2 王东波 2,3 1( 南京大学信息管理学院 南京 210023) 2(江苏省数据工程与知识服务重点实验室 南京 210023) 3( 南京农业大学信息科学技术学院 南京 210095) 摘要: 【目的 】使用机器学习自动分类的方法, 量化社科类论文的跨学科性。【方法】根据论文的题录信息, 使 用KNN 算法对社科类论文进行自动分类, 根据分类结果提出定量研究跨学科性的指标——跨学科度, 并提出其 计算方法。【结果】自动分类结果在各学科间呈现出较大的差异, 各学科的跨学科性对分类结果产生了较大的影 响, 自动分类结果与跨学科度之间存在直接关系, 进而可以用来计算跨学科度。【局限】尚未对跨学科性进行更 为深入、广泛的量化探究。【结论】使用机器学习方法量化研究跨学科性是一种有效的尝试。 关键词: KNN 文本分类 跨学科性 分类号: G350 DOI : 10.11925/infotech.2096-3467.2017.0822 学科中的影响力, 也因为跨学科性的存在, 而变得越 1 引 言 发复杂困难。深入考察期刊中的跨学科现象, 甚至度 如今科学技术飞速发展, 成果论文呈井喷式增长, 量跨学科的程度, 显得越发重要且紧迫。 学科分化与交叉不断深入。研究者需要从海量的学术 本文以机器学习技术为支撑, 利用文本自动分类 成果中迅速找到对自己有用的内容。对学术论文按学 结果与跨学科性之间存在的定量关系, 提出一种跨学 科进行分类, 能够帮助研究者节省大量的时间和精力, 科性的度量指标——跨学科度, 并提出有效利用自动 提高研究者的研究学习效率。 分类近似求解跨学科度的计算方法。 学术期刊作为学术研究成果的重要载体, 一直是 2 相关研究 研究者关注的焦点。从学科中具有较大影响力的期刊 中寻找自己可能需要的论文, 也是不少研究者检索论 对学术论文进行自动分类, 大多使用机器学习和 文的一种主要方式。一般而言, 期刊刊载其所在学科 自然语言处理中常用的文本分类技术, 比如朴素贝叶 的论文, 但其也会刊载与其他学科相关的论文, 这就 斯(NB)、支持向量机(SVM)、最大熵(ME)和K 最近邻 产生了期刊乃至学科的跨学科性。跨学科性的存在, (KNN)等[1-2], 大量的研究围绕在模型和算法的改进 体现了现代科学学科交叉的发展趋势, 然而这也使得 上, 如改进SVM[3-4]和改进KNN[5]等。近年, 随着深度 研究者想要通过特定期刊找到所需学科相关论文变得 学习的兴起, 利用卷积神经网络的文本分类方法也得 困难。判断期刊在学科分类中所处位置, 评价期刊在 到了一些有效的尝试[6-7] 。具体在论文自动分类方面, 通讯作者: 刘浏, ORCID: 0000-0002-4945- 1676, E-mail: liuliu.nju@。 *本文系国家自然科学基金管理学部青年项目“基于 CSSCI 的句法级汉英平行语料库构建及知识挖掘研究”(项目编号: 和江苏省普通高校学术学位研究生科研创新计划项目“引用内容分析—— 引文语义信息的自动挖掘”(项目编号: KYZZ16_0033)的研究 成果之一。 30 数据分析与知识发现 总第15 期 2018 年 第3 期 国内已有不少学者利用这些算法进行特定研究, 如利 康研究[31-32]等。也有很多研究致力于学科交叉性的评 用层次分类模型, 对中文科技论文的分类[8] 估, 如学科影响因子[33]

文档评论(0)

fengruiling + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档