基于大数据挖掘的科技项目查重模型研究.pdfVIP

  • 14
  • 0
  • 约1.54万字
  • 约 6页
  • 2017-09-08 发布于北京
  • 举报

基于大数据挖掘的科技项目查重模型研究.pdf

数字技术 基于大数据挖掘的科技项目查重模型研究* 李善青,赵 辉,宋立荣 摘 要 科技项目查重是避免重复立项、重复建设的重要措施之一,目前缺乏行之有效的方法。文 章提出基于大数据挖掘和多源信息整合的项目查重方法,以科技项目的基本信息、发表论文信息、 关键词、负责人信息和承担机构等要素构建的大数据网络为研究对象,利用多源信息整合方法构建 科技项目的相似度判别模型,并采用Hadoop 框架实现海量数据的快速挖掘。文章介绍项目查重模 型,重点讨论需要解决的关键问题,为解决项目查重问题提供一种全新的思路和方法。 关键词 大数据挖掘 多源信息整合 科技项目查重 Hadoop 架构 引用本文格式 李善青,赵辉,宋立荣. 基于大数据挖掘的科技项目查重模型研究[J]. 图书馆论坛, 2014 (2):78- 83. Study on Detection Model of Similar Scientific Project Based on Big Data Mining LI Shan- qing,ZHAO Hui ,SONG Li- rong Abstract Checking out similar project is very important to avoid repetition in project approv

文档评论(0)

1亿VIP精品文档

相关文档