科研管理数据挖掘平台的设计与实现分析-通信与信息系统专业毕业论文.docxVIP

科研管理数据挖掘平台的设计与实现分析-通信与信息系统专业毕业论文.docx

  1. 1、本文档共63页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
万方数据 万方数据 A Dissertation Submitted in Partial Fulfillment of the Requirements for the Degree of Master of Engineering Design and Implementation of Data Mining Platform for Scientific Research Management Candidate: Feng Chenglin Major: Communication and Information System Supervisor: Prof. Wang Yuming Huazhong University of Science and Technology Wuhan, Hubei 430074, P. R. China Jan, 2014 独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研 究成果。尽我所知,除文中已经标明引用的内容外,本论文不包含任何其他个人或集 体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,均已在文中 以明确方式标明。本人完全意识到本声明的法律结果由本人承担。 学位论文作者签名: 日期: 年 月 日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有权保 留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本 人授权华中科技大学可以将本学位论文的全部或部分内容编入有关数据库进行检索, 可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。 本论文属于 保 密□,在 年解密后适用本授权书。 不保密□。 (请在以上方框内打“√”) 学位论文作者签名: 指导教师签名: 日期: 年 月 日 日期: 年 月 日 华 华 中 科 技 大 学 硕 士 学 位 论 文 摘 要 随着科研管理工作的信息化,科研管理各类数据快速增长和积累,海量科研管理 数据远远超出科研管理人员的理解和分析能力,传统的统计技术和数据管理工具已经 无法满足科研管理人员的数据分析需求。 各种不同类型面对海量的数据,科研管理人员希望开展分析,挖掘其中蕴含的价 值,有效地利用这些数据。然而,现有的科研管理数据分析,其工作重心仅在于“统 计”,“分析”功能局限,不能有效服务于管理决策咨询。为了实现对科研管理数据的 深入分析,本文构建了一个简便、高效、可扩展的数据挖掘平台。 各种不同类型 本文首先对科研管理数据分析的现状进行调研,了解当前数据分析中存在的不 足,并结合数据挖掘领域中的理论,梳理出数据挖掘平台的需求;然后采用 B/S 模式, 基于 Java EE 框架,以 Oracle 数据库作为数据仓库,以开源的 Lucene 全文检索引擎 和 Mahout 机器学习框架作为数据分析与挖掘工具,以 D3 和 Highcharts JS 作为数据 可视化工具,按照软件工程的流程,完成了数据挖掘平台各部分的分析、设计与实现; 最后,对平台进行整体测试和应用分析,以确保各功能模块的准确性和健壮性。本数 据挖掘平台基于开源框架开发,极大地加快了平台的开发周期,提升了平台的可移植 性、可扩展性和可维护性。 关键词:数据挖掘;数据仓库;机器学习;数据可视化 I II万方数据 II 万方数据 Abstract With informationization of scientific research management, various kinds of scientific research management data is being increased and accumulated rapidly. The massive data is far beyond the understanding and analysis ability of scientific research managers, and traditional statistical techniques and data management tools have been unable to meet the data analysis needs of scientific research managers. Faced with massive data, scientific research managers expect to achieve new heights of data analysis, then more valuable information will be digged, and data

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档