- 1、本文档共63页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
万方数据
万方数据
A Dissertation Submitted in Partial Fulfillment of the Requirements for the Degree of Master of Engineering
Design and Implementation of Data Mining Platform for Scientific Research Management
Candidate: Feng Chenglin
Major: Communication and Information System Supervisor: Prof. Wang Yuming
Huazhong University of Science and Technology Wuhan, Hubei 430074, P. R. China
Jan, 2014
独创性声明
本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研 究成果。尽我所知,除文中已经标明引用的内容外,本论文不包含任何其他个人或集 体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,均已在文中 以明确方式标明。本人完全意识到本声明的法律结果由本人承担。
学位论文作者签名: 日期: 年 月 日
学位论文版权使用授权书
本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有权保 留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本 人授权华中科技大学可以将本学位论文的全部或部分内容编入有关数据库进行检索, 可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。
本论文属于
保 密□,在 年解密后适用本授权书。
不保密□。
(请在以上方框内打“√”)
学位论文作者签名: 指导教师签名:
日期: 年 月 日 日期: 年 月 日
华
华 中 科 技 大 学 硕 士 学 位 论 文
摘 要
随着科研管理工作的信息化,科研管理各类数据快速增长和积累,海量科研管理 数据远远超出科研管理人员的理解和分析能力,传统的统计技术和数据管理工具已经 无法满足科研管理人员的数据分析需求。
各种不同类型面对海量的数据,科研管理人员希望开展分析,挖掘其中蕴含的价 值,有效地利用这些数据。然而,现有的科研管理数据分析,其工作重心仅在于“统 计”,“分析”功能局限,不能有效服务于管理决策咨询。为了实现对科研管理数据的 深入分析,本文构建了一个简便、高效、可扩展的数据挖掘平台。
各种不同类型
本文首先对科研管理数据分析的现状进行调研,了解当前数据分析中存在的不 足,并结合数据挖掘领域中的理论,梳理出数据挖掘平台的需求;然后采用 B/S 模式, 基于 Java EE 框架,以 Oracle 数据库作为数据仓库,以开源的 Lucene 全文检索引擎 和 Mahout 机器学习框架作为数据分析与挖掘工具,以 D3 和 Highcharts JS 作为数据 可视化工具,按照软件工程的流程,完成了数据挖掘平台各部分的分析、设计与实现; 最后,对平台进行整体测试和应用分析,以确保各功能模块的准确性和健壮性。本数 据挖掘平台基于开源框架开发,极大地加快了平台的开发周期,提升了平台的可移植 性、可扩展性和可维护性。
关键词:数据挖掘;数据仓库;机器学习;数据可视化
I
II万方数据
II
万方数据
Abstract
With informationization of scientific research management, various kinds of scientific research management data is being increased and accumulated rapidly. The massive data is far beyond the understanding and analysis ability of scientific research managers, and traditional statistical techniques and data management tools have been unable to meet the data analysis needs of scientific research managers.
Faced with massive data, scientific research managers expect to achieve new heights of data analysis, then more valuable information will be digged, and data
您可能关注的文档
- 面向石化企业的安全管理信息系统研究-软件工程专业毕业论文.docx
- 绝缘子故障诊断方法的研究-电力电子与电力传动专业毕业论文.docx
- 考虑热应力的复合材料界面性能分析-材料学专业毕业论文.docx
- 面向IPTV的分布式文件系统资源定位与调度模块设计与实现-计算机系统结构专业毕业论文.docx
- 螺旋铣孔虚拟样机设计与优化-机械制造及其自动化专业毕业论文.docx
- 面向语义网的自然语言查询接口研究-计算机科学与技术专业毕业论文.docx
- 面向仿生微通道的家蚕丝蛋白溶液剪切流变与滑移特性研究-工程力学专业毕业论文.docx
- 面向汽车装配的嵌入式生产监控技术研究与系统开发-机械电子工程专业毕业论文.docx
- 绿色物流战略规划问题研究-国际贸易学专业毕业论文.docx
- 煤矸石山自燃治理措施及其稳定性分析-岩土工程专业毕业论文.docx
- 绿色生态城区建设效果评价研究-项目管理专业毕业论文.docx
- 绿色供应链绩效评价体系与关键因素控制 协调研究-物流工程专业毕业论文.docx
- 门座式起重机中人字形构件的轻量化研究-机械工程专业毕业论文.docx
- 洛阳石化硫回收装置扩能与富氧化改造研究-化学工程专业毕业论文.docx
- 慢行交通的可适性分析和设计方法研究-交通运输规划与管理专业毕业论文.docx
- 面向自然灾害的我国应急物流中合作机制的研究-技术经济及管理专业毕业论文.docx
- 面向气象数据的智能分析方法分析-计算机应用技术专业毕业论文.docx
- 面向数字电视的WidgetGUI设计器的设计与实现-软件工程专业毕业论文.docx
- 绿色经济时代国际贸易发展的新趋势及我国的对策研究-世界经济专业毕业论文.docx
- 煤炭行业区域管理体制创新研究-系统工程专业毕业论文.docx
文档评论(0)