软件工程 硕士学位论文开题报告.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE PAGE 7 攻读硕士学位研究生 硕士学位论文开题报告 题目:水量水费数据仓库的建立及其数据挖掘的研究 姓 名: 学 号: 院 系: 软件学院 专 业: 软件工程 研究方向: 数据挖掘 指导教师: 年 月 日 一、开题报告情况 报告要求:须就论文选题意义、文献资料掌握情况、论文研究方法、论文总体设计等方面进行详细的公开及书面报告,提请指导小组予以审查 开题报告审查记录 论文题目:水量水费数据仓库的建立及其数据挖掘的研究 时间: 地点: (一)论文选题意义及创新点 在自来水行业中,随着管理信息系统的发展,营业抄收管理系统上线多年,数据库积累了大量的营业数据。这些数据对企业来说是宝贵的资源,但是平时只限于事务处理和生成一些固定的报表,没有利用其对宏观上的决策分析。数据仓库和数据挖掘作为决策支持新技术在近些年来得到了迅速的发展。本课题主要是为满足工作中的数据分析决策需要,通过从营业数据库中对水量水费的历史数据抽取、转换、装载到数据仓库,从时间、行业类别、区域、口径多个维度进行数据立方体的建立,通过切片、切块、钻取和旋转的方法来对数据进行分析。对于数据仓库中的水量信息,采用数据挖掘的聚类方法,分析其分布规律,可以找出异常的数据并对其复查,分析其中的问题。对于用户迟交水费并产生基纳金的信息进行聚类分析,找出其分布规律。也可以采用决策树的方法来区分高信誉度和低信誉度的用户。 (二)国内、外相关文献掌握程度和研究方法的可靠性 [1] 林宇. 数据仓库原理与实践. 人民邮电出版社,2003 [2] W.HInmon. 数据仓库(原书第三版). 王志海,林友芳等译. 机械工业出版社,2003 [3] HYPERLINK /kcms/detail/%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20search.aspx?dbcode=CMFDsfield=auskey=%e6%9d%8e%e6%b0%b8%e8%83%9ccode \t _blank 李永胜. 电量电费数据仓库OLAP技术研究. 硕士学位论文,2007 [4] Bud Endress. Implementing the OLAP Option to the Oracle9i Database. Oracle Corporation,2002 [5] Paulraj Ponniah. Data Warehousing Fundamentals. Wiley Publishing,Inc,2004. [6] S.chaudhuri, U.Dayal. An Overview of Data Warehousing and OLAP Technology. ACM SSGMOD Record,1997,26(1) [7] 魏志鹏. 数据挖掘在自来水行业中的应用研究. 硕士学位论文,2010 [8] Pang-Ning Tan, Michael Steinbach, Vipin Kumar. 数据挖掘导论. 范明 范宏建等译. 人民邮电出版社,2006 数据仓库和数据挖掘现有的研究资料十分丰富,但收集整理适用于本论文研究方向的文献还需要一段时间。通过对现有业务数据建立数据仓库和数据挖掘的成功案例很多,有充足的案例供参考。 (三)论文总体设计的科学性 论文计划设计成以下框架: 引言,包括本文的研究背景,数据仓库和数据挖掘技术的国内外研究动态,课题的主要研究内容。 基本理论概述,介绍与本文研究相关的数据仓库和数据挖掘技术。 基于自来水营业数据的需求分析和数据仓库的建立。初步确定使用Oracle的Analytic Workspace Manager来建立数据立方体,并用来做分析。 数据仓库上的数据挖掘。对数据立方体切片、钻取,提取感兴趣维度上的数据进行数据挖掘,并提炼出有价值的知识。 结论与展望 (四)存在的主要不足 本论文研究的源数据是来自营业抄收系统的备份数据库,数据只是过往的历史数据,没有定时更新。由于企业内部数据的保密和安全,只抽取部分数据表,并在此基础上建立数据仓库,所以数据仓库的规模不大,但不影响本选题的研究。 建立数据仓库后的数据分析和数据挖掘暂时未定使用的软件,可能利用Oracle的Analytic Workspace Manager现有的分析工具完成,也可能利用Weka或者matlab连接到数据做分析,存在一点技术应用风险,但估计通过查找相关的开发资料可以解决。 现掌握和阅读的相关文献未够充分,但通过互联网和图书馆的资源可以解决。

文档评论(0)

小教资源库 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档