- 1、本文档共18页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据仓库报告-赖辉
深圳大学研究生课程论文
题目 数据仓库报告 成绩
专业 软件工程 课程名称、代码 161023050015
年级 2015级 姓名 赖 辉
学 号 2150230507 时间 2015 年 12 月
任课教师 黄哲学 、王熙照
一、摘要
随着我国经济的快速发展,消费水平的提高,银行信用卡业务的数据挖掘越来越体现出它的价值。本文旨在分析银行信用卡业务,在相关客户特征数据下,建立规法的数据仓库。通过建立信用卡的数据仓库,银行人员可以通过相关数据分析客户群体的特征,消费额度,信用状态等信息,也可通过SAS数据挖掘工具的决策树模型进一步挖掘出影响客户信用状况的因素。建立信用卡数据仓库能为每个有经济活动的客户建立一套合理的信用档案,并在数据仓库的基础上,通过数据挖掘分析、数据探索、数据挖掘和分类等,得到客户的信用评分模型。
二、需求分析
1.背景
1.1问题背景
随着国内消费水平的提高,支付方式更加便捷,信用卡已渐渐成为普遍的消费信贷工具,更多的人通过信用卡进行提前消费,这使得社会对消费信贷的需求迅速扩大。我国五大商业银行均发行信用卡,据相关数据统计,截止2013年末,全国信用卡累计发卡3.91亿张,12家上市银行2014年上半年信用卡累计交易额总计达54373亿元。
1.2研究问题必要性
虽然银行在多年的发展过程中业务和数据管理日趋完善,累积了大量客户数据和经营数据,但这些数据若能加以处理分析,必定能挖掘出更多有价值的信息。并随着消费群体的增大,信用卡持有人数的增多,市场扩展以及其他业务竞争的日益加剧,建立健全的信用卡数据仓库显得特别重要。银行决策人员希望通过数据仓库的辅助决策信息,更直观、简洁的数据信息。
1.3数据仓库的建立
数据库都是大多采用关系数据模型为主,而数据仓库旨在为决策人员提供针对该主题的辅助决策信息,大多都采用多维数据模型进行设计的。银行信用卡数据仓库在原有关系型数据库的基础上建立逻辑数据仓库,提供快速检索、数据分析并进行优化。
1.4关键问题
由于银行中客户量较大,所包含的信息也特别多,在建立信用卡数据仓库时必须要考虑到以下几个问题:及时性、少占用系统资源、高效性、结果简洁直接等。只有充分考虑到这些问题才能更好的利用客户的特征数据和交易数据,从而提高效益。
2.假定与约束
2.1假定
因为本次只是建立信用卡数据仓库的模型,不需要建立完整可行的数据仓库,故设计周期控制在两周左右。考虑到数据仓库的实用性,要求在设计过程中尽可能的为银行决策人员提供决策依据,提高效益。
2.2相关技术与工具
数据仓库(Data Warehouse,简称DW或DWH),是为企业所有级别的决策定制过程,它提供所有类型数据支持的战略集合,以及指导业务流程改进、监视时间、成本、质量以及控制,并形成用户分析性报告和决策支持目的。它是一个面向主题的、集成的、稳定的、不同时期的数据集合。数据仓库研究和解决从数据库中获取消息的问题,主要特征有面向主题、集成性、稳定性和时变性。
不同于面向事务设计的数据库,数据仓库面向主题,并存储的是历史数据,采用反范式的方式设计,其目的是为了方便分析数据。它的两个基本元素是维表和事务表,维度表是用户分析数据的窗口,它包含事务数据表中事实记录的特性及帮助汇总数据的特性的层次结构。每个数据仓库都包含一个或者多个事务表,它可能包含业务销售数据。一般来说,一个事实数据表都要和一个或者多个维度表相关联。
2.3可行性研究
以下根据该项目的技术、人力、资源、资金等方面做了衡量和比较,最终得出的结论是:可以立项。
技术可行性 数据仓库模型的设计在国内已经相当成熟,设计人员只需要在清楚业务流程的基础上,对数据库的数据做进一步的细化、分析。自顶向下、逐步求精的建立完整的概念模型、逻辑模型以及物理模型即可。
资源可行性 数据仓库建模的需要用到银行信用卡以及银行数据库方面的数据,这些经过查阅资料,与银行决策人员沟通交流就能得到,不存在较大问题。
经济可行性 数据仓库建模需要用到的设计工具(如画图工具、文档编写工具等)都有免费的应用,也不存在任何维护费用及经费问题,没有较大的经济花销,故经济上可行。
3.功能性需求
3.1概念模型设计
图2-3.1-1 信用卡CMCC-LDM概念模型
根据银行信用卡的业务以及与客户之间的关系,银行信用卡账户的概念模型设计主要分为八个主题:客户、服务、信用卡业务、账务、结算、资源、客服、营销。其中
您可能关注的文档
- 数字逻辑电路设计-多功能数字钟.doc
- 数字逻辑经典ppt系列之6-6.ppt
- 数字逻辑经典ppt系列之8-4.ppt
- 数字逻辑第五章2014.ppt
- 数学专业高等代数考研第1讲 行列式.ppt
- 数学专业高等代数考研复习第3讲 矩阵.ppt
- 数字图像处理讲座课件.ppt
- 数学二年级上人教新课标1.1统一长度单位、认识厘米、用厘米量课件.ppt
- 数学九年级上华东师大版锐角三角函数(二课时)课件.ppt
- 数字示波器基础.ppt
- 2024年江西省寻乌县九上数学开学复习检测模拟试题【含答案】.doc
- 2024年江西省省宜春市袁州区数学九上开学学业水平测试模拟试题【含答案】.doc
- 《GB/T 44275.2-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第2部分:术语》.pdf
- 中国国家标准 GB/T 44275.2-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第2部分:术语.pdf
- GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构.pdf
- 《GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构》.pdf
- 中国国家标准 GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构.pdf
- GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南.pdf
- 中国国家标准 GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南.pdf
- 《GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南》.pdf
最近下载
- 小学一年级家长会语文老师PPT课件1_图文.ppt
- 奥鹏云南开放大学 小学语文案例教学(20秋)形考作业4(客观).doc VIP
- 沅陵大曲酒厂续建项目(重大变更) 环境影响报告书.pdf
- SH∕T 1541.1-2019 塑料颗粒外观试验方法 第1部分:目测法.pdf
- 泳池清洁机器人.pdf VIP
- 中职高考语文二轮复习写作技巧专项突破专题01 应用文写作-技巧与练习(含详解).docx VIP
- (人教版)数学三年级上册计算题“天天练”习题卡,含100份题组,附参考答案.doc
- 【新教材】人教PEP版(2024)三年级上册英语Unit 1 Making friends单元整体教学设计.docx
- 乡村学校德育工作实践.docx VIP
- “国家中小学智慧教育平台”培训方案(2).doc
文档评论(0)