- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
4)聚类分析 同分析已经标识的数据对象的分类和预测不同,聚类分析数据对象且参照已知的类标识。通常,在训练数据中不存在简单的类标识,因为它们不知道从何处开始,但聚类能被用来产生这样的标识。对象根据最大化同类的相似性和最小化异类相似性的原理被聚类或分组。这样,形成的对象簇具有这样的特性,在簇内的对象相互之间具有高的相似性,但与其它簇的对象非常不相似。每个形成的簇可以看作一个对象类,从中可以推导出规则。聚类也有助于分类法的形成,即,观察对象可以按类的层次进行组织,相似的事件分组在一起。 聚类分析具有广泛的应用,包括市场或顾客分割、模式识别、生物学研究、空间数据分析、Web文档分类等等。聚类分析可以单独作为数据挖掘工具来研究数据的分布,也可以作为前期处理步骤,为其它数据挖掘算法对检测的簇进行操作提供帮助。 5)奇异点分析 一个数据库可能包含不服从一般特征或数据模型的数据对象。这些数据对象被称为奇异点。大多数数据挖掘方法将奇异点作为噪声或例外而丢弃。然而,在欺诈检测等应用中,这些稀有事件比规则发生的事件更有价值。奇异数据的分析被称为奇异点挖掘。 奇异点可以用统计实验(假设数据的一个分布或概率模型)来检测,或者利用距离测量,同任何其它簇对象距离非常远的对象被认为是奇异点。与使用统计或距离测量的方法不同,基于偏差的方法通过检查在一个组中对象的主要特性的不同来确定奇异点。 奇异点分析可以通过检测一个特定信用卡帐户的非常大额的购物行为,并将其同该帐户发生的消费规律进行比较,从而发现信用卡欺诈。 6)进化分析 数据的进化分析对其表现随时间变化的对象进行描述和建模。虽然有可能包括时间相关数据的描述、区分、关联、分类或聚类,这样分析具有不同的特性,如时间序列数据分析、序列或周期模式匹配、以及基于相似性的分析。 9.6.3 数据挖掘的对象 数据挖掘的对象主要是关系数据库和数据仓库,还涉及: 1.面向对象数据库(Object-Oriented Databases)。 2.对象-关系数据库(Object-Relational Databases)。 3.空间数据库(Spatial Databases)。 4.时间和时序数据库(Temporal Databases and Time-Series Databases) 5.文本和多媒体数据库(Text Databases and Multimedia Databases) 6.异构和遗留数据库(Heterogeneous Databases and Legacy Databases) 7.基于Web的全球信息系统(The World Wide Web) 9.6.4 数据挖掘的技术或方法 1)统计分析类 统计分析技术中使用的数据挖掘模型有线性分析和非线性分析、回归分析、逻辑回归分析、单变量分析、多变量分析、时间序列分析、最近邻算法和聚类分析等技术。 2)知识发现类 从数据仓库的大量数据中筛选信息,寻找市场可能出现的运营模式,发掘人们所不知道的事实。知识发现类数据挖掘技术包含人工神经网络、决策树、遗传算法、粗糙集、规则发现和关联顺序等。 3)其它数据挖掘技术 包含文本数据挖掘、Web数据挖掘、分类系统、可视化系统、空间数据挖掘和分布式数据挖掘等。 9.7 数据仓库与数据挖掘的应用 9.7.1 数据仓库的应用 数据仓库的建立可以解决传统数据库不能提供的分析决策功能,可以发掘历史数据中隐含的大量有价值的信息,为国民经济的发展和宏观决策提供大量有效的参考信息。数据仓库的开发是以主题展开的,根据主题的分析目标集成所有相关的数据信息,集成的数据量越大越全面,决策分析的结论就越客观越准确。数据仓库的建设是螺旋式的开发过程,随时间的推移,可以适应不同的主题需求。 1. 金融业数据仓库解决方案 数据仓库是金融银行机构实现客户关系管理(CRM)的核心技术,也是金融银行业竞争优势的来源,主要的应用业务部分为信用卡部、信贷部、市场部和零售业务部等,应用领域是以客户为中心的分销渠道管理、客户利润分析、客户关系优化、风险评估和管理。 (1)分销渠道的分析和管理 (2)利润评估模型 (3)客户关系优化 (4)风险评估和管理 * 银行只有通过以客户为中心(Customer Centric)的数据仓库决策支持系统,才能使用科学的方法实现个性化服务 数据仓库系统存放每一位客户同银行往来的详细的历史交易明细数据,对客户有统一的视图。 能帮助银行业务用户以科学的手段快速地分析、模拟和预测客户的个性化需求,进而设计符合客户需求的产品或服务。 通过客户喜好的渠道完成交易,是增强商业银行竞争能力最有效的手段。 * 什么是
您可能关注的文档
最近下载
- 2025《几何画板在数学教学中的应用研究文献综述》1800字.docx VIP
- 湘美版高中美术绘画 奏响色彩的旋律(共28张PPT)(内嵌视频).pptx VIP
- 规范《DLT555-2004-气体绝缘金属封闭开关设备现场耐压及绝缘试验导则》.pdf VIP
- 2025巧用几何画板开拓数学思维作一个角等于已知角教学思考.docx VIP
- 标日初级第1课练习.doc VIP
- Unit4EatwellSectionA2a-2e英文版教案人教版(2024)七年级英语下册.docx
- 教学经验分享.ppt VIP
- 2025届高考数学复习备考策略课件.pptx VIP
- 2013年考研英语一真题解析.pdf VIP
- 第2课 教师节快乐(教学设计)2025二年级上册道德与法治 - 副本.docx
文档评论(0)