第八组数据挖掘摘要
(3) 聚类 数据库中的记录可被化分为一系列有意义的子集,即聚类。例如:将申请人分为高度风险申请者、中度风险申请者、低度风险申请者。聚类增强了人们对客观现实的认识,是概念描述和偏差分析的先决条件。 聚类技术主要包括传统的模式识别方法和数学分类学。80年代初,Mchalski提出了概念聚类技术,其要点是,在划分对象时不仅考虑对象之间的距离,还要求划分出的类具有某种内涵描述,从而避免了传统技术的某些片面性。例如:市场销售: 帮助市场人员发现客户中的不同群体,然后用这些知识来开展一个目标明确的市场计划;保险公司: 对购买了汽车保险的客户,标识那些有较高平均赔偿成本的客户; (4)分类 按照分析对象的属性、特征,建立不同组来描述事物。例如银行部门根据以前的数据将客户分成了不同类别,现在就可以根据这些来区分新申请贷款的客户,以采取相应的贷款方案。 例如:把客户分为高风险客户和低风险客户 (5) 预测 把握分析对象的发展规律,对未来的趋势做出预见。数据挖掘自动在大型数据库中寻找预测性数据,以往需要进行大量手工分析的问题如今可以迅速直接由数据本身得出结论。 一个典型的例子:市场预测问题。数据挖掘使用过去有关促销的数据来寻找未来投资中回报最大的用户,其它可预测的问题包括预报破产以及认定对指定事件最可能作出反应的群体。(例如,股票。从报表等预
您可能关注的文档
- 第五粪便检验摘要.ppt
- 第五系列单片机在工业控制中的应用摘要.ppt
- 第五纺织品印花摘要.ppt
- 第五组webgis的发展方向摘要.ppt
- 第五细胞的生命历程摘要.ppt
- 第五经典电磁学2摘要.ppt
- 第五糖类结构与功能摘要.ppt
- 第五糖代谢摘要.ppt
- 第五经典电磁学摘要.ppt
- 第五统计推断例题摘要.ppt
- 2026住宅小区消防改造建筑方案(执行版,含总平面布置/疏散流线/消防节点).docx
- 2026制造工厂人力资源规划与排班配置方案(执行版,含排班模型/岗位编制/缺口清单).docx
- 2026人工智能企业内训实施计划(执行版,含培训安排/案例任务/考核清单).docx
- 2026仓储物流园总平面布置建筑方案(执行版,含车流组织/仓位分区/消防间距).docx
- 2026老旧办公楼节能改造建筑方案(执行版,含围护结构/节能设备/施工节点).docx
- 2026Python文件批量重命名与归档脚本方案(执行版,含文件样例/处理脚本/归档规则).docx
- 2026企业会计准则长期股权投资核算指南(执行版,含成本法分录/权益法分录/减值检查表).docx
- 2026社区养老服务中心项目可行性研究报告(执行版,含服务需求/建设内容/运营预算).docx
- 2026物流园冷链仓储项目可行性研究报告(执行版,含选址分析/设备配置/财务测算).docx
- 2026企业会计准则现金流量表编制口径手册(执行版,含分类口径/填报模板/勾稽检查表).docx
原创力文档

文档评论(0)