数据挖掘与其工业应用.pdfVIP

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

数据挖掘与其工业应用

选题

§意义:数据挖掘技术的发展及其广泛应用

§方法:阅读相关文献了解国内外数据挖掘发展状

况,并加以实用举例分析。

2

论文结构

§数据挖掘技术理论

起源,定义,数据特征,应用现状

§数据挖掘应用实例

医药领域:两种聚类算法及其性能比较

证券领域:BP算法预测股市实例

3

数据挖掘理论

§数据挖掘溯源及“尿布与啤酒”的故事

§数据挖掘是从大量的数据中挖掘出隐含的,位置的,

用户可能感兴趣的和对决策有潜在价值的知识和规则。这

些规则蕴含了数据库中一组对象之间的特定关系,揭示出

一些有用的信息,可以为经营决策、市场策划和金融预测

等方面提供依据。

§数据挖掘大体上有两种功能,即预测/验证功能和描述

功能

§应用十分广泛,从政府管理决策、商业经营、科学研

究到工业决策支持

4

数据挖掘应用实例

§在医药领域的应用

§GK算法

5

两种聚类算法的比较

6

§不同的聚类算法对同一数据集的聚类结果是不尽相同

的,聚类效果和性能可以通过迭代步骤IS)、分组指数

PI)、分离指数SI)、XBI几个指标进行评价。如下表

格所示。

§ISPISIXBI

§GK聚类701.06460.01333.3545

§FCM聚类340.87300.00772.2854

7

§迭代步骤:两种方法都是迭代算法,由上表可以看出

GK聚类算法没有FCM快,因为GK是距离自适应而后者是距离

固定的。

§分组指数:它是每个分组紧致性和分离度比值之和,

在比较有相同聚类个数方法的分组有效性是非常有用的。

§分离指数:它是每个分组的紧致性与最小距离分离度

比值之和。

§XBI:它是衡量每个类的紧致性和类与类之间的分离

性的指标。

§由以上表格中的对比可以看出,GK算法得出的每个类

是紧致的,类之间的分离度较高,因此聚类效果好。

8

BP算法预测股市

9

10

结论

§数据挖掘从理论研究到产品开发只用了短短数年,目前在

国内外已经进入到应用阶段。数据挖掘技术的应用十分广

泛,从政府管理决策,商业经营,科学研究到工业决策支

持等各个领域都可以找到数据挖掘的用武之

文档评论(0)

1亿VIP精品文档

相关文档