- 1、本文档共12页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
数据挖掘与其工业应用
选题
§意义:数据挖掘技术的发展及其广泛应用
§方法:阅读相关文献了解国内外数据挖掘发展状
况,并加以实用举例分析。
2
论文结构
§数据挖掘技术理论
起源,定义,数据特征,应用现状
§数据挖掘应用实例
医药领域:两种聚类算法及其性能比较
证券领域:BP算法预测股市实例
3
数据挖掘理论
§数据挖掘溯源及“尿布与啤酒”的故事
§数据挖掘是从大量的数据中挖掘出隐含的,位置的,
用户可能感兴趣的和对决策有潜在价值的知识和规则。这
些规则蕴含了数据库中一组对象之间的特定关系,揭示出
一些有用的信息,可以为经营决策、市场策划和金融预测
等方面提供依据。
§数据挖掘大体上有两种功能,即预测/验证功能和描述
功能
§应用十分广泛,从政府管理决策、商业经营、科学研
究到工业决策支持
4
数据挖掘应用实例
§在医药领域的应用
§GK算法
5
两种聚类算法的比较
6
§不同的聚类算法对同一数据集的聚类结果是不尽相同
的,聚类效果和性能可以通过迭代步骤IS)、分组指数
PI)、分离指数SI)、XBI几个指标进行评价。如下表
格所示。
§ISPISIXBI
§GK聚类701.06460.01333.3545
§FCM聚类340.87300.00772.2854
7
§迭代步骤:两种方法都是迭代算法,由上表可以看出
GK聚类算法没有FCM快,因为GK是距离自适应而后者是距离
固定的。
§分组指数:它是每个分组紧致性和分离度比值之和,
在比较有相同聚类个数方法的分组有效性是非常有用的。
§分离指数:它是每个分组的紧致性与最小距离分离度
比值之和。
§XBI:它是衡量每个类的紧致性和类与类之间的分离
性的指标。
§由以上表格中的对比可以看出,GK算法得出的每个类
是紧致的,类之间的分离度较高,因此聚类效果好。
8
BP算法预测股市
9
10
结论
§数据挖掘从理论研究到产品开发只用了短短数年,目前在
国内外已经进入到应用阶段。数据挖掘技术的应用十分广
泛,从政府管理决策,商业经营,科学研究到工业决策支
持等各个领域都可以找到数据挖掘的用武之
文档评论(0)