- 1、本文档共20页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘与中医证候研究数据挖掘-mipaper
数据挖掘与中医证候研究
数据挖掘与中医证候研究
上海中医药大学附属龙华医院
上海中医药大学附属龙华医院
郑培永
郑培永
一、数据挖掘
一、数据挖掘
1
由来—— 网络之后的下一个技术热点
由来—— 网络之后的下一个技术热点
• 《纽约时报》由60年代的10~20版扩张至现
在的100~200版
•大量信息在给人们带来方便的同时也带来了
问题:第一是信息过量;第二是信息真假难
以辨识;第三是信息安全难以保证;第四是
信息形式不一致,难以统一处理
•面对这一挑战,数据挖掘和知识发现技术应
运而生,并显示出强大的生命力
由来——数据爆炸但知识贫乏
由来——数据爆炸但知识贫乏
• 激增的数据背后隐藏着许多重要的信息,人们
希望更好地利用这些数据
• 目前的数据库系统可以高效地实现数据的录
入、查询、统计等功能,但无法根据现有的数
据预测未来的发展趋势
• 缺乏挖掘数据知识的手段,导致了“数据爆炸
但知识贫乏” 的现象
2
数据挖掘的概念
数据挖掘的概念
• 从大量的、不完全的、模糊的、随机的数
据中,抽取出潜在的、有价值的知识(模型
或规则)的过程
数据挖掘的目的
数据挖掘的目的
• 在于使用所发现的模式帮助解释当前的行
为或预测未来的结果
3
数据挖掘的步骤
数据挖掘的步骤
第一,问题定义
第二,数据准备
第三,数据挖掘
第四,结果分析
第五,知识的同化
问题定义
问题定义
• 了解相关领域的有关情况,熟悉背景知
识,弄清用户要求
4
数据准备
数据准备
• 数据的选择:搜索有关的内部和外部数据信息,
并从中选择出适用于数据挖掘应用的数据
• 数据的预处理:研究数据的质量,为进一步的分
析作准备
• 数据的转换:将数据转换成一个分析模型,建立
一个真正适合挖掘算法的分析模型是数据挖掘成
功的关键
数据挖掘
数据挖掘
• 对所得到的经过转换的数据进行挖掘
5
结果分析
结果分析
• 对数据挖掘的结果以用户能了解的方式呈
现,并加以解释和评价,确定所发现的东
西是否有用
知识的同化
知识的同化
• 将所发现的知识应用于新的情景
6
数据挖掘与传统分析方法的区别
数据挖掘与传统分析方法的区别
• 数据挖掘与传统的数据分析(如查询、报
表、联机应用分析) 的本质区别是数据挖掘
是在没有明确假设的前
文档评论(0)