傅小兰:人的数据理解.ppt

中国科学院认知神经科学 国际学术研讨会 人的数据理解 傅 小 兰 中国科学院心理研究所 报告提纲 研究项目 研究假设 研究思路 研究举例 报告提纲 研究项目:人的数据理解 研究假设 研究思路 研究举例 符号、数据、信息、知识 符号(symbol):任何一个能和其它模式相区别的模式 数据(data):符号的集合 信息(information):有用的数据 关联信息:若干单个事件相关联的信息 聚类信息:对数据进行聚类 分类信息:进行分类的特性描述 偏差信息:反映异常情况 预测信息:基于现有的数据建模,计算未来值 知识(knowledge):反映事物间的内在联系的信息 隐知识:无法用语言文字描述 显知识:可用语言文字描述 KDD 与 DM 数据库中的知识发现(Knowledge Discovery in Database):KDD是在数据中鉴别出有用的模式的非平凡过程,该模式是新的,可能有用的和最终可理解的。(Fayyad et al, 1996) 数据挖掘(Data Mining):数据挖掘是在数据库中寻找数据中的模式,再根据这些模式找出相应的规律。 KDD处理过程 数据准备 数据集成 数据选择 数据预处理 数据挖掘 产生假设:发现型,验证型 选择合适的工具 挖掘知识的操作 证实发现的知识 结果表述和解释 数据挖掘

文档评论(0)

1亿VIP精品文档

相关文档