- 1、本文档共52页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第2章节知识发现的基本概念
数据挖掘与知识发现(复杂数据对象的数据挖掘与知识发现) 2 知识发现的基本概念 2.1 数据、信息、知识 2.2 KDD定义 2.3 KDD对象 2.4 KDD功能 2.5 KDD技术方法 数据、信息、知识 事实(facts):人类思想和社会活动的客观映射。 数据(data):事实的数字化、编码化和序列化。 信息(information):数据在信息媒介上的映射。 知识(knowledge):对信息的加工、吸收、提取、评价的结果。 数据、信息、知识的关系 Source of Information 我们所面临的信息源的特点 海量数据 复杂结构 所蕴含的知识丰富 学术期刊是最重要的信息资源 科技信息:学术期刊是最重要的科技信息资源。我国是期刊大国,拥有8000多种正式期刊和10,000多种内部期刊。近几年来我国学术期刊全文数据库建成。清华大学中国学术期刊(光盘版)电子杂志社编辑制作的《中国期刊全文数据库》已将6600种期刊建成全文光盘数据库,全文文献量已达300万篇, 并已开通中国期刊网, 是目前全球最大的中文期刊文献全文数据库。 网上中国报纸 据1999年的资料, 网上中国报纸的数量为273种,占1998年全国报纸种数2053种的13.2 %, 国内传统报纸近七分之一已经上网。 上网的全国性报纸共56种,占全国性报纸种数211种的26.5%。 科学数据库 由中科院十几个研究所历时十余年建成的大型科学数据库信息系统,学科跨度大,包括信息、计算机、网络、化学、生物、天文、材料、腐蚀、光学机械、自然资源、能源、生态环境、湖泊、沼泽、冰川、大气、古气候、动物、水生生物、遥感等多种学科,专业数据库115个,总数据量达4300亿字节(430GB)。其中某些科学数据的建库不仅为我国累积了珍贵的科学资料而且也为世界科学数据填补了空白。 国家科技图书文献中心 目前外文期刊达10500种。国家科技部以八家资源为基础成立了国家科技图书文献中心, 建立文献数据库加工体系,建立科技文献资源网络服务系统,并全面实施对科技文献信息保障体系的标准化管理。其目标是国内出版的文献满足率达到95%,国外出版的文献满足率达到70%以上。从中心网站统计来看, 几乎每天24小时都有用户来访, 每月请求数约24万次。 知识 知识是一个内涵十分丰实,外延相当广泛的概念。古往今来许多思想家、哲学家、科学家都从不同的角度在知识的界说方面进行过探讨。 培根的知识定义 培根从经验论和认识论的角度给出知识的定义:“知识的主要形式不是别的只是真理的表象……存在的真实同知识的真实是一致的”,因此,“知识是存在底影像”。他从知识的起源探索知识,认为知识是人脑深入到自然界里面,在事物本身上来研究事物的性质“而获得的东西。”[1] [1] 蔡亮,知识决定论,北京日报出版社,1988年P12-13 思维科学将知识定义 思维科学将知识定义为:“人类认知的成果来自于实践活动。处理人际社交关系活动和科学试验等实践活动。从实践中得到的感性认识经过去粗取精,去伪存真由此及彼,由表及里的加工制作上升为抽象的理论认知,成为以概念为元素的系统的科学理论,这是知识的比较完备的形态。”[1] [1] 田运,思维辞典,浙江教育出版社,1996年P338。 认知科学将知识定义 认知科学将知识定义为“静态性的内容结构”[1],“形象化的心理表征,表征方式包括如规则、概念、表象和类比等”[2]。 [1] 陈英禾,认知发展心理学,浙江人民出版社,1996,P2。 [2] [加]P.萨加德,认知科学导论,中国科技大学出版社,1999,P2。 知识工程的知识定义 信息科学、人工智能从知识处理的角度将知识看作“是为某种服务目的而抽象化和一般化的信息,是一组事实或概念的条理化阐述及形式化的定义。其知识可划分为:事实、规律、方法、理论和知识空间、通用知识和领域专门知识等。以上各类知识由上下文的解释来界定”[1]。 [1] 何新贵等,知识处理与专家系统,国防工业出版社,1990,P24“27。 上述知识定义具有以下共同的特点: L 知识是客观实在头脑中反映,是客观事物和客观规律的抽象和概括,是人类对于客观实在的认识。 L 知识具有不同的抽象层次,即宏观层次和微观层次。在宏观上,知识具有塔形、网状等结构,不同的结构类型都从不同侧面反映知识的纵横交错相互渗透的关系及其在维度和时间上的发展变化。微观层次的知识是针对具体的问题。知识的界定有确切的定义和适用范围,因而具有较强的针对性。 L 知识以一定的表征方式来表达,通过各种表征方式在不同认知阶段上的组合和运用,可表示人类知识结构的非线性特征,客观世界的非线性和多变性。 复杂数据对象
您可能关注的文档
最近下载
- 畜牧兽医畜禽疾病防治题库试题库.pdf VIP
- 污水厂清淤泥施工方案.docx VIP
- 人力资源岗位招聘笔试题(某大型央企)2025年题库精析.docx VIP
- 湖南省第二届全省建设工程质量、安全监督技能竞赛-质量题库(理论部分).pdf
- 〖CJJ89-2012〗城市道路照明工程施工及验收规程.pdf VIP
- 浙江乔宇电气三相液晶多功能说明书20230808(完整版).pdf VIP
- 我国司法实务中的庭外重组及其法律表达.docx VIP
- 医疗器械购货者资格审核制度.docx VIP
- 《旅游线路设计》 项目二 旅游线路设计的内容.pptx VIP
- 中国系统性红斑狼疮诊疗指南(2025版)解读.pptx
文档评论(0)