数据挖掘基础及其应用 课件 第2章 数据.pptx

数据挖掘基础及其应用 课件 第2章 数据.pptx

第2章 数据2.1 数据的定义2.2 属性的分类2.3 数据类型2.4 相似性计算本章小结2.1 数据的定义 数据是指对客观事物进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合。它是可识别的、抽象的符号,不仅指狭义上的数字,还可以是具有一定意义的文字、字母、数字符号的组合、图形、图像、视频、音频等,也可以是客观事物的属性、数量、位置及其相互关系的抽象表示。 定义2.1 数据是事实或观察的结果,是对客观事物的逻辑归纳,是用于表示客观事物的原始素材。  问题:数据与信息的区别和联系是什么? 提示:数据与信息既有联系,又有区别。 注意:数据本身没有确切的含义,其含义来源于背景语义。   定义2.2(广义定义) 在计算机科学中,数据是指所有能输入到计算机中,并被计算机程序识别处理的符号的总称,是用于输入到电子计算机进行处理,具有一定意义的数字、字母、符号和模拟量等的统称,是组成地理信息系统的最基本要素。现在计算机存储和处理的对象十分广泛,表示这些对象的数据也随之变得越来越复杂。 该定义的关键是数据在计算机系统或者数据库中如何表示/存储,典型的数据表示方式为矩阵形式(表格形式),其中行表示数据对象,列表示属性,如表2-1所示。2.2 属性的分类 数据包含数据对象与属性,其中属性定义为特征,用于描述数据某项或某个特征,其定义如下。 定义2.

文档评论(0)

1亿VIP精品文档

相关文档