大数据导论_原创精品文档.pdfVIP

  • 1
  • 0
  • 约8.18千字
  • 约 7页
  • 2024-06-13 发布于河南
  • 举报

第一章绪论

1.结构化数据:指具有较强的结构模式,可以使用关系型数据库表示和存储的数据。

2.半结构化数据:是一种弱化的结构化数据形式,它并不符合关系型数据模型的要求。但

仍有明确的数据大纲,包含相关标记,用来分割实体以及实体的属性。

3.非结构化数据:日常生活中接触到的数据大多数数据都属于非结构化数据。非结构化数

据没有固定的数据结构,或难以发现统一的数据结构。各种存储在文本文件中的系统杂

志、文档、图像、音频等数据都属于非结构化数据。

4.元数据:信息是描述一个数据集本身特征的数据。

5.弱结构化数据

10

6.最基本的数据单位——字节(Byte,B);相邻两个单位之间相差2=1024.

7.4V特征:规模庞大、种类繁多、变化频繁、价值巨大且密度低。

8.规模庞大:数据集相对于现有的计算和储存能力而言,规模庞大。

9.种类繁多:在大数据面对的应用场景中,数据种类繁多。可能同时覆盖结构化、半结构

化和非结构化的数据。

10.变化频繁:数据多刻画的事物状态在频繁、持续的变化。

11.价值巨大且密度低:在大数据中,通过数据分析,在无序数据中建立关联可以获得

文档评论(0)

1亿VIP精品文档

相关文档