- 1
- 0
- 约8.18千字
- 约 7页
- 2024-06-13 发布于河南
- 举报
第一章绪论
1.结构化数据:指具有较强的结构模式,可以使用关系型数据库表示和存储的数据。
2.半结构化数据:是一种弱化的结构化数据形式,它并不符合关系型数据模型的要求。但
仍有明确的数据大纲,包含相关标记,用来分割实体以及实体的属性。
3.非结构化数据:日常生活中接触到的数据大多数数据都属于非结构化数据。非结构化数
据没有固定的数据结构,或难以发现统一的数据结构。各种存储在文本文件中的系统杂
志、文档、图像、音频等数据都属于非结构化数据。
4.元数据:信息是描述一个数据集本身特征的数据。
5.弱结构化数据
10
6.最基本的数据单位——字节(Byte,B);相邻两个单位之间相差2=1024.
7.4V特征:规模庞大、种类繁多、变化频繁、价值巨大且密度低。
8.规模庞大:数据集相对于现有的计算和储存能力而言,规模庞大。
9.种类繁多:在大数据面对的应用场景中,数据种类繁多。可能同时覆盖结构化、半结构
化和非结构化的数据。
10.变化频繁:数据多刻画的事物状态在频繁、持续的变化。
11.价值巨大且密度低:在大数据中,通过数据分析,在无序数据中建立关联可以获得
您可能关注的文档
最近下载
- 新概念英语第二册Lesson59教案.docx VIP
- 输电线路班安全培训教育课件.pptx VIP
- 2025年流行病学简答题汇总含答案 .pdf VIP
- Agilent 8890 GC System 8890Series GC+Openlab CDS 2.X现场培训教材-V1.1.pdf
- 第11课 西汉建立和“文景之治” 课件(共20张PPT).pptx VIP
- 四川成都成华区七年级下册语文期末试卷及答案.pdf VIP
- 春季常见病知识讲座课件.pptx VIP
- NBT10320-2019《光伏发电工程组件及支架安装质量评定标准》.pdf VIP
- 青岛网架钢结构厂房施工技术交底.doc VIP
- 2025年中国无线耳机市场调研报告_2025年12月.docx VIP
原创力文档

文档评论(0)