大数据技术与产业发展手册.docx

大数据技术与产业发展手册

第1章数据基础与技术概述

1.1数据分类与特征

数据是信息的载体,其本质是结构化或非结构化的符号集合。根据不同的维度,数据可以分为结构化数据(如关系型数据库中的表格)、非结构化数据(如文本、图像、音频、视频)和半结构化数据(如JSON、XML格式)。数据特征通常包括数据量、数据质量、数据时效性、数据完整性、数据关联性等。例如,电商平台上用户行为数据具有高时效性和强关联性,而医疗数据则更注重数据完整性与准确性。

数据分类方法包括按数据类型(结构化/非结构化/半结构化)、按数据来源(内部/外部)、按数据用途(分析/决策/交互)等。例如,金融行业常用结构化数

文档评论(0)

1亿VIP精品文档

相关文档