大数据技术与应用发展手册.docxVIP

  • 1
  • 0
  • 约2.3万字
  • 约 34页
  • 2026-03-26 发布于江西
  • 举报

大数据技术与应用发展手册

第1章数据基础与技术概述

1.1数据分类与特性

数据是信息的载体,是计算机处理和存储的符号集合。数据的分类主要依据其内容、形式、来源和用途,常见的分类包括结构化数据、非结构化数据、半结构化数据等。结构化数据是指可以被数据库存储和管理的数据,如表格数据、关系型数据库中的记录。结构化数据具有明确的格式和规则,便于高效处理和分析。

非结构化数据是指没有固定格式的数据,如文本、图像、视频、音频等。这类数据通常存储在文件系统中,处理时需要借助自然语言处理(NLP)或图像识别等技术。半结构化数据介于结构化和非结构化之间,如XML、JSON等格式的数据,虽然格式不固

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档