大数据中的技术概念.pdfVIP

  • 2
  • 0
  • 约3.94千字
  • 约 8页
  • 2026-05-23 发布于河北
  • 举报

大数据中的技术概念

在大数据处理产品中经常会碰到一些技术名词,在这里汇总整理。

一、数据源型

1.宽表vs窄表

宽表:指字段比较多的数据库表。通常是指业务主体相关的指标、纬度、属性关

联在一起的一张数据库表。

广泛应用于数据拾掘模型训练前的数据准备,通过把相关字段放在同一张表中,

可以大大提供数据挖掘模型训练过程中迭代计算的消息问题。

虽然提高了数据查询效率,但存在大量冗余。

窄表:严格按照数据库设计三范式。减少了数据冗余,但修改一个数据可能需要

修改多张表。

数据库设计三范式:

1.确保每列保持原子性;

2.确保表中的每列都和王键相关;

3.确保每列幽口主键列亘接相关,而不是间接相关。

2.MySQL

MySQL是一种关系型数据库管理系统,关系数据库将数据保存在不同的表中,

而不是将所有数据放在一个大仓库内,这样就增加了速度并提高了灵活性。是目

前最流行的关系型数据库管理系统之一。

3.Oracle

Oracle是一款关系数据库管理系统。它是在数据库领域一直处于领先地位的产

品,系统可移植性好、使用方便、功能强,适用于各

文档评论(0)

1亿VIP精品文档

相关文档