- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
一、命名规范(重中之重)
表命名:
清晰自描述:?表名应清晰反映其内容和用途。
前缀/后缀约定:
分层标识:?明确区分不同数据层。
ods_?/?stg_:操作数据存储层/贴源层/临时层(原始数据或轻度清洗)
dwd_?/?fct_:明细事实层/事实表(业务过程原子事实)
dim_:维度层/维度表(描述性属性)
dws_?/?agg_?/?sum_:汇总层/轻度汇总层(按主题、粒度的聚合)
ads_?/?rpt_?/?dm_:应用层/数据集市层/报表层(面向特定分析或报表的宽表)
tmp_?/?temp_:临时表(明确用于中间计算或临时存储)
主题域标识(可选但推荐):?在分层标识后或表名前加入业务主题域缩写(e.g.,?dwd_sales_order,?dws_finance_daily_summary)。
格式:
小写字母+下划线(_)分隔单词(推荐,兼容性好)。
避免使用数据库保留字、特殊字符(如?-,?@,?$,空格)。
避免使用复数形式(e.g.,?order?优于?orders)。
保持简洁,但不要过度缩写导致难以理解。如果缩写,确保团队内有统一词典。
字段命名:
清晰自描述:?字段名应清晰表达其含义。
使用完整单词或标准缩写:?优先使用完整单词(e.g.,?customer_id,?order_date)。如需缩写,确保团队内统一(e.g.,?cust_id,?ord_dt)。
避免歧义:?不使用过于泛化的名称(如?id,?name,?value,?date)。
为?id?加上上下文(e.g.,?customer_id,?product_id,?order_id)。
为?name?加上上下文(e.g.,?customer_name,?product_name)。
为?date?加上上下文(e.g.,?order_date,?shipment_date,?effective_date)。
数据类型/业务含义标识(可选但推荐):
_id:标识主键、外键或唯一标识符。
_code?/?_cd:表示编码字段。
_name?/?_nm:表示名称字段。
_desc:表示描述字段。
_date?/?_dt:表示日期字段(通常到天)。
_datetime?/?_dttm?/?_ts:表示日期时间字段(带时分秒或时间戳)。
_amount?/?_amt:表示金额字段。
_quantity?/?_qty:表示数量字段。
_flag?/?_ind:表示布尔或标志字段(e.g.,?is_active_flag)。
_count?/?_cnt:表示计数字段。
_percent?/?_pct:表示百分比字段。
_key:常用于维度表的自然键或代理键。
统一时态和语态:?尽量使用名词形式,描述“是什么”而非“如何获得”。避免使用?calc_,?derived_?等前缀(业务含义更重要)。
格式:?同表命名,小写+下划线。
二、数据类型规范
精确匹配业务含义:
金额:?DECIMAL(p,s)?(指定精确精度和小数位,e.g.,?DECIMAL(18,2))。
整数数量:?INT?/?BIGINT?(根据范围选择)。
日期:?DATE。
日期时间/时间戳:?TIMESTAMP?/?DATETIME?(根据数据库支持选择,明确是否带时区)。
布尔值:?BOOLEAN?(或使用?TINYINT(1)?/?CHAR(1)?表示?Y/N?/?0/1,需统一)。
短文本/代码:?VARCHAR(n)?(指定足够但不过大的长度)。
长文本/描述:?TEXT?/?VARCHAR(max)?(谨慎使用,避免在事实表或频繁查询的表中滥用)。
GUID/UUID:?CHAR(36)?或数据库特定的UUID类型。
避免不精确类型:
避免使用?FLOAT/DOUBLE?存储金额(存在精度损失风险)。
避免使用过大的?VARCHAR?(e.g.,?VARCHAR(255))存储只有几个字符的代码,浪费空间。
谨慎使用?BLOB/CLOB,通常只应在ODS层存储原始报文等,DWD以上层应解析成结构化字段。
统一标准:?整个仓库对相同业务含义的字段使用相同的数据类型(e.g.,所有?customer_id?都用?BIGINT,所有?order_date?都用?DATE)。
三、表结构设计规范
主键(PrimaryKey-PK):
DWD事实表:?强烈建议定义显式PK。PK通常由业务过程本身的自然键组成(e.g.,?order_id+line_item_id),或唯一标识该行的事实代理键(SurrogateK
您可能关注的文档
最近下载
- 员工心态培训ppt课件.pptx VIP
- 直肠癌的外科治疗及进展.ppt VIP
- 2025年上海证券交易所招聘笔试预测试题及答案.doc VIP
- 料账管理课件.pptx VIP
- 能量密度指数(EII)计算方法.ppt VIP
- 红十字校本课程教学设计.docx VIP
- (正式版)Y-S-T 1700-2024 银矿采选业绿色工厂评价要求.docx VIP
- 2025年上海证券交易所招聘笔试专项练习含答案.doc VIP
- TCECA-G 0344—2025《零碳园区评价技术规范》.pdf VIP
- 第2课 春秋战国的历史巨变课件(共41张PPT)-中职高一上学期高教版(2025)中国历史全一册(含音频+视频).pptx VIP
文档评论(0)