用户画像与个性化推荐手册(执行版)
第1章用户基础数据与标签体系构建
1.1用户基础信息字段标准化规范
在数据入库前,需建立统一的元数据字典,将“年龄”、“性别”、“职业”等基础字段强制映射为ISO8601标准的时间格式(YYYY-MM-DD)及枚举值(如“男/女”),严禁使用“大”、“小”等模糊词汇,确保后续计算年龄差值的精度。针对手机号、身份证等核心识别码,需规定前缀校验规则(如中国大陆手机号以13开头,以15开头),并设定最大长度限制(如身份证仅保留前18位),一旦超过则自动触发报警并标记为“脏数据”,防止因格式错误导致关联失败。
对于“居住地”、“办公地”等动
原创力文档

文档评论(0)