PAGE 2
头条数据聚合优化实践
业务背景介绍
中华万年历的头条数据是根据推荐算法聚合而成的数据,包括ALS算法数据、用户画像数据、时效数据、非时效数据、定投数据、惊喜数据、频道数据、热榜数据、用户相关阅读推荐数据等。启动方式分为冷启动和用户画像启动。
冷启动:无用户画像或用户画像得分8分。
用户画像:根据用户浏览头条数据给用户打的一系列标签,标签采用Long型的数字进行标记,譬如娱乐285L,旅游1127L。
时效数据:和时间相关的数据,会随着时间的推移自动消失,譬如新闻、娱乐。
非时效数据:和时间不相关的数据,会长期存在,譬如养生。
定投数据:通过管理后台手动投放的数据,一般为固定位置数据,如广告、帖子。
惊喜数据:排除画像之外的数据。
频道数据:多个标签下的数据组合而成的数据。频道是标签的父类,一个频道对应包涵多个标签,标签是用户画像组成的基本单位。
热榜数据:根据用户点击实时上传的日志计算得分较高的数据。
用户相关阅读推荐数据:根据用户点击实时上传的日志计算相关联的数据。
数据存储
头条的数据都是从合作方抓取的,通过定时调用第三方API进行抓取。抓取的数据经过频道标签分类后存储到mysql数据库。头条服务会每隔一段时间把数据库里面的数据reload到redis中,然后再从redis中reload到本地内存中。数据的聚合就是把内存中的数据按照算法进行组装。
为
您可能关注的文档
- 省级电子政务云平台-整体方案设计1.docx
- 施工项目组织管理方案1.docx
- 实时遥感城市云服务平台建设方案1.docx
- 实战Docke虚拟化技术1.docx
- 世界人工智能产业发展蓝皮书1.docx
- 视频直播CDN技术实现方案1.docx
- 室分大数据智能和精准优化方案1.docx
- 数据存储服务产品开发需求文档1.docx
- 数据湖智能分析系统-需求规格说明书1.docx
- 数据库管理系统等保安全技术要求1.docx
- 基于Hedonic模型的物业税税基评估:理论、实践与优化策略.docx
- 基于Delaunay剖分的三维地质建模与可视化技术研究:理论、实践与展望.docx
- 中医外科学知识考试复习题库(附答案).doc
- 耐火纤维制品工专项知识考试复习题库(附答案).doc
- 我国农村传播网络媒介的现状审视与发展新径.docx
- 浙江省海湾岸线时空动态变化及其生态经济效应研究.docx
- 统筹城乡视角下重庆城镇化发展路径与策略研究.docx
- 互联网上市公司融资渠道对融资风险的影响:基于乐视网的深度剖析.docx
- 平版制版工专项知识考试复习题库(附答案).doc
- 航空环控救生装备检验工环境控制与救生设备测试题库(附答案).doc
最近下载
- T∕CACM 1104-2018 中医治未病技术操作规范 中药熥疗.pdf VIP
- 2024年石河子大学计算机科学与技术专业《计算机组成原理》科目精品7922.pdf VIP
- 2026年河南省南阳市招聘乡村振兴村级协理员1230人考试模拟试题及答案解析.docx VIP
- 京津城际高速铁路试验段测试报告.PDF VIP
- 济南铁路局济南车辆段调度命令发布系统设计与实现-计算机技术专业论文.docx VIP
- 公关岗位面试题库与专业素养测试.docx VIP
- 2026年高考物理湖南卷及答案.docx VIP
- (建电〔2020〕16号)中国铁路济南局集团有限公司建设部关于开展铁路建设安全生产“三查”“五防”专项整治行动的通知.doc VIP
- (济铁施工〔2021〕186号)中国铁路济南局集团有限公司关于印发《中国铁路济南局集团有限公司铁路营业线施工管理实施细则》的通知(技术规章)(1).doc VIP
- 培训课件:混凝土结构的施工技术(浇筑、养护).ppt VIP
原创力文档

文档评论(0)