- 1、本文档共38页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
商品导购标签
淘宝网语义分析产品、技术介绍
王天舟(空海)
淘宝网-交易线-语义分析
个人介绍
• 花名空海
淘宝网中的文本
□淘宝主站: □文本数据:
•用户评论
• 30亿店铺、宝贝浏览
•商品标题、详情页
• 10亿计的在线宝贝数
•用户query数据
• 千万量级交易笔数
•SNS、论坛等其他数据
海量文本数据带来的价值和挑战
有限框架数据的补充、用户UGC信息
如何结构化、高效计算
呈现文本数据挖掘文本价值
文本源数据
向量算法
抽取特征、
构建向量 评估、展现
语义分析平台架构总览
文本 商品标
数据 评价 详情页 SNS/分享数据
题
特征计 分词/新词 词之间相关 序列标注 句法分析 实体语义
算层
聚
类 层次聚类 谱系聚类 KNN Kmeans
算 分
法 类 SVM/ANN/决策树/贝叶斯
算
法
产 大家印象 北极圈 U站推荐 UE反馈
品
今天的话题
□相关业务场景: 标签、内容、分类打标
□相关算法和问题
□文本技术拓展
文本标签服务
内容相关、相似
框架提取
文本分类
单品标签 “大家印象”
商品导购标签
标签范围不确定:卖家自填商品标签;买家行为标签
甜
通过算法圈定标签,如搜索query : 蜜
小清 夜 原 北京白领 果
蜜
新 1、关键字聚合(商品重合度\购买人群重合度)
婆 市 创 粉 高
惠 白富美
2、关键字筛选(搜索UV\商品数量\购买转化)
婆 真 宅 胖 端
美 屌 牙痛
夜 皮 男 陌 深 妞
头层 标签范围确定:买家自然属性
您可能关注的文档
- 中国建筑施工企业主体信用评级方法-中债资信.PDF
- 中国机械工业科学技术奖推荐书填写说明-中国电工技术学会.PDF
- 西交09春学期.doc
- 双馈风电机组电网适应性相关问题-中国电机工程学会.pdf
- 中国油橄榄发展历程与产业展望-应用概率统计.PDF
- 中国特殊教育骨干教师培训班2015-EdUHK.PDF
- 厦门电动汽车充电基础设施专项规划2012020-中国客车网.pdf
- 叙事心理学博物馆展览阐释的心理仲介—以美国下东区移民公寓.pdf
- 中国宪法讲义提纲香港班.PDF
- 中国高等教育学会特殊教育研究分会华南师范大学特殊教育学院广东.PDF
- 新高考生物二轮复习讲练测第6讲 遗传的分子基础(检测) (原卷版).docx
- 新高考生物二轮复习讲练测第12讲 生物与环境(检测)(原卷版).docx
- 新高考生物二轮复习讲练测第3讲 酶和ATP(检测)(原卷版).docx
- 新高考生物二轮复习讲练测第9讲 神经调节与体液调节(检测)(原卷版).docx
- 新高考生物二轮复习讲练测第11讲 植物生命活动的调节(讲练)(原卷版).docx
- 新高考生物二轮复习讲练测第8讲 生物的变异、育种与进化(检测)(原卷版).docx
- 新高考生物二轮复习讲练测第5讲 细胞的分裂、分化、衰老和死亡(讲练)(原卷版).docx
- 新高考生物二轮复习讲练测第5讲 细胞的分裂、分化、衰老和死亡(检测)(原卷版).docx
- 新高考生物二轮复习讲练测第12讲 生物与环境(讲练)(原卷版).docx
- 新高考生物二轮复习讲练测第11讲 植物生命活动的调节(检测)(原卷版).docx
文档评论(0)