- 1、本文档共18页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大数据技术在三好网的应用实践 卫向军 2019/8/19 目 录 ? 三好网介绍 ? 大数据平台在三好网的发展历程 ? 第一阶段:个性化搜索、推荐 ? 第二阶段:多维数据分析提升平台运营效率 ? 第三阶段:人工智能提升服务效果和质量 ? 经验总结 线下教育痛点: 上课效率低、效果差 = 在线教室 教育资源不均衡 = 在线平台对接老师、学生 招生和场地租金高 = 在线低成本 成立于 3 年前,是全球首家 C2B2C 教学服务平台,年初获得 A+ 轮融资,面向家长、学生、老师,提供中 小学在线 1 对 1 课外辅导服务,目前月流水数千万。 大数据平台在三好网的发展与经验总结 ? 搭建在线教育行 业老师交易系统 ? 搭建 1 对 1 在线交 互直播教学系统 ? 个性化搜索 ? 个性化推荐 ? 智能匹配老师 ? 多维数据分析平台 ? 语音识别 ? 图像识别 ? 自适应学习 201 9 201 9 201 9 201 9 个性化搜索(结构化搜索 + 大搜索) 查询请求 结构化 Recall 高中数学 李旭光 结构化条件 + 关键词 条件解析 关键词 Recall 高中 + 数学 李旭光 过滤(白名单、黑 名单) 排序 GBDT 排序 相似度(回归) 返回结果 分页 画像系统 学生 教师 老师其他特征 用户反馈 性别、年级、科目、知识图谱 推荐引擎 = 内容推荐 + 协同过滤 获取用户 用户画像库 当前内容 基于内容推荐 召回数据(教 师列表,文章, 公开课) 资源库( ES) 协同过滤 + 排序 教师匹配 教师画像 学生画像 内容匹配 协同过滤 人口 维度 教学 维度 地区 维度 教学 质量 风格 维度 价格 维度 人口 维度 学习 维度 地区 维度 成绩 维度 性格 维度 消费 维度 搜索推荐系统的几点经验 ? 按产品维度垂直拆分( 1 对 1 、公开课、教育资讯) ? 推荐场景 ( 扩科、续费),扩科准确度更高 ? 人工匹配教师 - 系统匹配教师(结构化搜索) - 精准匹配教师 (大数据) ? 业务系统先行,大数据迭代替换 数据化运营 - 高效运营的基石 ? 高效运营建立在精细化的数据统计分析上,运营效率的提升必须 有相应系统支撑 ? KPI 体系建立(管理层视角) ? 用户转化漏斗模型(业务流程,从结果到过程的拆解) ? 运营数据统计分析(中层视角) ? 业务从粗放式运营到精细化运营的转变 ? 通过数据发现市场、销售、服务三个环节的问题 转化率案例—一点都不简单 ? 付费转化率 = 当月付费用户 / 当月注册用户 对不对? ? 互联网产品的留存率如何计算的? ? 转化周期,数据统计分析结果和业务实际结果比较,转化的时效 是否及时。 ? 注册 / 体验转化率,一个指标拆解为四步:电话接通率、预约体 验课、体验课出勤率、体验课成功率。 ? 数据指标的质量:按照渠道统计、按照地区统计 全国上课服务实时监控 监课 - 监控实时上课场景 上百万小时的音视频数据 ? 上课一对一音视频数据 约 200 万小时音视频数据 ? 学情报告音频数据 110 万份学情报告音频数据 ? 咨询电话录音数据 109 万小时电话录音数据 AI 在教学场景中的应用 语音识别 电销 质检 知识 点挖 掘 师生 互动 情况 图像识别 上课 背景 替换 教师 上课 状态 手势 识别 教师 美颜 数据采集平台 数据服务平台 数据挖掘平台 深度学习平台 数据分析可视化平台 教师数据 推荐搜索 学生模型 语音识别 数据展现 学生行为数据 内容推荐 教师模型 图像识别 数据分析 学生数据 试题推荐 知识模型 情感分析 业务预测 音视频数据 模拟考试 大数据架构 Flume+ Ptail 搜索 (ES) 处理平台 (Spark) 深度学习 Tensorflow 存储平台 (Hadoop/HDFS,Hbase,MySQL)
文档评论(0)