- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
猿题库:大数据时代的在线教育
邓澍军
2015.07.17
提纲
拍照 分析
概述 总结
搜题 预测
概述
2012-
移动互联网
在线教育
10年代 在线教育
互联网公司
进军在线教
育
00年代
传统教育转
战线上
90年代
网校:远程
教育
拍照搜题
拍照搜题
拍照搜题(续)
挑战
每天千万级别的图片请求
每天十亿级别的OCR识别
数理化复杂公式
手写识别
图片问题:模糊/扭曲/光照
解决方案
Deep Learning
GPU
拍照搜题技术框架
图片
预处理
N Y
手写?
切分1 切分2
插图
匹配
CNN RNN
NLP纠错
搜索
返回题目
图片类别
图片 图片特征
预处理 内容多样
N Y • 语数英等10来个科目
手写?
切分1 切分2 模糊图很多,占30%+
插图
匹配 • 光照、扭曲、抖动等
CNN RNN
含有大量公式,数学占50%
NLP纠错
• 上下标、分式、根号等
搜索
返回题目
模糊图片
图片
预处理
N Y
手写?
切分1 切分2
插图
匹配
文档评论(0)