- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
视频文字识别精选
TEL:
2014 年
目 录
一、文通视频文字识别开发包简介3
二、与传统的OCR 识别技术性能对比3
三、舆情监控、信息安全领域的使用4
四、文通视频文字识别SDK 支持的开发语言5
五、使用场景介绍:5
“源于清华服务全球”的国内顶尖OCR 图文识别技术,针对视频文件里面的
文字字符以及复杂背景图片的文字字符进行计算识别!
摘要:通过对视频文件里的字幕提取,达到视频文件的分类归档存储的用
途;通过对网络图片里面的文字提取、监测、分析,达到舆情监控、预防谣言
的进一步发展!
关键词:视频识别 视频文字识别 视频字幕识别 字幕识别 新闻字幕识别
新闻关键词识别 图片文字识别 舆情监控 信息安全 网络舆情监控 谣言图片监
控 OCR 系统集成
“源于清华,服务全球”。
文通视频文字识别SDK ,是一套可二次集成开发的工具包,是北京文
通科技有限公司针对视频文字专门开发的识别引擎,解决了目前市面上OCR 产
品对于媒体资源管理体系中新闻字幕识别、电影字幕识别,电视剧字幕识别,
娱乐节目字幕识别等无法识别的问题。
一、文通视频文字识别SDK 具有强大的文字定位功能,可以
精确定位到视频中的文字位置。定位后,再对所定位文字进行识别。
◎ 支持TIFF、JPEG、PNG、BMP 格式图像的读取;
◎ 可以对视频图像字幕进行自动版面分析;
◎ 能识别纯英文、简繁体中文视频图像,后续会加入少数民族语言识别;
◎ 支持对内存中的图像进行识别;
◎ 能够获取识别字符在原文中的位置和大小信息;
◎ 支持对指定区域的识别;
◎ 支持对长微博图片的文字内容识别;
二、固有的、传统的OCR 识别技术产品,因为视频的文字
与背景的对比度、颜色、明暗等多种因素的混淆,造成普通OCR 识别算法不
好或者根本无法识别,而文通视频文字识别SDK 却可以有很大的改善,主要得
益于清华大学新研发的计算方法来识别。这是文通视频文字识别SDK 区别于一
般OCR 产品的地方,也是它的优势所在。
◎视频识别:集成进媒资管理系统或者其他媒体管理系统,对要管理的视频文件进
行OCR 识别,并把识别结果与视频关键帧相对应,这样就能实现视频的检索与利用。
三、对于舆情监控、舆情监测、信息安全等领域,也有行
业内顶尖的性能。例如:分辨率较低的网页视频截图识别,网页截图识别,广
告截图识别,微博截图识别等,对比其他的OCR 软件,拥有非常大的优势。
◎图片识别:集成进舆情系统和维稳系统后,针对收集到的大量图片进行识别,将
识别出的文字结果对比相应的监控词库字典表,例如:敏感词汇、反恐词汇等。
应用方式:集群服务器网络监控
(以上类型的图样识别率99%)
四、TH-OCR 文通视频文字识别SDK 支持的开发语言
VC,VB,DEPHI 等。
五、客户案例:
目前在以下两个行业领域应用比较广泛:
① 媒体资产管理领域系统集成
爱奇艺,奇虎360 等
② 舆情监控、广告监测领域系统集成
中国科学院信息工程研究院、河南拓普计算机网络工程有限公司、广州汇
智通信技术有限公司、武汉绿网科技等。
③ CCTV-13 新闻关键信息识别提取,进而推送数据给信息管理系统
④ 应用于电视台新闻节目、娱乐节目、电影字幕等文字识别需求
⑤ 应用于网页截屏的识别
以上是网页截图原件,以下是识别DEMO 的识别结果截图(真实测试结果,识别率没有
达到100%实属正常):
文档评论(0)