基于人工智能的绘本或教材的视觉识别方法及装置.pdf

基于人工智能的绘本或教材的视觉识别方法及装置.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 111428569 A (43)申请公布日 2020.07.17 (21)申请号 202010120108.X (22)申请日 2020.02.26 (71)申请人 北京光年无限科技有限公司 地址 100000 北京市石景山区石景山路3号 玉泉大厦四层常青藤青年创业工作室 193号 (72)发明人 俞晓君 贾志强  (74)专利代理机构 北京聿华联合知识产权代理 有限公司 11611 代理人 朱绘 张文娟 (51)Int.Cl. G06K 9/00(2006.01) G06K 9/62(2006.01) 权利要求书1页 说明书8页 附图4页 (54)发明名称 基于人工智能的绘本或教材的视觉识别方 法及装置 (57)摘要 本发明提供的基于人工智能的绘本或教材 的视觉识别方法,其包含:步骤一:采集待识别内 容物图像,对内页图像数据进行图像识别;步骤 二:结合内页图像数据的清晰程度,判断得到当 前待识别内容物的类型,并进入对应的算法识别 模式,其中,算法识别模式包含光学字符识别模 式以及图像特征识别模式;步骤三:在对应的算 法识别模式下,向用户反馈多模态识别结果数 据。本发明能够根据不同的待识别内容物,采用 不同的识别模式进行内容识别,适应的书籍范围 广泛;并且,本申请还能够通过用户的指读指令, A 展开指读识别过程,方便用户的阅读,进一步提 9 升了阅读体验。 6 5 8 2 4 1 1 1 N C CN 111428569 A 权 利 要 求 书 1/1页 1.一种基于人工智能的绘本或教材的视觉识别方法,其特征在于,所述方法包含以下 步骤: 步骤一:采集待识别内容物图像,对内页图像数据进行图像识别; 步骤二:结合所述内页图像数据的清晰程度,判断得到当前待识别内容物的类型,并进 入对应的算法识别模式,其中,所述算法识别模式包含光学字符识别模式以及图像特征识 别模式; 步骤三:在对应的算法识别模式下,向用户反馈多模态识别结果数据。 2.如权利要求1所述的方法,其特征在于,所述步骤一中还包含以下步骤:若未能检测 到当前图像数据包含内页图像数据,则对当前图像进行封面识别。 3.如权利要求1所述的方法,其特征在于,所述步骤二中还包含以下步骤:确定所述内 页图像数据的分辨率信息,与阈值信息进行比较,当所述分辨率信息低于所述阈值信息时, 确定所述待识别内容物为绘本图书,当所述分辨率信息高于所述阈值信息时,确定所述待 识别内容物为教材图书。 4.如权利要求1所述的方法,其特征在于,所述步骤二之后还包含以下步骤:接收用户 输出的所述语音交互数据,对所述语音交互数据进行语义理解处理,得到用户的交互意图。 5.如权利要求4所述的方法,其特征在于,所述步骤二之后还包含以下步骤:当检测到 手型轮廓时,进入指读识别模式,基于所述手形轮廓指向位置的内容信息,结合所述交互意 图得到所述多模态识别结果数据。 6.如权利要求1-5中任一项所述的方法,其特征在于,所述方法还包括: 获取当前用户的身份特征信息,对当前用户的用户属性进行判断,确定当前用户的类 别,其中,用户的类别包含:儿童用户。 7.一种程序产品,其包含用于执行如权利要求1-6中任一项所述的方法步骤的一系列 指令。 8.一种基于人工智能的绘本或教材的视觉识别装置,其特征在于,所述装置包含: 第一模块,其用于采集待识别内容物图像,对内页图像数据进行图像

文档评论(0)

10301556 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档