- 0
- 0
- 约2.54万字
- 约 15页
- 2023-06-07 发布于四川
- 举报
本发明提出了一种网络舆情分析中视觉多模态文字检测识别及纠错方法,步骤如下:对网络舆情相关数据中文字进行标注构建数据集;提取数据集中舆情图像的图像特征、视频中关键帧的图像特征,对舆情图像的图像特征和视频中关键帧的图像特征进行信息编码;文字检测模块对多模态特征编码信息进行检测,文本识别模块将带有字符的文本序列转化为文本;采用舆情领域词库和Transformer网络对得到的文本信息进行纠错,得到文字纠错模型;对文字纠错模型进行训练,对识别出的文本信息进行纠错。本发明能够有效挖掘图像、视频中文本行的上下
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 116229482 A
(43)申请公布日 2023.06.06
(21)申请号 202310283922.7 (51)Int.Cl .
原创力文档

文档评论(0)