基于Transformer的胃镜视频部位识别网络结构.pdfVIP

  • 7
  • 0
  • 约5.78千字
  • 约 6页
  • 2023-06-15 发布于四川
  • 举报

基于Transformer的胃镜视频部位识别网络结构.pdf

本发明涉及一种基于Transformer的胃镜视频部位识别网络结构,在卷积神经网络提取特征的基础上,通过Transformer结构来融合视频帧之间在时间序列上的关系,从而提高视频识别的准确率。相较于2DCNN分类只能关注单张图的信息,3DCNN卷积网络较高的参数量和只能关注到局部时间通道信息,利用transformer的attention结构来聚合帧与帧之间的信息,分类结果会更加的准确,可以有效的提升胃镜视频识别时的分类精度。内镜检查下实时定位胃镜所在位置,精准识别视频中消化道部位的类别。辅助医

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 113177940 A (43)申请公布日 2021.07.27 (21)申请号 202110575556.3 (22)申请日 2021.05.26 (71)申请人 复旦

文档评论(0)

1亿VIP精品文档

相关文档