基于Transformer的胃镜视频部位识别网络结构.pdfVIP

下载本文档

7
0
约5.78千字
约 6页
2023-06-15 发布于四川
举报

基于Transformer的胃镜视频部位识别网络结构.pdf

本发明涉及一种基于Transformer的胃镜视频部位识别网络结构，在卷积神经网络提取特征的基础上，通过Transformer结构来融合视频帧之间在时间序列上的关系，从而提高视频识别的准确率。相较于2DCNN分类只能关注单张图的信息，3DCNN卷积网络较高的参数量和只能关注到局部时间通道信息，利用transformer的attention结构来聚合帧与帧之间的信息，分类结果会更加的准确，可以有效的提升胃镜视频识别时的分类精度。内镜检查下实时定位胃镜所在位置，精准识别视频中消化道部位的类别。辅助医

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 113177940 A (43)申请公布日 2021.07.27 (21)申请号 202110575556.3 (22)申请日 2021.05.26 (71)申请人复旦

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

基于Transformer的胃镜视频部位识别网络结构.pdfVIP

基于Transformer的胃镜视频部位识别网络结构.pdf

您可能关注的文档

最近下载

文档评论（0）

1亿VIP精品文档

相关文档