- 7
- 0
- 约5.78千字
- 约 6页
- 2023-06-15 发布于四川
- 举报
本发明涉及一种基于Transformer的胃镜视频部位识别网络结构,在卷积神经网络提取特征的基础上,通过Transformer结构来融合视频帧之间在时间序列上的关系,从而提高视频识别的准确率。相较于2DCNN分类只能关注单张图的信息,3DCNN卷积网络较高的参数量和只能关注到局部时间通道信息,利用transformer的attention结构来聚合帧与帧之间的信息,分类结果会更加的准确,可以有效的提升胃镜视频识别时的分类精度。内镜检查下实时定位胃镜所在位置,精准识别视频中消化道部位的类别。辅助医
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 113177940 A
(43)申请公布日 2021.07.27
(21)申请号 202110575556.3
(22)申请日 2021.05.26
(71)申请人 复旦
您可能关注的文档
最近下载
- 问卷1:中国中小学生积极心理品质量表.pdf VIP
- TWSJD57-2024 食品中蜡样芽胞杆菌呕吐毒素的测定.pdf VIP
- 大学生道德健康、青少年乐观的因素结构及特点分析、自尊问卷调查表.docx VIP
- 2026年高考第一次模拟考试物理一模保分卷02(陕晋宁青专用)(考试版).docx VIP
- 电土施表4-18 混凝土结构工程养护记录.doc VIP
- 塔吊安拆工程旁站监理方案.docx
- 河南专升本公共英语10年真题和答案解析 .pdf VIP
- 2026年高考第一次模拟考试物理一模保分卷02( 江苏专用 )(考试版).docx VIP
- 云智算技术白皮书(2025).pdf VIP
- 湖北省武汉市武昌区八年级(上)物理期末模拟题二.docx VIP
原创力文档

文档评论(0)