- 1
- 0
- 约7.9千字
- 约 13页
- 2026-05-30 发布于山西
- 举报
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号CN119625745A
(43)申请公布日2025.03.14
(21)申请号202510167602.4
(22)申请日2025.02.17
(71)申请人天清数安(天津)科技有限公司
地址300110天津市南开区科研东路西侧
天津科技广场
(72)发明人石琦王晓邸小丽
(74)专利代理机构北京鼎云升知识产权代理事务所(普通合伙)11495
专利代理师张捷
(51)Int.Cl.
G06V30/164(2022.01)
G06V30/19(2022.01)
G06F40/30(2020.01)
G06N20/00(2019.01)
权利要求书1页说明书5页附图1页
(54)发明名称
一种基于nsp的对ocr的文本聚类去噪方法
(57)摘要
CN119625745A本发明提出一种基于nsp的对ocr的文本聚类去噪方法,涉及噪音数据识别技术领域,包括获取数据、聚类、获取簇心、簇心的处理以及去噪处理五个步骤,本发明提供一种结合上下文语义分析与聚类分析的一种方法,利用bert模型中的nsp任务模型进行聚类,再对结果进行分析,得到离散的噪音数据,具有通用性以及简便性,由此本发明能够在不同场景和条件下工作,无论是处理高分辨率的扫描文档还是低质量的手机拍摄图
您可能关注的文档
- CN119625443A 一种肺炎ct影像病原学分类方法、系统和介质 (苏州国科康成医疗科技有限公司).docx
- CN119625457A 模型训练方法、电子设备及计算机可读存储介质 (阿里巴巴(中国)有限公司).docx
- CN119625460A 融合散射特征优化的sar目标数据生成方法及系统 (临沂大学).docx
- CN119625465A 一种空地协同的水库大坝坝面裂缝检测模型优化方法 (安徽水利水电职业技术学院).docx
- CN119625474A 缺陷图像生成方法、装置、设备及存储介质 (深存科技(无锡)有限公司).docx
- CN119625479A 动态路由结合非对称多窗口的多模态显著目标检测方法 (合肥师范学院).docx
- CN119625491A 一种基于深度学习技术的ai算法优化方法及系统 (杭州智废科技有限公司).docx
- CN119625494A 一种基于YOLOv8改进模型的目标检测方法 (浙江工业大学).docx
- CN119625505A 一种基于异构计算的低分辨率对象目标检测方法及系统 (吉林大学).docx
- CN119625510A 一种焊接电弧图像采集处理系统及方法 (浙江机电职业技术大学).docx
最近下载
- 基于STM32指纹识别答辩PPT(简洁).pptx VIP
- 2025年徐州市中考地理生物合卷试题卷(含答案及解析).docx
- 甘肃省兰州市城关区2024-2025学年六年级下学期语文期末试卷(小升初真题)(含答案).docx VIP
- 场区清表施工方案及工艺方法.docx VIP
- GB∕T 30648.1-2014 色漆和清漆 耐液体性的测定 第1部分:浸入除水之外的液体中.pdf
- 匹克球理论考试试题库及答案.docx VIP
- 槟榔籽中生物碱类化学成分研究.docx
- 12J926建筑工程.房屋建筑.无障碍设计.pdf VIP
- “十五五”工业发展规划.docx VIP
- 精品解析:2025年北京市朝阳区中考生物真题(原卷版).docx VIP
原创力文档

文档评论(0)