CN112307770B 敏感信息的检测方法、装置、电子设备及存储介质 (深圳前海微众银行股份有限公司).docxVIP

  • 0
  • 0
  • 约3.57万字
  • 约 53页
  • 2026-01-22 发布于重庆
  • 举报

CN112307770B 敏感信息的检测方法、装置、电子设备及存储介质 (深圳前海微众银行股份有限公司).docx

(19)国家知识产权局

(12)发明专利

(10)授权公告号CN112307770B(45)授权公告日2025.01.10

(21)申请号202011091612.8

(22)申请日2020.10.13

(65)同一申请的已公布的文献号申请公布号CN112307770A

(43)申请公布日2021.02.02

(73)专利权人深圳前海微众银行股份有限公司地址518027广东省深圳市前海深港合作

区前湾一路1号A栋201室

(72)发明人李松黄研洲杨海军徐倩

(74)专利代理机构深圳市世纪恒程知识产权代理事务所44287

专利代理师张志江

(51)Int.CI.

GO6F40/30(2020.01)

GO6F40/216(2020.01)

GO6F40/284(2020.01)

GO6F40/289(2020.01)

GO6F16/335(2019.01)

GO6F16/334(2025.01)

(56)对比文件

CN101764704A,2010.06.30审查员李亚楠

权利要求书2页说明书19页附图8页

(54)发明名称

敏感信息的检测方法、装置、电子设备及存储介质

(57)摘要

CN112307770B本申请提供了一种敏感信息的检测方法、装置、电子设备及计算机可读存储介质;所述方法包括:对敏感信息进行语义特征提取,得到敏感信息的语义特征;基于敏感信息的语义特征,分别确定敏感信息与信息库中各参考信息的语义相似度;从信息库中,选取与敏感信息的语义相似度达到相似度阈值的至少两个参考信息,并将选取的参考信息作为目标敏感信息;分别将至少两个目标敏感信息与待检测信息进行匹配,并基于匹配结果生成待检测信息的敏感信息检测结

CN112307770B

终端对敏感信息进行语义特征提取,得到敏感信息的语义特征

终端对敏感信息进行语义特征提取,得到敏感信息的语义特征

基于敏感信息的语义特征,分别确定敏感信息与信息库中各参考信息的语义相似度

从信息库中,选取与敏感信息的语义相似度达到相似度阈值的至少两个参考信息,并将选取的参考信息作为目标敏感信息

分别将至少两个目标敏感信息与待检测信息进行匹配,并基于匹配结果生成待检测信息的敏感信息检测结果

103

CN112307770B权利要求书1/2页

2

1.一种敏感信息的检测方法,其特征在于,包括:

对敏感信息进行语义特征提取,得到所述敏感信息的语义特征;

基于所述敏感信息的语义特征,分别确定所述敏感信息与信息库中各参考信息的语义相似度;

从所述信息库中,选取与所述敏感信息的语义相似度达到相似度阈值的至少两个参考信息,并将选取的参考信息作为目标敏感信息;

分别将至少两个所述目标敏感信息与待检测信息进行匹配,并基于匹配结果生成所述待检测信息的敏感信息检测结果;

所述对敏感信息进行语义特征提取,得到所述敏感信息的语义特征,包括:

从所述敏感信息中提取关键词;

对所述关键词进行特征提取,得到所述关键词的语义特征,将所述关键词的语义特征作为所述敏感信息的语义特征;

所述分别将至少两个所述目标敏感信息与待检测信息进行匹配,包括:

分别将各所述目标敏感信息替换所述敏感信息中的关键词,得到至少两个相应的待匹

配信息;

分别将各所述待匹配信息与所述待检测信息进行匹配;

所述分别将各所述待匹配信息与所述待检测信息进行匹配,包括:

分别确定所述至少两个待匹配信息的通顺度;

从所述至少两个待匹配信息中选取通顺度满足通顺度条件的目标待匹配信息;

将所述目标待匹配信息与所述待检测信息进行匹配;

所述分别确定所述至少两个待匹配信息的通顺度,包括:当所述待匹配信息的类型为文本类型时,分别对各所述待匹配信息进行分词,得到各所述待匹配信息的词序列;通过第一语言模型,分别对各所述词序列中的词进行特征提取,得到各所述词序列的词特征;通过所述第一语言模型,对各所述词序列的词特征进行条件概率预测,得到各所述待匹配信息中的词出现在相应词序列中的条件概率;基于预测得到的所述条件概率,确定各所述待匹配信息的通顺度。

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

获取待匹配信息样本所对应的样本

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档