- 19
- 0
- 约1.28万字
- 约 13页
- 2023-05-13 发布于四川
- 举报
本发明提供一种基于分词模式匹配的非标准地名地址数据清洗方法及装置,通过分词模式匹配在数据库中查找标准地名地址,若存在机构内部地址数据库则再通过内部地址数据库匹配得到二次地址分类结果,将二次地址分类结果与之前的标准地名地址组合得到最终结果,否则将之前获得的标准地名地址作为最终结果。通过深度学习学习中文语境中文本标注的特征,获取待查询数据后通过分词模型输出词性标注结果进而得到分词结果,分离出国家标准行政区划要素和兴趣点内部地址要素,然后接入该兴趣点相关的数据库进行二次清洗。本发明将存在大量错误、名称
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 114647639 A
(43)申请公布日 2022.06.21
(21)申请号 202210277639.9 G06F 40/289 (2020.01)
原创力文档

文档评论(0)