- 0
- 0
- 约2.23万字
- 约 34页
- 2026-01-22 发布于重庆
- 举报
(19)国家知识产权局
(12)发明专利
(10)授权公告号CN112906394B(45)授权公告日2025.01.10
(21)申请号202110291589.5
(22)申请日2021.03.18
(65)同一申请的已公布的文献号申请公布号CN112906394A
(43)申请公布日2021.06.04
(73)专利权人北京字节跳动网络技术有限公司地址100041北京市石景山区实兴大街30
号院3号楼2层B-0035房间
(72)发明人刘畅
(74)专利代理机构北京远智汇知识产权代理有限公司11659
专利代理师范坤坤
(51)Int.CI.
GO6F40/295(2020.01)
GO6F16/36(2019.01)
(56)对比文件
CN107368471
CN112101013
CN112148819
CN112347222
审查员邵娜娜
权利要求书2页
A,2017.11.21A,2020.12.18
A,2020.12.29
A,2021.02.09
说明书13页附图2页
(54)发明名称
地址识别方法、装置、设备和存储介质
(57)摘要
CN112906394B本公开实施例公开了一种地址识别方法、装置、设备和存储介质。该方法包括:识别目标文本中长度最长的提及地址实体;从知识图谱中确定所述提及地址实体对应的至少一个候选地址实体,其中,每个候选地址实体的属性信息中包括所述候选地址实体的从属地理信息,所述从属地理信息用于表示所述候选地址实体和所述候选地址实体的各上级地址实体之间的从属关系顺序;根据各个候选地址实体的属性信息,确定所
CN112906394B
识别目标文本中长度最长的提及地址实体
从知识图谱中确定所述提及地址实体对应的至少一个候选地址实体
根据各个候选地址实体的属性信息,确定所述目标文本中的目标地址实体
S101
S102
S103
CN112906394B权利要求书1/2页
2
1.一种地址识别方法,其特征在于,包括:
识别目标文本中长度最长的提及地址实体;
从知识图谱中确定所述提及地址实体对应的至少一个候选地址实体,其中,每个候选地址实体的属性信息中包括所述候选地址实体的从属地理信息,所述从属地理信息用于表示所述候选地址实体和所述候选地址实体的各上级地址实体之间的从属关系顺序,且每个候选地址实体的属性信息包括多个项目,所述从属地理信息为所述多个项目中的其中一个;
根据所述多个项目,生成所述候选地址实体对应的第一文本信息;
基于所述目标文本,获取所述提及地址实体对应的第二文本信息;
计算所述第一文本信息和所述第二文本信息之间的文本相似度,并将所述文本相似度确定为所述提及地址实体与所述候选地址实体之间的相似度;
根据得到的各相似度,确定所述目标文本中的目标地址实体。
2.根据权利要求1所述的方法,其特征在于,在所述识别目标文本中长度最长的提及地址实体之前,所述方法还包括:
针对知识图谱中的每个参考地址实体,从知识图谱中获取所述参考地址实体的所有上级地址实体;
将所有上级地址实体以及所述参考地址实体进行组合,得到所述参考地址实体的从属地理信息,并将所述从属地理信息添加到所述参考地址实体的属性信息中。
3.根据权利要求2所述的方法,其特征在于,所述将所有上级地址实体以及所述参考地址实体进行组合,得到所述参考地址实体的从属地理信息,包括:
按照行政区划等级从大到小的顺序,将所有上级地址实体与所述参考地址实体进行组合,得到所述参考地址实体的从属地理信息。
4.根据权利要求1所述的方法,其特征在于,所述识别目标文本中长度最长的提及地址实体,包括:
通过预设的实体识别网络识别目标文本中长度最长的提及地址实体,其中,所述实体识别网络通过样本文本和样本文本中长度最长的样本提及地址实体训练得到。
5.根据权利要求1所述的方法,其特征在于,所述获取所述提及地址实体对应的第二文本信息,包括:
将所述目标文本确定为所述提及地址实体对应的第二文本信息;或者,
获取与所述目标文本存在关联关系的关联文本;对所述目标文本和所述关联文本进行组合,得到组合文本;将所述组合文本确定为所述提及地址实体对应的第二文本信息。
6.一种地址识别装置,其特征在于,包括:
识别模块,用于识别目标文本中长度最长的提及地址实体;
第一确定模块,用于从知识图谱中确定所述
您可能关注的文档
- CN112903545B 一种多通道传感系统和检测方法 (华侨大学).docx
- CN112934823B 一种物料智能识别自动清洗整理设备及方法 (古田县庄鑫菌业有限公司).docx
- CN112948662B 一种推荐方法、装置和用于推荐的装置 (北京搜狗科技发展有限公司).docx
- CN113011292B 一种光学传感像素电路及其驱动方法、传感器和显示面板 (京东方科技集团股份有限公司).docx
- CN113011603B 模型参数更新方法、装置、设备、存储介质及程序产品 (深圳前海微众银行股份有限公司).docx
- CN113032568B 一种基于bert+bilstm+crf并融合句型分析的查询意图识别方法 (同方知网(北京)技术有限公司).docx
- CN113052517B 取货机器人、取货方法、计算机可读存储介质 (北京极智嘉科技股份有限公司).docx
- CN113141255B 用于在处理设备、对应的处理设备和计算机程序产品中对数据执行密码运算的方法 (意法半导体股份有限公司).docx
- CN113200179B 具有真空冷却站的深拉包装机和真空冷却热包装产品的方法 (莫迪维克西普哈根牧勒股份及两合公司).docx
- CN113206308B 用于对电池充电的方法 (三星Sdi株式会社).docx
原创力文档

文档评论(0)