游记数据自动提取的方法、电子设备和介质.pdfVIP

  • 3
  • 0
  • 约9.67千字
  • 约 10页
  • 2023-05-05 发布于四川
  • 举报

游记数据自动提取的方法、电子设备和介质.pdf

本发明公开了一种游记数据自动提取的方法、电子设备及介质,其中游记数据自动提取的方法包括S100、对待处理文本进行分词和命名体识别,得到多个分词和多个命名体;S200、基于目的地字典表从多个分词中筛选出候选目的地,和,基于语料库从多个命名体中筛选出候选目的地;S300、若所述候选目的地的数量大于预设值,对所有候选目的地进行聚类,得到多个聚类簇;S400、将聚类元素最多的聚类簇对应的候选目的地作为最终的目的地。本发明通过游记数据自动提取的方法,实现了对用户游记中提到的目的地和POI精准识别,提高游记

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 114298045 A (43)申请公布日 2022.04.08 (21)申请号 202111626090.1 (22)申请日 2021.12.28 (71)申请人 携程

文档评论(0)

1亿VIP精品文档

相关文档