- 3
- 0
- 约9.67千字
- 约 10页
- 2023-05-05 发布于四川
- 举报
本发明公开了一种游记数据自动提取的方法、电子设备及介质,其中游记数据自动提取的方法包括S100、对待处理文本进行分词和命名体识别,得到多个分词和多个命名体;S200、基于目的地字典表从多个分词中筛选出候选目的地,和,基于语料库从多个命名体中筛选出候选目的地;S300、若所述候选目的地的数量大于预设值,对所有候选目的地进行聚类,得到多个聚类簇;S400、将聚类元素最多的聚类簇对应的候选目的地作为最终的目的地。本发明通过游记数据自动提取的方法,实现了对用户游记中提到的目的地和POI精准识别,提高游记
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 114298045 A
(43)申请公布日 2022.04.08
(21)申请号 202111626090.1
(22)申请日 2021.12.28
(71)申请人 携程
原创力文档

文档评论(0)