- 0
- 0
- 约8.38千字
- 约 7页
- 2023-06-05 发布于四川
- 举报
本发明涉及网络中的数据挖掘技术领域,公开了一种基于用户微博文本数据推测用户常驻位置的方法,包括:文本获取:基于城市关键字,爬取关键的文本和信息;文本预处理:过滤掉文本中的干扰信息;构建地理位置词典:基于区域名称构建地理位置词典;构建地理位置相关特征集:将微博发文分词后,构建地理位置相关特征集,并为特征集中的特征词赋权;构建用户发文位置预测模型和构建用户主要活动位置推测模型。本发明示例的技术方案,可以更好地克服社交媒体短文本特征带来的数据稀疏问题,从而更准确地推测出微博用户的主要活动位置。
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 112733000 A
(43)申请公布日 2021.04.30
(21)申请号 202110223539.3 G06Q 50/00 (2012.01)
(22)申请日 2
原创力文档

文档评论(0)