- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于社交属性的时空轨迹语义分析-快速了解中国科学信息科学
中国科学: 信息科学 2017 年 第47 卷 第8 期: 1051–1065
SCIENTIA SINICA Informationis
从大数据到大知识工程专刊 论文
基于社交属性的时空轨迹语义分析
1,2 1*
殷浩腾 刘洋
1. 山东大学计算机科学与技术学院, 济南 250101
2. 北京大学前沿交叉学科研究院, 北京 100871
* 通信作者. E-mail: yliu@
收稿日期: 2017–04–07; 接受日期: 2017–05–10; 网络出版日期: 2017–08–16
国家重点基础研究发展计划(973) (批准号: 2015CB352502)、国家自然科学基金 (批准号: 和山东省自然科
学基金 (批准号: ZR2015FM002, ZR2016FB14) 资助项目
摘要 时空数据具有多维关联特性, 而深度学习恰恰因其能够对复杂高维数据进行高层抽象处理而
备受关注. 本文依据轨迹数据特征给出其形式化定义, 并据此构建基于Word2vec 的时空语义轨迹
模型. 通过模型网络训练位置特征向量, 对不同时间粒度下的用户轨迹进行语义探究. 实验中采取
Top- 近邻预测和聚类分析等手段验证了轨迹模型在无监督式学习下输出的位置向量具备空间语
义且定型良好. 其结果也进一步检验了基于词向量的语言模型迁移至轨迹挖掘的研究具备可行性.
关键词 社交网络, 时空轨迹, 语义分析, 特征向量, 深度学习
引言
随着基于位置的社交网络 (location-based social networks, LBSNs) 的兴起, 人们越发热衷于以在
线签到的形式将个人地理信息 (如 GPS 坐标、景点地标等) 分享在社交平台上. 由此产生的 “签到”
数据一般由个人标识、空间位置及时间戳等多元组构成, 愈发展现出巨大的发掘潜力. 依据签到数据
可以再现用户兴趣点的时空序列轨迹. 大规模的用户移动轨迹具有群体行为特征, 结合用户的社交属
性可以深入探索用户活动趋势, 进而能够预测社会群体的行为模式, 发掘其潜在逻辑.
基于用户兴趣点 (point of interest, POI) 签到数据的研究近年来获得极大关注: 在可视化方向,
基于 POI 绘制社会迁徙图谱 揭示了在不同时空背景下的人流宏观移动趋势; 在数据挖掘领域, 通
过 POI 数据对用户活动的时空偏好进行建模 、基于时间感知进行目标位置推荐 等研究层出不
穷. 传统的用户轨迹挖掘主要基于 Markov 模型
、频繁统计模式 及改进的多阶 Markov 或隐
Markov 模型 等方法, 但大部分方法局限于表面描述而忽略了时空数据的深层内涵. 利用话题模型
1) 百度地图, 迁徙人气—— 全国人口的迁徙路书. /.
引用格式 殷浩腾 刘洋 基于社交属性的时空轨迹语义分析 中国科学 信息科学
⃝ 《中国科学》杂志社
殷浩腾等: 基于社交属性的时空轨迹语义分析
进行用户移动模式发现的研究也具有相当的代表性, 如采用 LDA (latent Dirichlet allocation) 和
ATM (author topic model) 等主题模型直接挖掘轨迹的隐含信息
文档评论(0)