评《签到行为的可预测性及影响因素分析》.pdfVIP

评《签到行为的可预测性及影响因素分析》.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
本期 “复杂性科学” 专 栏 评 述 ◎评《签到行为的可预测性及影响因素分析》 ◆周 涛◆ 受益于最近飞速发展的信息技术,特别是手机和汽车上的 GPS ,我们可以直接或间接获得大量人类移 动轨迹数据,这给了研究人员一个前所未有的了解大规模群体复杂空间行为的机会。研究人类空间移动规 律对于防止和控制疾病传播、预测和控制交通流量、监测有拥挤踩踏风险的大规模高密度人群聚集、对人口 迁移行为的宏观理解等方面,都有基础性的价值。 在人类空间行为研究中,一个基本而有趣的问题,就是预测人们下一时刻要访问的地方。这个问题在 理论和应用两方面都非常重要。就理论而言,该问题不仅推动形成了很多先进的分析手段和预测算法,而 且也是一个机制模型研究的试金石—— 一个更好的理解或多或少能够提高我们预测的精确度。就应用而言, 了解用户下一时刻要去哪个地方,可以大幅度提高基于位置的广告推送的精确度,因为地点本身有时候也 潜在包含了内容——如果不吃饭,你不会去一个餐厅。 最近很多学者都对人类空间轨迹的可预测性进行了研究,例如电子科技大学学者就曾与 Barabasi 小组 合作,2010 年在《Science》上面撰文分析了人类空间轨迹可预测性的上界——让人惊讶的是,这个上界达 到了93%。不过让人多少有些遗憾的是,越是商业价值低的部分,越是容易预测(例如夜里总是呆在家里睡 觉,这部分位置信息很容易预测到,但是价值较小);而越是商业价值高的部分,越是难以预测。针对下一 个签到地的预测,就是属于商业价值高,但比较难以预测的。 在这篇论文中,卢扬等人分析了Gowalla 和手机QQ 用户的签到行为,他们的分析显示,签到行为具有 一定的记忆性。事实上,对于大多数用户而言,长距离跳转之后仍然倾向于长距离的跳转,而短距离跳转 之后倾向于短距离的跳转。另外,卢扬等人还发现,影响可预测性的最主要因素是用户访问的地点数和最 常访问地点在所有访问中的访问占比。 毫无疑问,卢扬等人的工作对于人类空间轨迹可预测性的研究有一定的贡献,但我觉得这个工作只是 开了个头,后面还有大量可以继续的研究。举个例子,所谓的真实熵,实际上是柯尔莫洛夫第二熵,其计 算往往要采用近似方法(例如本文采用的是Lip-Ziv 近似) ,这些近似在不同样本规模和不同分辨率情况下会 存在系统性的偏差,这可能才是影响可预测性的主要原因,而非人类行为的某些倾向性。例如Gowalla 和手 机QQ 可预测性的差异主要应该是地点分辨率造成的,而用户访问地点数对可预测性的影响植根于Lip-Ziv 的近似中。另外,我更希望看到的是,针对不同类型的空间轨迹,能否设计有针对性的算法,可以得到尽 可能精确的预测结果。 161

文档评论(0)

追云少女 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档