为什么大数据并不能帮你找到女朋友.pdf

为什么大数据并不能帮你找到女朋友.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
分析:为什么大数据并不能帮你找到女朋友 论文类别:计算机 - 互联网研究 上传时间:2016/2/15 11:29:00 论文作者:未知 (讯)今天是虐狗节,去年看过一篇文章,讲如何通过大数据找到你的另一半 (见参考资料)!里面通过理性建模和精准定位找到合适伴侣,不过大数据真有 这么神奇么?我就随便聊聊约会APP算法和现实中策略。 我们很多人抱怨现实中约会很难一下子找到宿命中的人,在线网站也让找到 真爱的几率变大,操作又容易上手。据我所知,目前微信,陌陌,探探,世纪 佳缘,match,tinder很多这样的 “严肃”交友(约会)的工具,他们号称采用 大数据建立人物画像,采用KNN聚合,DNN神经网络,帮你提升匹配率,找到 人生幸福另一半,事实上是这样的吗? 工作原理 当你把你的简历在这种网站或者APP更新,一些算法就开始准备潜在合拍 的。然后给你打分,或者随机给你几个选。而这些结果基于也许就几十个,一 般你回答几个问题,或者你产生的一些行为。基本数据:年龄、身高…户口所 在地、毕业学校、工作单位、家庭状况。一些网站最厉害的问你100个问题, 什么喜欢的颜色,食物,运动,偶像,喜欢看的书类型,然后开始关联账号, 微信,微博,比如微博、微信等社交媒体的内容及更新频率,QQ登录及在线时 间,更新发型频率,作息时间规律,经常出现的场所。 这些背后就是对用户行为做预测和匹配,跟亚马逊,Netflix去预测产品差 不多,不同的话Netflix推荐电影给你,电影却不需要反向去关注你。下面就 介绍一个有趣的匹配算法。 稳定婚姻匹配算法 1962年,美国数学家David Gale和Lloyd Shapley发明了一种寻找稳定婚 姻的策略,人们称之为延迟认可算法(Gale-Shapley算法)。 为了让大家相信数学家不是真得如此无聊,我要指出它确确实实是一个地道 的组合数学问题,有其特定的数学价值。当然啦,它也有很多别的背景和应 用,比如用来在若干个公司和应聘者之间进行招聘中介……但是数学家们怎么 会放过如此八卦的一个名字呢?于是它就这样流传下来了。 规则如下: 先对所有男士进行落选标记,称其为自由男。当存在自由男时,进行以下操 作: ①每一位自由男在所有尚未拒绝她的女士中选择一位被他排名最优先的女 士; ②每一位女士将正在追求她的自由男与其当前男友进行比较,选择其中排名 优先的男士作为其男友,即若自由男优于当前男友,则抛弃前男友;否则保留 其男友,拒绝自由男。 ③若某男士被其女友抛弃,重新变成自由男。 在算法执行期间,自由男们主动出击,依次对最喜欢和次喜欢的女人求爱, 一旦被接受,即失去自由身,进入订婚状态;而女人们则采取 “守株待兔”和 “喜新厌旧”策略,对前来求爱的男士进行选择:若该男子比未婚夫强,则悔 婚,选择新的未婚夫;否则拒绝该男子的求婚。被女友抛弃的男人重获自由 身,重新拥有了追求女人的权利——当然,新的追求对象比不过前女友。 这样,在算法执行期间,每个人都有可能订婚多次——也有可能一开始就找 到了自己的最爱,从一而终——每订一次婚,女人们的选择就会更有利,而男 人们的品味则越来越差。只要男女生的数量相等,则经过多轮求婚,订婚,悔 婚和再订婚之后,每位男女最终都会找到合适的伴侣——虽然不一定是自己的 最爱(男人没能追到自己的最爱,或女人没有等到自己的最爱来追求),但绝对 不会出现 “虽然彼此相爱,却不能在一起”的悲剧,所有人都会组成稳定的婚 姻。 这个是数学界切切实实研究过的问题。对于以前没有接触过这个问题的人, 这个理论最出人意外的结论是:传统的求爱,结婚过程是male-optimal的,也 就是说,男性能够得到尽可能好的心上人,女性却不然。这就是所谓的稳定匹 配问题(StableMarriageProblem,也叫稳定婚姻问题)。 真的行得通吗? 那么问题来了,这些数据和计算之后的结果会导致更好的匹配吗?我想还是 不行。这些约会工具越来越多,成功的反而越少。伯克利大学还做过调查,比 如说美国人只有5%是从网上认识建立长期关系(only 5 percent of Americans in long-term partnerships met online.) 那个报告说了几点有意思的,个性习惯的相同对健康的两性关系也没啥帮 助。就算算法再复杂,也对找到合适对象没多少帮助,除非你把可能遇见的人 数增加。 但最麻烦的还是用户会说谎,对他们多高,多重,收入,年龄都可能是瞎 扯,如果给你选择年薪3万,30

文档评论(0)

10301556 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档