开题-面向人人网的社区发现系统的设计与实现.docxVIP

开题-面向人人网的社区发现系统的设计与实现.docx

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
1题目背景与意义1.1课题来源本毕业设计课题来源于国家科技支撑计划课题“社会网络结构分析与大数据处理技术”(2012BAH46B04)。1.2选题的背景与意义随着互联网Web2.0时代的到来,社交网站越来越受到广大网民的喜爱。截至2012年底,中国使用社交网站的网民达2.75 亿,占网民总数的48.8% [1]。同时社交网站规模也在不断增长,国外的SNS 社交网站主要以Facebook、Myspace、Twitter 为首,国内的主要有人人网、新浪微博、QQ校友、豆瓣网等。Facebook、人人网等基于真实资料的社交网站,将线下生活的更完整的信息流转移到线上进行低成本管理,这让虚拟社交与现实世界的社交越来越交叉。而实际上,广义的社交网络,不仅限于基于互联网的社交行为,也包括现实世界的社交行为。社交网络代表各种社会关系,经由这些社会关系,把从偶然相识的泛泛之交到紧密结合的家庭关系的各种人或组织串连起来[2]。社会网络由一个或多个特定的类型聚合,如价值观、理想、观念、金融交流、友谊、血缘关系、不喜欢、冲突或贸易。由此产生的图形结构往往是非常复杂的。社交网络呈现出很强的社区结构,也就是人们更倾向于与一个圈子中的人交往,而与圈子外的人的交往相对较少。社交网络的三元闭包原则表明,在一个社交圈内,若两个人有一个共同的朋友,则两个人在未来成为朋友的可能性就会提高[3]。人人网和新浪微博的作为社交网站中的两个代表,它们其实代表了不同的社交网络结构。在人人网、Facebook这样的基于用户真实姓名的社交网站中,人们的好友一般都是自己在现实社会中认识的人,比如亲戚、同学、同事等,而且人人网的好友关系是需要双方确认的。在新浪微博、Twitter里,人们的好友往往都是现实中自己不认识的,而只是处于对方言论的兴趣而建立好友关系,好友关系也是单向的关注关系。以人人网、Facebook为代表的社交网络称为社交图谱。而以新浪微博、Twitter为代表的社交网络成为兴趣图谱[13]。如何自动挖掘用户的社交圈或兴趣圈是一个很基础的问题,称社区发现(也称社群发现)问题。准确挖掘某个用户在人人上体现的社交关系,对很多具体的应用来说都很有价值。例如,可以更好地对用户的兴趣进行挖掘或者能够推荐用户还未加好友的社交圈子成员等,或者根据其社交圈子更准确的对用户进行个性化建模,为其他用户个性化模型的推荐或者广告推送等提供基础服务。但是,创建并维持这些社交圈子却是一个非常耗时的工程。首先,社交网络内的好友基数较大,在处理好友数据的时候需要考虑的因素也因此变得复杂。美国Facebook内部社会学家卡梅伦·马龙(Cameron Marlow)表示,Facebook社区用户的平均好友人数是120人,不少用户拥有超过500位好友[9]。用户的好友圈可能因性别、年龄、兴趣的不同而不同,在分析好友数据时不同的影响因素也会带来很大变化。其次,每个人从出生到工作,这使得“朋友圈”在保持稳定的情况下进行扩展变得有些困难。在一个成熟的社交网络中,用户的平均好友数仅为120-130。当好友数超过150-200,有些好友几乎就认不出来[12]。这揭示了一个事实:社交网络的确进化到了21世纪,可是我们大脑,并不比几千年前有多大的改观。可是,为什么我们不直接把我们的生活圈子(包括过去的、当前的、正在进入的)直接地在社交网络中列出来呢?那样的话,我们就可以很好地管理和识别我们多年来积攒的好友,有些也许已经淡忘,但是当把他们放回到他们所在的圈子中时,那些忘却的姓名将再度清晰;我们也可以利用圈子中人脉的力量,去寻找失散多年的好友;我们也可以跟旧时的玩伴分享现在的故事,他们也一定很渴望知道我们的近况。目前新浪微博中关于社交圈发掘的上线应用不超过5个,人人网中还没有。面对用户维护社交圈的需要,在人人网中开发出一款能发掘、展现用户社交圈的应用,还是十分必要的。2研究现状社区发现系统期望同时达到以下目标:一个用户有多个社交圈;用户的某个好友可以同时属于多个圈子;可以通过简洁的方式描述社交圈的性质或特点;尽可能不用隐私数据;大规模数据更新速度较快。目前针对社交圈这一类的社区发现问题,对已经投入使用的商业应用,在传统的即时通讯业务一直使用用户手动分组来区别用户好友圈,其中的代表是腾讯QQ和中国移动飞信;在社会性网络服务中,已经出现了一些自动识别用户好友圈的应用,其中为代表的是腾讯QQ的好友圈业务。另外,不少社交服务提供商以“好友推荐”为切入点,也对好友圈扩展的研究提供了实际应用的机会,但是由于商业限制,它们所使用的算法我们不得而知。对研究性课题,社交圈挖掘是目前社交网络中非常典型和热门的研究任务。学术界也陆续提出了很多算法,依托人人网、新浪微博等社交网站,以不同方式实现了社交圈的展示系统。2.1面向新浪微博的社交圈在Twi

文档评论(0)

1243595614 + 关注
实名认证
文档贡献者

文档有任何问题,请私信留言,会第一时间解决。

版权声明书
用户编号:7043023136000000

1亿VIP精品文档

相关文档