- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
社交网络大数据时代的用户兴趣层次化模型构建分析
摘 要:随着社交网络的不断发展及普及,人们也逐渐活跃在一个或者多个社交网络中,这对研究用户的兴趣,为用户提供精准的网络推送提供了基础。目前,我国对此的研究有很多,但是社交网络整合信息的研究却较少,在如今大数据的环境下,社交网络的用户需求、兴趣也有了可能。基于此,基于大数据时代背景,提出了社交网络用户兴趣层次化模型的构建。
关键词:社交网络;大数据时代;用户兴趣;层次化建模
web2.0时代已经逐渐到来,网络用户也不断追寻全新的应用体验,在此背景下,社交网络油然而生。社交网络指的就是以互动作为基础,以网络中用户的共同兴趣、活动及爱好为前提,以实名制或者非实名制的方式在网络中构建的社会关系网络服务,其是社会化媒体的一种主流形式,其中包括婚恋交友网络。在如今大数据时代的今天,运用数据及挖掘数据决定着社交网络的未来,所以用户的兴趣数据对社交网络具有重要的价值意义。
1 用户兴趣模型的表示
兴趣模型指的是在一定数据结构中,通过算法表示的一种形式,兴趣模型的表现形式影响着模型对用户兴趣的描述能力及计算能力。用户兴趣模型包括两方面,分别为以向量空间模型为基础及以神经网络为基础:其一,以向量模型为基础。以向量模型为基础主要是将用户的兴趣模型当成一个n维的特征向量((t1,w2),(t2,w2),...,(tn,wn)),以此表示用户感兴趣的事物及对其的感兴趣程度。ti(1≤i≤n)为兴趣特征;wi(1≤i≤n)表示兴趣特征的?d趣模型权重。其二,以神经网络为基础。神经网络就是多种简单处理单元通过互联形式,以此构成的网络结构,其组织、学习及适应能力超强。以神经网络为基础的用户兴趣模型能够通过网络连接的权重网络进行表示。[2]
2 基于大数据的社交网络用户兴趣层次化模型的构建
2.1 构建兴趣层次化模型的思路
为了能够构建基于大数据时代的社交网络用户兴趣层次化模型,本文提出了如图1的研究思路:其一,在现实社交网络中,有多种数据来源方式,总的来说可以分为标签及无标签两种。用户在注册社交网站的时候要填写基本信息,有的社交网站还会要求用户填写个人标签。个人标签是能够直接反映用户感兴趣领域的方式,但是没有标签属性的信息提取只能够通过内部的结构信息实现。通过上述就可以看出,标签数据具有预测用户评论、浏览等行为的作用,非标签行为也能够论证用户的兴趣领域。其二,创建用户兴趣模型的主要目的就是能够为用户推送感兴趣的信息,并且为用户推荐具有相同信息的好友,以此描述社交网络中不同用户的不同偏好,从而创建个人偏好的名片,从而标记用户对象,满足用户的需求,提高用户推荐的成功率,从而提高商家的利益。[3]
2.2 用户兴趣层次化模型的构建方式
通过以上算法,把所有用户都聚集到同一个类中,使其兴趣通过属性值、类别及兴趣度表示,这些都是用户的共同兴趣,算法步骤为:(1)创建一个用户兴趣池Mki,用户兴趣池表示为属于第k类中第i个用户的兴趣集合,兴趣池中的每个元素都是由三元组()表示的,F表示属性值词汇,V表示兴趣度,C表示类别。(2)将属于第k类集中的用户兴趣相互聚集,以此生成一个兴趣池Mi。(3)确定兴趣池中属性值的最终权值,将属于第k类用户的属性值兴趣度标准化,以此得到最终兴趣度。(4)用户共同兴趣表示为阙值小于兴趣度的数据。
从而能够得出用户的长期兴趣向量IML=(,,...,vij,cj),i表示属性值的个数,j表示类别个数。
3 实验分析
从某个交友网站中选取实验数据,得出训练集为两百名用户的基本信息,实现用户的聚类,随机选择一个类,获取一百名此类别用户在最近一周的浏览行为。
为了证明本文中的方式能够得到准确的兴趣模型,通过评价指标对模型进行评价。选择的两百名用户的评价指标为查全率及查准率,通过本文中的方法对用户创建兴趣模型。查全率能够呈现出上述方法的用户兴趣寻找能力,从而判断用户兴趣模型的全面性,查准率能够呈现出上述方法的用户兴趣准确度。
通过聚类分析法对数据集中的两百个样本训练,创建用户兴趣值,获得用户的长期兴趣IML。计算出一百名交友网站用户兴趣模型的查全率及查准率。
使用本文中的方法计算的查全率及查准率分别为0.816及0.786,传统模型的查全率及查准率分别为0.524及0.562,以此证明本文中的方法能够精准的发现用户的兴趣分类,以此满足社交网站及需求。
4 结束语
随着社会的不断进步,互联网技术也在不断的发展,使用社交网络的用户越来越多,以此构成了较大的用户数据。本文通过标签传播集成、创建用户兴趣模型,以此构建了社交网络用户兴趣层次化模型,社交网络可以通过其为用户推动个性化广告,并且为用户推荐相同兴
您可能关注的文档
- 人文关怀视角下大学生思想政治教育研究.doc
- 人性化服务在麻醉护理中的应用效果.doc
- 人性化管理模式在脑外科护理管理中的应用.doc
- 人性化护理对小儿支气管哮喘的护理效果.doc
- 人性化护理对眼科门诊患者护理效果研究.doc
- 人性化护理干预在胃癌手术患者中的护理效果探析.doc
- 人性化护理教育在内科门诊患者输液中的应用.doc
- 人性化护理在妇产科临床中的效果研究.doc
- 人性化护理在妇产科手术护理中的应用研究.doc
- 人性化护理在精神疾病患者康复治疗中的应用效果评价.doc
- 装饰公司水管固定间距验收管理细则.doc
- 网络公司用户服务标准管理细则.doc
- 国家治理现代化视域下的应急社会动员能力研究——基于超大型城市应急管理“十四五”规划的政策文本分析.pdf
- 公平正义原则在新时代国家治理中的作用——基于社会主要矛盾角度的分析.pdf
- 储蓄和投资对中国经济增长的影响分析——基于中国金融社会核算矩阵乘数效应研究.pdf
- 失能老年人社会参与和生活满意度的相关性:基于CLHLS数据实证分析.pdf
- 基于贝叶斯网络模型的社区老年人社会衰弱影响因素分析.pdf
- 数字赋能乡村庭院经济高质量发展:机理、梗阻与路径——基于社会质量理论的分析.pdf
- 基于Ucinet的国内教育数字化研究可视化分析.pdf
- RCEP成员国文化产品贸易网络演化及结构分析.pdf
文档评论(0)