基于微博影力的评价模型.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于微博影力的评价模型

基于评价模型 摘要 本文研究的是问题。 对于问题一V编号。 对于问题二,首先,在问题一所建立模型的基础上,我们确立了将微博被转发次数和转发人的影响力作为我们评价微博影响力的指标。然后,我们统计了各条微博在各指标下的数据。其次,我们利用熵权模型将数据标准化处理,并求出了这两个指标在评价微博影响力时所占权重。最后,我们将各微博各指标下分数与权重相乘,并将所有指标分数求和得到最终微博影响力评分。将其排序筛选后,得到影响力最大的十条微博消息。 对于问题三,首先,我们根据题目对于好友圈的定义,将M={(i,j)}定义为关注情况矩阵,即第j用户关注第i用户的情况。进而将多人相互关注的关系用函数关系式表达出来,将所有符合条件的用户编号写入矩阵中。然后,先通过对符合两两关注情况的用户进行筛选,再从筛选好的用户中逐步添加用户,判断是否为三人相互关注,四人相互关注,直至好友圈内不能再添加人为止。此时的 好友圈为最大好友圈。最后,我们通过循环算法实现上述过程,得到了2000人微博环境下10人为最大好友圈,10000人微博环境下13人为最大好友圈,并求出了好友圈中所有用户的编号。 对于问题四,我们将其转化为优化问题,建立了0-1规划模型处理。首先,将用户发布消息与微博用户之间相互关注的情形转化为0-1矩阵(0表示用户未发布消息或表示微博用户之间未相互关注,1则反之),分别表示为x和A。这样若某用户能看到消息,则x与A转置后的矩阵乘积大于等于1。然后,我们将其推广至所有用户,将该问题转化为目标函数为发布消息的人数最少,约束条件为x与A转置后的乘积全部大于等于1的优化问题。最后,我们通过matlab中自带的遗传算法求得最小用户数。但发现效果并非很好。又采用了贪婪算法,求得了2000人微博环境下发布该消息的用户数最少为93人,10000人微博环境下则为249人。 本文建立的模型在已有文献的基础上有一定的改进,求解算法科学,定位速度更快,定位精度更高,有一定的实用和推广价值。 关键词熵权模型1 问题重述 1.1 问题背景 1.2数据集 data1.xls和data2.xls分别包含了当用户总量为2000和10000时这些用户的相互关注数据,每一行为该行号对应的用户对其它用户的关注信息。 数据文件data3.xls和data4.xls分别为当用户总量为2000和10000时这些用户发布或转发的消息数据,每一行为该行号对应的用户发布或转发的消息编号。 1.3 提出问题 根据上述问题背景数据,题目要求我们建立数学模型讨论下列问题。V定义合适的影响因子,并且找出影响力最大的十个大V。 某些微博消息,被大量的用户关注和转发,因而具有很大的影响,请找出影响力最大的十条消息。 在微博中,相互关注的用户被称为好友,对于一个群体,如果他们相互之间均为好友,则称为好友圈,请找出人数最多的好友圈。 假设一微博用户发布的消息,其粉丝都会看到,如果要发布一则消息,确保所有用户都能看到(不考虑转发),请选择一种发布该消息的用户数最少的方案。 2 模型假设用户之间不会因为消息的转发而对的原创者进行关注即关注是初始状态不会改变的。用户多次转发消息的情况。3 符号说明 第个的第个指标标准化后的值 为熵权法模型中所得的第个指标的权重 第个的第个指 第j列数据所属指标的熵值 第i个微博用户与第j个微博用户建立起的关注矩阵 注:其余符号在文中使用时说明。4 问题分析4.1问题一[1],并基于已给数据,我们确定了用户的影响力指标 图 其次,根据选好的指标,我们通过matlab程序对已给数据进行统计,求出各用户所关注的人数,发布或转发的微博数量,以及各用户被关注的人数。然后对各项指标下的数据进行标准化处理,作为各用户各项指标的得分,使用熵权法算出各项指标的权重。 最后,将各指标下的分数与权重相乘,再将各指标下处理后的分数相加,作为各用户影响力评判的最终得分。根据分数高低进行排序,筛选出影响力为前十的用户。 图 问题一思路流程图 4.2 问题二 4.3 问题三根据定义中的每个人都和圈中其余的人互相关注,所以,构成好友圈的用户好友即和某人互相关注由此我们可以缩小数据规模,只考虑存在相互关注情况的用户关注的情况可以列出采用循环算法从小找到最的好友圈。 ,若已知两人构成好友圈,第三人与这两人构成好友圈就说第三人与这两人都相互关注人的朋友圈内的任意一个人都找不到个人加入该好友圈,则该好友圈已为最大好友圈 最后,我们通过不断循环求解,得到在2000人微博用户环境下最大好友圈内人数为10人,10000人微博用户环境下最大好友圈内人数为13人。 图 好友圈确立示意图 4.4 问题四 5 模型建立与求解 5.1 问题一的模型建立与求解 5.1.1 数据1 博主粉丝数量的

文档评论(0)

wnqwwy20 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:7014141164000003

1亿VIP精品文档

相关文档