大学课程《社交大数据分析方法与应用》PPT课件:04-社交网络的关键点识别.pptVIP

大学课程《社交大数据分析方法与应用》PPT课件:04-社交网络的关键点识别.ppt

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

特征向量中心性(续)令,则有上式意味着X是矩阵A与特征值对应的特征向量,故此称为特征向量中心性。计算向量X的一个基本方法就是给定初值X(0),然后采用迭代方法*特征向量中心性(续)矩阵A是对称阵,其特征值均为实数,记其特征根和特征向量为特征向量构成N维线性空间的一组基,因此初值X(0)可表示为这组基的线性组合经过k步迭代后得到*特征向量中心性(续)如果为矩阵A的模最大的特征值,则有上式意味着特征向量中心X应该是与对应的特征向量,也称为主特征向量*累计提名算法累计提名(cumulativenomination):在每次迭代过程中,同时考虑邻居节点和自身的打分值。设为节点i在t时刻得到的提名次数。假设t=0时每个节点都获得1次提名(即);于是定义节点在t+1时刻的累积提名为*累计提名算法(续)将归一化,得到:如果所有节点归一化后的提名次数不再变化,则停止迭代;稳态时每个节点的提名次数占所有节点的提名次数的比例就是其重要性权值.*PageRank算法Google的创始人之一LarryPage于1998年提出了PageRank,并应用在Google搜索引擎的检索结果排序上,该技术也是Google早期的核心技术之一。整个Web可以抽象为一张有向图。如何对网页的重要性进行排序,即相当于网络中节点的重要性排序。*如果多个网页指向某个网页A,则网页A的排名较高。如果排名高A的网页指向某个网页B,则网页B的排名也较高,即网页B的排名受指向其的网页的排名的影响。链向网页E的链接远远多于链向网页C的链接,但是网页C的重要性却大于网页E。这是因为网页C被网页B所链接,而网页B有很高的重要性。PageRank算法的核心思想假设网页X的排名用PR(X)表示,因为网页B和C指向了A,简单的想法是,A的排名为:但网页C只指向了A,而网页B不仅指向了A,还指向了D,因此上面的公式更合理地修改为:意思是,B的PageRank值被分给了A和D,而C的PageRank值全都给了A。PageRank算法的核心思想PageRank算法(续)根据以上假设,得到PageRank算法的简化模型:其中M称为转移矩阵,元素Mij表示第j个节点转到第i个节点的概率。*PageRank算法(续)假设A、B、C、D四个页面的初始影响力都是相同的,即:当进行第一次转移之后,各页面的影响力w1变为反复迭代,直到收敛,可以收敛到(0.3333,0.2222,0.2222,0.2222),也就是对应着A、B、C、D四个页面最终影响力。*PageRank算法的排名泄露排名泄露(RankLeak):如果存在网页没有出度链接,如A节点所示,则会产生排名泄露问题,经过多次迭代后,所有网页的PR值都趋向于0!*PageRank算法的排名下沉排名下沉(RankSink):若网页没有入度链接,如节点A所示,经过多次迭代后,A的PR值会趋向于0!*PageRank算法(续)为了解决排名泄露和排名下沉的问题,拉里·佩奇提出了PageRank的随机浏览模型。定义阻尼因子s,这个因子代表了用户按照跳转链接来上网的概率,通常可以取一个固定值0.85,而1-s=0.15则代表了用户不是通过跳转链接的方式来访问网页的,比如直接输入网址。参考资料:PageRank算法原理与实现,/p/6af90342c3ba?tdsourcetag=s_pcqq_aiomsg*LeadeRank算法LeaderRank算法:通过添加一个背景节点与网络中所有节点构成双向边来代替PageRank算法中的跳转概率(1-s),从而得到一个无参数的算法.*LeadeRank算法初始时刻:其中下标g表示背景节点。不断迭代直到稳态:注意,迭代过程中邻接矩阵为N+1阶(包含背景节点)。稳态时将背景节点的分数值LRg(tc)平分给其他N个节点,于是得到节点i的最终LeaderRank分数值为:参考资料:复杂网络实验8:LeaderRank算法(matlab),/ylf12341/article/details*Hits算法Hits算法

您可能关注的文档

文档评论(0)

专业写作专家 + 关注
实名认证
服务提供商

人力资源管理师持证人

专注于企业方案、制度、报告、总结、规划编制,PPT制作等

领域认证该用户于2023年09月21日上传了人力资源管理师

1亿VIP精品文档

相关文档