节网络信息主动获取与处理PageRank排序研讨.ppt

节网络信息主动获取与处理PageRank排序研讨.ppt

节网络信息主动获取与处理PageRank排序研讨

方法的数学解释 从数学角度看,把非正则链的状态转移矩阵正则化,就是把不是强联通的图变成强联通的,是一种变换操作。 对全部的要素都考虑0.15的转移概率,意味着将原本非正则的状态转移矩阵转换为正则的状态转移矩阵,将原本并非强连通的图变成了强联通的。 相对于原来的状态转移矩阵,这样的变换操作能保证最大特性值的次数为1,也就保证了PageRank的存在。 PageRank数值计算难点 PageRank数值计算难点(一) 计算机容量限制 假设 N 是 104?的 order。通常,数值计算程序内部行列和矢量是用双精度记录的,N 次正方行列 A 的记忆领域为 sizeof(double)* N * N =8 *104?* 104=800MB。N 如果变成 105?或106?的话,就变成80GB, 8TB。这样的话不用说内存就连硬盘也已经很困难了。目前,Google处理着80亿以上的页面,很显然,已知的这种做法已经完全不适用了。 PageRank数值计算难点(二) 收敛问题 特征向量的求解,就是求解方程 ,是 N 元一次方程组,一般地不能得到分析解,所以只能解其数值。 然而,常用的迭代求解方法会导致收敛速度很慢。 思考 PageRank算法还可以应用在什么问题上? * 哈尔滨工业大学(威海)网络技术研究所 信息内容安全 王佰灵 网络技术研究所 哈尔滨工业大学

文档评论(0)

1亿VIP精品文档

相关文档