排行榜算法调研.doc

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
排行榜算法调研排行榜算法调排行榜算法调研排行榜算法调研

目录 一、 已有音乐排行榜的算法 1 1. 音乐V榜排名算法 1 2. 音乐银行排名算法 2 二、 非音乐类的排行榜算法 2 1. IMDB电影排名算法(贝叶斯平均) 2 2. 安卓应用市场排名算法 2 3. Hacker News热门主题排名算法 3 4. Reddit热帖排名算法 3 5. Stack Overflow热门问题排名算法 4 三、 其他可参考算法 4 1. 牛顿冷却定理 4 2. 威尔逊区间 4 3. 微博客影响力计算方法 5 已有音乐排行榜的算法 由于大多音乐榜没有公开自己的榜单排名算法,目前我们能够得到具体算法模型的音乐排行榜只有音乐V榜和音乐银行(韩国)。 音乐V榜排名算法 音乐V榜按欧美、港台、内地、韩国、日本分为五个榜单,五个榜单之间分数无任何关联和影响,具体歌曲V榜根据艺人所在地区来划分。 其各个榜单采用的计分公式如下: (1) 式(1)中表示MV在某单项上的数据,y表示所处语种的MV在该单项上最高数据,表示该单项的权重,最终得分为各单项加权分之和。 各单项极其权重详细描述如表1.1-1: 名称 详细 站内完整播放次数 15% 指MV在站内被完整播放的次数(包括悦单里的播放), 同一IP下多次观看每天只记10次 站内完整播放次数 15% 除去新浪微博、腾讯微博、QQ空间、朋友网的站外,MV被完整播放的次数,同一IP下多次观看每天只记10次 推荐次数 5% 同一ID针对一支MV总共只能收藏一次,同一IP下每周最多记10次; 收藏次数 7.5% 同一ID针对一支MV多次下载总共只记一次,同一IP下每周最多记10次 下载次数 12.5% 同一ID针对一支MV,一天只能推荐一次,同一IP下每周最多记5次 评论用户数 5% 同一用户每周多次评论只记一次 新浪微博 12.5% 指MV在新浪微博被完整播放的次数,同一IP下每周最多记10次 腾讯热度 12.5% 指MV在腾讯微博、QQ空间、朋友网内被完整播放的次数,同一IP下每周最多记10次 人人Like 7.5% 指在站内播放页MV被点击(人人) 喜欢 按钮的次数 QQLike 7.5% 指在站内播放页MV被点击(空间) 赞 按钮的次数 表1.1-1 音乐V榜评分单项极其权重 音乐银行排名算法 音乐银行排名得分公式如下(总分200000): (2) 式(2)中表示音源销量占有率: 歌曲音源销量所有歌曲音源销量 表示好感度: 好评总数1000 表示销量占有率: 专辑销量所有专辑销量 表示放送回数: 单曲放送回数总放送回数 非音乐类的排行榜算法 调研过程中找到部分非音乐类的排行榜算法,可作为参考。 IMDB电影排名算法(贝叶斯平均) IMDB电影排名的计分公式如下: (3) 式(3)中,表示该电影的总投票数列入前250所需要的最少票数目前是1300票数据库中所有电影的总平均分目前是6.7 安卓应用市场排名算法 安卓应用市场排名的计分公式如下: (4) 式(4)中,指标A为总安装总下载,B为评分5,C为留存安装总安装。 Hacker News热门主题排名算法 Hacker News是一个网络社区,可以张贴链接,或者讨论某个主题。 它的排名算法是这样实现的: (5) 其中,P表示帖子的得票数,减去1是为了忽略发帖人的投票。 T表示距离发帖的时间(单位为小时),加上2是为了防止最新的帖子导致分母过小(之所以选择2,可能是因为从原始文章出现在其他网站,到转贴至Hacker News,平均需要两个小时)。 G表示重力因子(gravityth power),即将帖子排名往下拉的力量,默认值为1.8。 Reddit热帖排名算法 Reddit排名算法支持投赞成和反对两类票,其算法中的参数有: 帖子的新旧程度   发贴时间2005年12月8日7:46:43 的单位为秒 投票方向   是一个符号变量,表示对文章的总体看法。如果赞成票居多,就是;如果反对票居多,就是;如果赞成票和反对票相等,就是。 帖子的受肯定(否定)的程度    表示赞成票与反对票之间差额的绝对值。如果对某个帖子的评价,越是一边倒,就越大。如果赞成票等于反对票,就等于。 结合以上几个变量,Reddit的最终得分计算公式如下: (6) Stack Overflow热门问题排名算法 Stack Overflow是世界排名第一的程序员问答社区,其对当前热门问题的排名计算公

您可能关注的文档

文档评论(0)

cxiongxchunj + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档