网站大量收购独家精品文档,联系QQ:2885784924

电子商务数据挖掘常用公式与算法.pdf

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
电子商务数据挖掘常用公式和算法 几何平均数 1 1 1 n x1 x2 x3 xn (x1 x2 x3 xn ) n lg [ (lg x1  lg x2  ... lg xn )] n 总体方差2 2 2  (x  ) / N 标准方差 2 2 把 开平方根就得到标准方差   (x ) / N 随机变量的概率分布 随机变量的概率分布可以用下面的公式表示: f (x) P (X  x) 标准差标准化 标准差标准化是将各个纪录值减去纪录值的平均值,再除以纪录值的标准差,即: x  x  ij ia x ij S i 其中, 为平均值,其表达式为: x ia 1 n xia xij n j 1 设Si 是标准差,有: 2 1 n Si (xij  xia ) n j 1 极差标准化 极差标准化是数据标准化的另外一种常用方式。对纪录值进行极差标准化变换是将各个纪录 值减去纪录值的平均值,再除以纪录值的极差,也就是数据集中的最大值和最小值之间的差 距,即: x  x  ij ia x ij max( x ij )  min( x ij ) 极差正规化 极差正规化又是另外一种常用的数据标准化方式,可以把所有的观测值转化到[0,1]的区间 之内。对纪录值进行极差正规化变换是将各个纪录值减去纪录值的极小值,再除以纪录值的 极差,即:  xij min( xij ) x ij max( xij ) min( xij ) 相似度公式       A B similarity (A , B ) cos( A , B )   || A || * || B || F 关于 的通用公式  2 precision recall F (1 )  2  precision  recall 当 =1 时,所表示的就是F1 的公式  precision recall F 2  1 precision recall PR 值 PR 值的简化公式是: PR (v) PR (u)  vB L (v) u 在公式中PR (u) 、PR (v) 是页面u 和v 的PR 值,L (v) 是页面v 的外链数,B 是链向页

您可能关注的文档

文档评论(0)

0520 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档