- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
电子商务数据挖掘常用公式和算法
几何平均数
1
1 1
n x1 x2 x3 xn (x1 x2 x3 xn ) n lg [ (lg x1 lg x2 ... lg xn )]
n
总体方差2
2 2
(x ) / N
标准方差
2 2
把 开平方根就得到标准方差
(x ) / N
随机变量的概率分布
随机变量的概率分布可以用下面的公式表示:
f (x) P (X x)
标准差标准化
标准差标准化是将各个纪录值减去纪录值的平均值,再除以纪录值的标准差,即:
x x
ij ia
x
ij
S
i
其中, 为平均值,其表达式为:
x
ia
1 n
xia xij
n
j 1
设Si 是标准差,有:
2
1 n
Si (xij xia )
n
j 1
极差标准化
极差标准化是数据标准化的另外一种常用方式。对纪录值进行极差标准化变换是将各个纪录
值减去纪录值的平均值,再除以纪录值的极差,也就是数据集中的最大值和最小值之间的差
距,即:
x x
ij ia
x
ij max( x ij ) min( x ij )
极差正规化
极差正规化又是另外一种常用的数据标准化方式,可以把所有的观测值转化到[0,1]的区间
之内。对纪录值进行极差正规化变换是将各个纪录值减去纪录值的极小值,再除以纪录值的
极差,即:
xij min( xij )
x
ij max( xij ) min( xij )
相似度公式
A B
similarity (A , B ) cos( A , B )
|| A || * || B ||
F
关于 的通用公式
2 precision recall
F (1 ) 2
precision recall
当 =1 时,所表示的就是F1 的公式
precision recall
F 2
1
precision recall
PR 值
PR 值的简化公式是:
PR (v)
PR (u)
vB L (v)
u
在公式中PR (u) 、PR (v) 是页面u 和v 的PR 值,L (v) 是页面v 的外链数,B 是链向页
您可能关注的文档
- 关于单片机指纹识别系统的设计.doc
- PF400变频器选型手册Draft20102.pdf
- 2011下半网络管理员下午试题.pdf
- 关于Sigmoid函数拟合的亚像素边缘检测方法.pdf
- 200881944302GeoEast主控.pdf
- 5-11输入输出.pdf
- _Fortinet服务体系摘要 版.pdf
- 机械制造中CADch02.doc
- 01_计算机联锁系统技术_第一节.pdf
- 第8章:K3上机日志清除使用.pdf
- 抢分秘籍10 带电粒子电场中的直线运动、偏转和交变电电场中的应用(三大题型)(原卷版)-2025年高考物理冲刺抢押秘籍.pdf
- 抢分秘籍11 带电粒子在组合场、叠加场中的运动(五大题型)(解析版)-2025年高考物理冲刺抢押秘籍.pdf
- 抢分秘籍11 带电粒子在组合场、叠加场中的运动(五大题型)(原卷版)-2025年高考物理冲刺抢押秘籍.pdf
- 抢分秘籍12 电磁感应中的电路与图像问题(二大题型)(解析版) -2025年高考物理冲刺抢押秘籍.pdf
- 抢分秘籍12 电磁感应中的电路与图像问题(二大题型)(原卷版)-2025年高考物理冲刺抢押秘籍.pdf
- 抢分秘籍14 热力学定律与气体实验定律综合应用(五大题型)(解析版)-2025年高考物理冲刺抢押秘籍.pdf
- 抢分秘籍13 电磁感应中的动力学、能量和动量问题(三大题型)(原卷版)-2025年高考物理冲刺抢押秘籍.pdf
- 抢分秘籍14 热力学定律与气体实验定律综合应用(五大题型)(原卷版)-2025年高考物理冲刺抢押秘籍.pdf
- 抢分秘籍16 振动图像与波动图像的综合应用(三大题型)(解析版)-2025年高考物理冲刺抢押秘籍.pdf
- 抢分秘籍15 光的折射、全反射的综合应用(二大题型)(解析版)-2025年高考物理冲刺抢押秘籍.pdf
文档评论(0)