数据挖掘掘中统计学.ppt

  1. 1、本文档共35页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘中的统计学 参考资料 2013年6月2日星期日 纲要 概率论 数理统计 正态分布简史 中英文对照 条件概率 数学期望 正态分布简 概率分布 全概率 方差 史 集中趋势 贝叶斯公式 协方差 误差计算 离散程度 离散型随机 相关系数 分布形态 变量 主成分分析 连续型随机 中心极限定 变量 理 概率论总结 x2分布、t分 布、F分布 概率论 条件概率 全概率 贝叶斯公式 离散型随机变量 连续型随机变量 概率论总结 条件概率 ⊙定义 在同一个样本空间Ω中的事件A、B,如果从Ω中随机选出的一个元素 属于B,那么这个随机选出的元素也属于的概率就定义为B条件下A发生 的条件概率,即为 P(A|B)=|A∩B|/|B 分子、分母同除以|Ω1,得到条件概率的公式 P(A|B)=P(∩B)/P(B) 亦称为后验概率 ⊙P(A|B)与P(B|)的关系为 P(A|B)×P(B)=P(B|A)×P(A) 全概率公式 事 是一个概率空间的有限或者可数无限的分割,则对任意 件:有全程幸公式 ∩B1 又由条件率公式,得全概率公式 P(1)=∑P(B2×Pr(B;) 的先验概率=}的后验担率的先验期望值 贝叶斯公式 ⑤假设 的先验章或迦緣聞辛,之所以称力“先驴”昰因为它不考皮讧间 的因素; P(A.B:已知B发生后的条件率,称力的后验率 P(:已知支生后的条性概率,称力的后验實率 B3):B的先验ξ或也緣門率,也称作标非化常星 贝叶斯定理是关于A、B的条件柢牽和边缘概斈的定理 贝叶斯定理:后验概率-(相似度ⅹ先验概率)/标准化常量, 而相似度标准化常量也称作标准相似度 贝叶斯公式 ◎正概率是由原因推结果(现在推未来),称为概率论 某药厂用从甲、乙、丙三地收购而来的药材加工生产出一种中成药,三地 的供货量分别占40%,35%和25%,且 地的药材能生产出优等品的 概率分别为0.65,0.70和0.85,求从该厂产品中任意取出一件成品是优等 品的概率。(0.7175) ◎逆概率是由结果推原因(现在推过去),称为数理统计 如果一件产品是优质品,它的材料来自甲地的概率有多大呢?(0.3624) 先验概率 验概率 (B)P( B) P(B)P(A8 逆恨率公式(Baye公式) 离散型随机变量 ⑤X~01(B(1,p),01分布、两点分布,一次贝努利实验 (Xk)=p(1-1)1-k,k=0,1 项分布,n重贝努利实验 P(k CR p(1-p)I-k,k-O π(λ),泊松分布 P(X=k)2=入-2,k=0,1.,n 项分布中很大,p很小,λ1适中,则二项布逼近汨松分布 连续型随机变量 ⑤概率分布函数 随机变量N,对应变量y 中x的函数,定F(Y x) f 的率分布函数,问秫分布困数;性质:单调不漣,右连续 概率密度囪数 若存在非负国数f(1),使对于任意实数x,有 f(t)dt 則称?(x)封X的概窑度困数,简称率窑度 f(x)dx 连续型随机变量 ⑤均匀分布:-((a,b 型随机变量N的概率密度两敖f(x) (b) 则称在区同 0,其它 a,b眼.均匀分布 指数分布:x-E(1)或Exp() 连型随机要导的率密度国数(x)={x0,则F眼从指 0,x≤0 正态分布:X~N(μ,02),高斯分布 连续型随机变丶的概率密度围敖如下,则称\瑕以正分布 f(a) C σ√2丌

文档评论(0)

kefuxing + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档