数据挖掘中所需概率论和数理统计知识.docVIP

  • 6
  • 0
  • 约8.71千字
  • 约 16页
  • 2017-08-22 发布于安徽
  • 举报

数据挖掘中所需概率论和数理统计知识.doc

前言 ? ??一个月余前,在微博上感慨道,不知日后是否有无机会搞DM,微博上的朋友@只看不发的围脖评论道:算法研究领域,那里要的是数学,你可以深入学习数学,将算法普及当兴趣。想想,甚合我意。自此,便从友人@rickjin写的“正态分布的前世今生”开始研习数学。 ? ? 如之前所说,“今年5月接触DM,循序学习决策树.贝叶斯,SVM.KNN,感数学功底不足,遂补数学,从‘正态分布的前后今生’中感到数学史有趣,故买本微积分概念发展史读,在叹服前人伟大的创造之余,感微积分概念模糊,复习高等数学上册,完后学概率论与数理统计,感概道:微积分是概数统计基础,概数统计则是DMML之必修课。”包括读者相信也已经感觉到,我在写这个系列的时候,其中涉及到诸多的数学概念与基础知识(例如此篇SVM文章内诸多max.s.t.对偶.KKT条件.拉格朗日.松弛因子等问题则皆属最优化理论与算法范畴内),特别是概率论与数理统计部分。更进一步,在写上一篇文章的时候,看到机器学习中那么多距离度量的表示法,发现连最起码的期望,方差,标准差等基本概念都甚感模糊,于此,便深感数学之重要性。 ? ? 很快,我便买了一本高等教育出版社出版的概率论与数理统计一书,此书“从0-1分布、到二项分布、正态分布,概率密度函数,从期望到方差、标准差、协方差,中心极限定理,样本和抽样,从最大似然估计量到各种置信区间,从方差分析到回归分析,bo

文档评论(0)

1亿VIP精品文档

相关文档