简述机器学习十大算法的每个算法的核心思想、工作原理、适用情况及.docVIP

  • 7
  • 0
  • 约1.11千字
  • 约 4页
  • 2017-06-05 发布于天津
  • 举报

简述机器学习十大算法的每个算法的核心思想、工作原理、适用情况及.doc

简述机器学习十大算法的每个算法的核心思想、工作原理、适用情况及

简述机器学习十大算法的每个算法的核心思想、工作原理、适用情况及优缺点等。 1)C4.5算法: ID3算法是以信息论为基础,以信息熵和信息增益度为衡量标准,从而实现对数据的归纳分类。用信息增益率来选择属性,克服了用信息增益选择属性时偏向选择取值多的属性的不足; C4.5算法优点:产生的分类规则易于理解,准确率较高。 缺点: 在构造树的过程中,需要对数据集进行多次的顺序扫描和排序,因而导致算法的低效。 C4.5只适合于能够驻留于内存的数据集,当训练集大得无法在内存容纳时程序无法运行。 是一个聚类算法,把n的对象根据他们的属性分为k个分割,k n。 缺点是,分组的数目k是一个输入参数,不合适的k可能返回较差的结果。 朴素贝叶斯朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法。算法的基础是概率问题,分类原理是通过某对象的先验概率,利用贝叶斯公式计算出其后验概率,即该对象属于某一类的概率,选择具有最大后验概率的类作为该对象所属的类。朴素贝叶斯假设是约束性很强的假设假设特征条件独立 在朴素贝叶斯的应用中,主要研究了电子邮件过滤以及文本分类研究是在概率模型中寻找参数最大似然估计的算法其中概率模型依赖于无法观测的隐藏变量 E步估计隐含变量,M步估计其他参数,交替将极值推向最大PageRank算法 是google的页面排序算法,是基于从许多优质的网页链接过来的网页,必定还是优质

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档