关于机械学习的试验设计初探.pdfVIP

  • 5
  • 0
  • 约7.55万字
  • 约 29页
  • 2018-06-07 发布于贵州
  • 举报
关于机械学习的试验设计初探

中文摘要 中文摘要 机器学习是一个从数据中学习规则、识别模式的过程。机器学习是人工智 能的产物,在金融、工业、商业、互联网以及航天等各个领域均发挥着重要的 作用。在机器学习中,数据需要分为训练集和检测集,传统的做法是随机抽样 选取训练集,将剩余的数据作为检测集。但是这种做法太过简单,所产生的训 练集有可能会带来偏差。此外,在一些领域,获取数据的响应值是困难或者昂 贵的,因此人们需要通过选取尽量少的训练样本,来得到较好的结果。为了达 到这些目的,我们可以将试验设计,应用于机器学习训练集的选取。我们认 为,只要你的试验设计的恰当合适,那么机器学习的效率也会更好。本文通过 两个机器学习算法的例子,利用模拟数据,将序贯设计和近似正交拉丁超立方 体设计等运用于机器学习的过程,结果表明,学习算法的效率和精确度都得到 了提高。第一个例子,我们将序贯设计运用于分类问题的训练集选取,运用贝 叶斯logit极大似然算法计算分类问题的分类边界,模拟结果表明,只用一小部 分的数据,便可以估计得到使用全部数据估计的分类边界。这有助于降低成本, 在实际应用中有重要的意义。第二个例子,我们将分层性和正交性引入利用 Lasso做变量选择的过程。我

文档评论(0)

1亿VIP精品文档

相关文档