选择性集成（SelectiveEnsemble）.ppt

下载文档 降价啦

1
0
约 27页
2017-09-24 发布于上海
举报
版权申诉
保障服务

选择性集成（SelectiveEnsemble）.ppt

1、本文档共27页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

选择性集成 (Selective Ensemble) 周志华 /people/zhouzh/ Email: zhouzh@ 南京大学计算机软件新技术国家重点实验室泛化：generalization 泛化能力越强，处理新数据的能力越好泛化能力是机器学习关注的基本问题之一提高泛化能力是永远的追求泛化能力集成学习（Ensemble Learning）是一种机器学习范式，它使用多个（通常是同质的）学习器来解决同一个问题集成学习问题 … ... … ... 问题集成学习中使用的多个学习器称为个体学习器当个体学习器均为决策树时，称为“决策树集成” 当个体学习器均为神经网络时，称为“神经网络集成” …… …… 由于集成学习技术可以有效地提高学习系统的泛化能力，因此它成为国际机器学习界的研究热点，并被国际权威 T.G. Dietterich 称为当前机器学习四大研究方向之首[T.G. Dietterich, AIMag97] 集成学习的重要性问题：对20维超立方体空间中的区域分类左图中纵轴为错误率从上到下的四条线分别表示：平均神经网络错误率最好神经网络错误率两种神经网络集成的错误率令人惊奇的是，集成的错误率比最好的个体还低 [L.K. Hansen & P. Salamon, TPAMI90] 集成学习的用处集成学习技术已经在行星探测、地震波分析、Web信息过滤、生物特征识别、计算机辅助医疗诊断等众多领域得到了广泛的应用只要能用到机器学习的地方，就能用到集成学习期望结果个体1 (精度33.3%) 个体2 (精度33.3%) 个体3 (精度33.3%) 集成(精度33.3%) 投票个体必须有差异期望结果个体1 (精度33.3%) 个体2 (精度33.3%) 个体3 (精度33.3%) 集成 (精度0%) 投票个体精度不能太低个体学习器越精确、差异越大，集成越好 [A. Krogh & J. Vedelsby, NIPS94] 如何构建好的集成既然多个个体的集成比单个个体更好，那么是不是个体越多越好? 更多的个体意味着：在预测时需要更大的计算开销，因为要计算更多的个体预测更大的存储开销，因为有更多的个体需要保存个体的增加将使得个体间的差异越来越难以获得个体越多越好吗？ Many Could be Better Than All：在有一组个体学习器可用时，从中选择一部分进行集成，可能比用所有个体学习器进行集成更好 [Z.-H. Zhou et al., AIJ02] 从一组个体学习器中排除出去的个体（k）应满足：分类选择性集成回归遗憾的是，上述公式在解决实际问题时难以直接使用 … ... w1 w2 … ... wn 利用遗传算法进化 … ... 遗传算法选择随机生成若干权向量，权向量的每个分量对应了一个个体学习器，这些权向量被遗传算法进化，得到一个最优权向量，它表示了各个体学习器在构成集成时的“重要性”，据此进行个体的选择假设 w2 < 1/n 分类：有排除的投票回归：有排除的平均为了证明选择性集成学习的可操作性，我们提出了GASEN算法 w11 w12 … ... w1n w21 w22 … ... w2n wm1 wm2 … ... wmn 随机生成一个权向量群体 … ... … ... … ... … ... [Z.-H. Zhou et al., AIJ02] GASEN（基于遗传算法的选择性集成学习算法）与著名的集成学习算法Bagging和Boosting相比，GASEN 获得了更高的(或相当的) 精度，而且使用的个体学习器少得多 (回归：19% (3.71/20)；分类：36% (7.10/20.0)) [Z.-H. Zhou et al., AIJ02] 实验结果给定学习目标和训练集规模， bias 度量了学习算法的平均估计结果与目标的接近程度 variance 度量了在同样规模的不同训练集上，学习算法的估计结果的扰动程度以往研究表明，Bagging主要减小variance，而Boosting主要减小bias [E. Bauer & R. Kohavi, MLJ99; L. Breiman, TechRep96] 我们采用的分解机制为 [R. Kohavi & W.H. Wolpert, ICML96] Bias-Variance分解在回归任务中，GASEN在减小bias和variance方面都优于Bagging和Boosting