- 5
- 0
- 约6.54千字
- 约 8页
- 2022-03-25 发布于北京
- 举报
GDBT 原理及其并行化方法
仁重
本文以treelink 为例,介绍了GBDT 算法原理及其使用MPI 并行化方法。
treelink 是在阿里 内部广泛使用的一种算法,可以用于分类和回归,它是GBDT 的一种
具体实现。它的 准确率比较高,并且对连续特征处理比较好,不需要去做离散化,泛化
能力也比较强。
但是它的训练速度非常慢,在数据量大时基本上不可用。去年的treelink 优化比赛中,纯从
原创力文档

文档评论(0)