- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
阿里天池大数据竞赛实战:RFGBRT 完成过程
1、Xlab GBRT上手
1.1、训练特征表准备
训练的特征表gbrt_offline_section_one_24格式为:user_id,brand_id,feature1,feature2...Label ? ? ?
见下图:
1.2 、建立特征稀疏表,为训练做准备
特征稀疏表可直接在Xlab由原始特征表转换得到,截图如下:
进入普通表转稀疏矩阵界面后,在选择列里填上: user_id对应的列号(表默认从0列开始),brand_id对应的列号,以及想要使用的众多特征对应的列号(不需要填写标签对应的列号!!!);然后在输出表里填上转换成的稀疏矩阵:gbrt_offline_section_one_24_1;如下图
1.3 、GBRT训练
? ? ? ?利用训练的特征表gbrt_offline_section_one_24,进行GBRT训练,如下图所以
进入配置界面,勾选训练的标签,稀疏矩阵名处输入刚才转好的稀疏矩阵gbrt_offline_section_one_24_1,模型输出表处填写模型输出表名,参数配置处根据效果进行配置(最开始默认就可以的)。如下图所示:
配置好只好就可以进行训练了,等待训练好之后等到GBRT预测模型:gbrt_offline_section_one_25;
1.4、GBRT预测特征表准备
训练的特征表gbrt_offline_section_two_11格式与训练特征表格式一样,为:user_id, brand_id, feature1, feature2...Label ? ? ?见下图:
1.5、建立预测稀疏矩阵表
特征稀疏表可直接在Xlab由原始特征表转换得到,方法和原来一样,直接截图如下:
需要注意的是,选择列必须和训练时候一样!!!
1.6、GBRT预测
利用转好的预测稀疏矩阵表gbrt_offline_section_two_11_1进行预测,如下图所示
进入界面如下:model 处填写刚才训练好的GBRT模型表:gbrt_offline_section_one_25;输出表名处填写预测结果输出表?gbrt_offline_section_two_13,然后进行预测,如下图所示:
1.7、GBRT碎碎念
GBRT预测好之后,得到的结果为与原始预测表gbrt_offline_section_two_11一一对应的单列值y_var(搞不懂为什么不提供类似RF那样预测结果追加user_id,brand_id 列),如下图:
所以,还得进行追加ID列,进行zxs_gbrt_offline_section_two_13_1和zxs_gbrt_offline_section_two_11_1两张表的合并,得到类似user_id,brand_id,y_val的表,取阈值进行推荐就可以了,下图为xlab里提供的脚本,追加ID列代码。
另外:附上脚本实现的代码,方便测试:
2、Xlab RF上手
2.1、训练特征表准备
训练的特征表gbrt_offline_section_one_24格式为:user_id,brand_id,feature1,feature2...Label ? ?(和GBRT时候是一样的),见下图所示:
? ? ? ? ? ? ? ? ? ? ? ? ? ?
2.2、RF训练
利用训练的特征表gbrt_offline_section_one_24,进行RF训练,如下图所以
? ? ? ? ? ? ? ? ? ? ? ? ??
进入配置界面,在Features 框里勾选训练特征以及该特征连续与否,在Class框里目标处选择标签列,模型输出表处填写输出模型表名:gbrt_offline_section_one_25;进一步,点击参数配置选项卡,进入参数配置界面,进行参数配置,我们主要配置了树的棵树,配置好后,进行训练,如下图所示:
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?
训练结束,得到RF模型表gbrt_offline_section_one_25。
2.3、RF预测
利用预测特征表gbrt_offline_section_two_11进行RF预测,如下图所示:
? ? ? ? ? ? ? ? ? ? ??
进入配置界面:在结果附加列中添加user_id ,brand_id 列,勾选目标列2分类,主分类为1,这样预测结果表中就会给出预测为1 的概率值,输出信息处填写预测输出表,进行预测,如下图:
? ? ? ? ? ? ? ? ? ? ? ? ?
预测完成
您可能关注的文档
最近下载
- 2025秋统编版(2024)小学道德与法治三年级上册(全册)课时练习及答案(附目录).docx
- (2025秋新版)人教版三年级数学上册《观察物体》PPT课件.pptx VIP
- (鲁班奖)网架专家论证汇报资料.ppt VIP
- 行业资料 - 国家储备林改培技术规程-国家林业局.pdf VIP
- Q960E高强度调质钢焊接工艺研究.pdf VIP
- 2025-2026学年第一学期数学教研组工作计划.doc VIP
- ISO15378-2017药包材对ISO9001的应用.pptx VIP
- 13.1三角形的概念 课件(共24张PPT) 人教版(2025)数学八年级上册(含音频+视频).pptx VIP
- 2025级中职语文教学工作计划5篇.pdf VIP
- 第十章 商品的品名品质数量和包装.ppt VIP
文档评论(0)