python金融数据挖掘 决策树题目及答案.pdfVIP

python金融数据挖掘 决策树题目及答案.pdf

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

python金融数据挖掘决策树题目及答案

基本概念

决策树(DecisionTree)

它通过对训练样本的学习,并建立分类规则,然后依据分类规则,

对新样本数据进行分类预测,属于有监督学习。

优点

在相对短的时间内,能够对大型数据做出可行且效果良好的结果;

使用者不需要了解很多的背景知识,通过决策树就能够直观形象

的了解分类规则;

1)决策树易于理解和实现

2)决策树能够同时处理数值型和非数值型数据

逻辑-类比

决策树分类的思想类似于找对象,例如一个女孩的母亲要给这个

女孩介绍男朋友,于是母女俩有了下面的对话:

女儿问:“多大年龄了”;母亲答:“26”

女儿接着问:“长得帅不帅?”;母亲答:“挺帅的。”

女儿问:“收入高不?”;母亲答:“不算很高,中等情况”

女儿问:“是公务员吗?”;母亲答:“是,在财政局上班”

最后,女儿做出决定说:“那好,我去见见!”

这个女孩的决策过程就是典型的分类树决策:

在来看一个金融场景下的举例:客户向银行贷款的时候,银行对

用户的贷款资格做一个评估的流程:

首先银行工作人员询问客户是否有房产,如何回答有,则判断客

户可以偿还贷款,如果没有则进入第二层的属性判断询问,是否结婚,

如何已婚,两个人可以负担的起贷款,则判断为可以偿还,否则进入

第三层的属性判断询问,月薪是否超过五千,如果满足,则判断为可

以偿还,否则给出不能偿还贷款的结论。

看完上面两个例子,我们可以看出,决策树是非常实用的,下面

我们就进入正式案例的讲解;

案例实操

下面以金融场景举例:

(一)情景铺垫

用户购买金融产品的过程“类似于”理财,对于P2P平台来说,

严格来说,这个过程称之为撮合。

用户在金融平台上充值购买相应期限和约定利率的金融产品,产

品到期后,用户有两种选择一种是提现(赎回),另一种就是复投。

对于用户到期赎回的理解是比较简单的,比如你在2018年1月

1日买了6个月10万元定存金融产品,那么在2018年7月1日的时

候,你可以选择连本带息全部赎回,当然你也可以在到期日选择在平

台还款时,继续投资,这个过程就是复投。

(二)需解决的问题

作为金融平台来说,为了把控风险,保证资金的流动性,都一定

要提前预测(预判)未来一段时间内的用户充值和提现金额。

那么,准确预测用户到期是否复投,对于我们金融从业者和管理

人员来说,就是特别重要了。

那么,我们可以提出我们亟需解决的问题:

用户到期是否复投,我们该怎样预判?

(三)一个初步模型的建立

场景:预测用户是否复投

注:以下数据源模拟真实数据编撰

1.选择特征变量

(1)数据源抓取

importpandas

data=pandas.read

file:///Users/apple/Desktop/_reinvest,

encoding=GBK)

print(data)

注解(1):上面这份数据源已经经过了预处理(数据清理),在

实际工作种,我们拿到数据源的第一步一定是做数据清理的。在实操

种,是否有预处理这个过程,也是数据科学与传统的统计科学的重要

区别之一;本文数据示例,为了分享方便,示例数据还是比较规整的,

但在实际工作中,一定不要忘了数据清洗这一步。

注解(2):初始心里预期是一个产品概念,就是用户在购买定存

金融产品的时候,可以预先设定是否需要复投,当然这只是一个预设

定,在用户购买到赎回这个过程中,我们都可以随时变更。复投模式

是一个过去式,也是最终的复投结果,所以下面我们会把这列当作目

标变量来处理。

(2)哑变量处理(虚拟变量转化)

需处理的特征变量有:

金融产品

初始心里预期

客户类别

文档评论(0)

159****1506 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档