【精选】申购行为预测.pdf

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
【精选】申购行为预测

基于协同过滤的申购行为预测 一、目标、数据陈述 目标:通过历史交易数据,预测未来15 天会申购某种基金的客户。 训练数据:2011 年1 月至2012 年6 月8392 位客户的交易数据。 测试数据:2012 年7 月至2012 年12 月相同客户的交易数据。 数据结构示意图 本为所使用的数据由三个维度构成(数据立方体、或称张量数据)。 1. 第一个维度包含约14 万客户,过滤掉训练日期内交易次数小于10 次的客户,最终得到 8392 人。 2. 第二个维度包含5 种基金类型 (股票型、债券型、货币型、ETF 型、ETF 联接)。 3. 第三个维度是时间维度,时间跨度为 2011 年 1 月至2012 年 12 月,整合后的数据 15 天为一组。 通常,一个矩阵有两个下标,张量数据则用三个下标表示其元素。这个数据用A = �� 表 示,为张量的第(, , )个元素。(= 1,2, ⋯,8392)表示第几个客户,(= 1,2, 3,4,5)表示 基金类型,(= 1,2, ⋯,24)表示从2011 年1 月1 日起计算的第几个15 天。这样表示第c 个顾客在第t 个15 天申购了第f 种基金,申购量为 ;注意若 0则表示赎回。 模型示意图 二、结果预览 首先呈现的结果是预测两千人可覆盖的实际购买比率。例如,2012 年7 月1 日到2012 年7 月15 日中,对于测试人群8392 人,实际申购第一类基金的人数为222;模型依据五月份和 六月份的数据,预测最有可能购买的2000 人,实际购买人数为168。所以在7 月1 日的时 间点上,申购预测覆盖率为168/222=75.57% 。作为参考,2000/8392=24%——这是随机猜测 可覆盖的实际申购比率。 下表中详细列举了五类基金的预测情况。第三列为 FRM 模型的预测结果,第四列为本文模 型对FRM 的进一步提升。例如,对第一类基金,在7 月1 日至7 月15 日这个时间段内,14 万人的总申购人数为365 人。利用FRM 找到高频交易的8392 人,这些人中的实际申购人数 为222。模型预测最有可能申购的2000 人中,实际申购人数为168 人。最后一列为第三列 与第四列的比值。 2012 年7 月1 日至2012 年7 月15 日预测统计表 14 万人实际申 8392 人实际申购 预测 2000 人中 覆盖率 购人数 人数 实际申购人数 股票型基金 365 222 168 75.67% 债券型类基金 431 201 106 52.73% 货币型基金 2359 1311 572 43.36% ETF 基金 78 46 34 73.91% ETF 联接 554 441 281 63.72% 下图为模型“覆盖率”(上表最后一列)随时间变化情况,可见模型2012 年后半年的预测能 力相对稳定,且都好于随机猜测。对第一类、第四类、第五类的预测能力较好。但对第二、 三类基金申购的预测不理想。基线24%,是随机猜测的水平,也是模型应该达到的最低标准。 申购预测覆盖率 100.00% 90.00% 80.00% 70.00% 股票型 60.

文档评论(0)

pfenejiarz + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档