人工智能产业链发展分析报告.pdf

人工智能产业链发展分 析报告 2021 年5 月 4 华泰金工生成对抗网络系列研究尝试将生成对抗网络GAN 技术运用于量化投资研究。我们 测试GAN、WGAN 、RGAN 等模型生成单个资产收益率的仿真时间序列。结果表明,生成 对抗网络能够刻画单个资产真实收益率序列所具备的统计特性,如厚尾分布、波动率聚集 等,其中WGAN 模型生成效果相对更佳。 由于实际投资研究可能涉及到多个资产,为拓宽应用场景,我们将WGAN 模型进行改进, 使其同时生成多个资产收益率的仿真时间序列,并构建交叉相关性、波动率相关性等用于 评价多资产序列两两之间典型化事实的指标。结果表明,WGAN 模型能够胜任生成多资产 收益率序列的任务。 作为GAN 的一种经典变式,WGAN (Wasserstein GAN)将原始GAN 中的JS 散度替换 成Wasserstein 距离(简称 W 距离),用判别器估计生成分布与真实分布的W 距离,用生 成器拉近W 距离,以达到生成样本逼近真实样本的目标。换言之,WGAN 相对于原始GAN 的改进主要在损失函数部分,而基本没有改变GAN 的网络结构。 作为GAN 的另一经典变式,DCGAN (Deep Convolutional GAN,深度卷积生成对抗网 络)相对于原始GAN 的改进主要在网络结构部分。DCGAN 是引入CNN 的GAN :生成器 中使用转置卷积层代替上采样层,判别器中使用带步长的卷积层代替池化层同时去掉全连 接层,构成全卷积网络。DCGAN 在生成多资产收益率序列任务中表现如何?DCGAN 能否 与WGAN “双剑合璧”,使用DCGAN 的网络结构以及WGAN 的损失函数,从而达到更好 的生成效果? 图表1: 原始GAN 的改进方式 资料来源:华泰研究 本文首先介绍 DCGAN 的原理及算法,包括卷积与转置卷积、网络结构的设计规则、可能 存在的问题等。在 DCGAN 模型判别器卷积层中,使用多通道处理多资产序列的输入,以 适应生成多资产收益率的应用场景。随后简要回顾 WGAN 的基本思想以及优化目标函数, 使其代替原本DCGAN 模型中的二进制交叉熵损失函数,得到W-DCGAN 模型。采用前期 研究《人工智能 35 :WGAN 应用于金融时间序列生成》和《人工智能 38 : WGAN 生成:从单资产到多资产》中的9 个单资产序列评价指标和5 个多资 产序列评价指标及其反映的典型化事实,以衡量模型的生成效果。 实证测试环节,我们分别测试DCGAN、WGAN 和W-DCGAN 模型对相同类型资产组合(标 普500 指数、上证综指、欧洲斯托克50 指数)的生成效果。结果表明,单纯使用DCGAN 模型进行生成效果并不理想,W-DCGAN 模型生成的多资产收益率序列很好地复现了真实 序列蕴含的典型化事实,并且生成效果整体优于WGAN 模型。 5 DCGAN 原理 卷积神经网络CNN 相关概念 CNN 是一种常见的深度学习网络架构,受生物自然视觉认知机制启发而来,最初由 Yann Lecun 等人于1998 年提出。CNN 的本质是一个多层感知机,可以自动从数据中学习特征, 并把结果向同类型位置数据泛化。CNN 采用局部连接和权值共享方式,既减少了权值数量 使参数易于优化,又降低了模型复杂度减小过拟合风险。 随着数据量的增大和算力的增强,CNN 在很多领域取得成功,如图像识别、图像分割等。 基础的CNN 由卷积、激活、池化三种结构组成,当处理分类任务时,还需要引入全连接层 完成从 CNN 输出特征到标签集的映射。华泰金工《人工智能 15:人工智能选股之卷积神 经网络》已阐释了 CNN 将高维数据映射到低维特征的机制。下面我们就 DCGAN 网络结构中涉及到的重点结构予以介绍和说明。 特征学习:卷积与转置卷积 在 DCGAN 网络结构中,生成器使用转置卷积完成低维特征向高维特征的映射即上采样, 判别器使用卷积完成高维特征向低维特征的映射即下采样,因此充分理解卷积和转置卷积 的操作机制是重要且必要的

文档评论(0)

1亿VIP精品文档

相关文档