- 4
- 0
- 约1.05万字
- 约 19页
- 2023-07-21 发布于北京
- 举报
目录
日频深度学习模型初探 3
从 CNN 到 LSTM 3
神经网络股票周频收益率模型表现 5
股票静态内在属性及应用 7
股票内在属性的探究 7
基于基金选股网络的嵌入层计算 9
股票静态内在属性的应用 10
股票内在属性动态化应用 13
动态市场状态 13
股票内在属性动态特征的应用 14
总结与思考 17
风险提示 18
插图目录 19
日频深度学习模型初探
从 CNN 到 LSTM
深度神经网络是一种基于多层神经元的无监督算法,它被广泛应用于计算机视觉、自然语言处理等领域。深度学习的主要神经网络模型包括:卷积神经网络
(Convolutional Neural Networks,CNNs)、递归神经网络(Recurrent Neural Networks,RNNs)、长短时记忆网络(Long Short-Term Memory Networks, LSTMs)、门循环单元网络(Gated Recurrent Units,GRUs)等等。CNN 是最早且最常见的深度神经网络模型之一。下图显示了一个 CNN 的整体架构,包括两个主要部分:特征提取和分类器。在特征提取层,网络的每一层都接收来自其前一层的输出作为其输入,并将其输出作为输入传递给下一层。分类器根据前面卷积层提取的特征计算每个类的得分,计算最终的输出(分类)结果。
图1:CNN 结构示意图
资料来源:Alom et al. [1],
CNN 网络结构的层与层之间是全连接或者部分连接的,但是每层之间的节点是无连接的,这样的结构不能很好地解决序列问题。相比之下,RNN 通过每层节点之间的连接结构,来记忆之前的信息,并利用这些信息来影响后面节点的输入。RNN 可充分挖掘序列数据中的时序信息和语义信息,这在处理时序数据时比全连接神经网络和 CNN 更具有深度表达能力。可以看到 RNN 的结构与传统神经网络结构大致相似,都是由输入层、隐藏层、输出层组成,区别在于隐藏层里的神经元是有链接的,这是实现 RNN 记忆特性的根本来源。图中的 A 并不是一个神经元, 而是一个神经网络块,可以简单理解为神经网络的一个隐层。
图2:RNN 结构示意图
资料来源:Alom et al. [1],
随着深度学习的发展,学者们发现 RNN 模型存在“长期依赖”的问题,并在此基础上提出了长短期记忆网络。LSTM 可以解决训练过程中的梯度消失和梯度爆炸问题,简单来说就是在更长序列中有更好的表现。LSTM 可以被简单理解为是一种神经元更加复杂的 RNN,处理时间序列中当间隔和延迟较长时,LSTM 通常比 RNN 效果好。
相较于构造简单的 RNN 神经元,LSTM 的神经元要复杂得多。每个神经元接受的输入除了当前时刻样本输入,上一个时刻的输出,还有一个元胞状态(Cell State)LSTM 神经元中有三个门:遗忘门(Forget Gate):对应下图中的 ft,接受Xt 和 ht-1 为输入,输出一个 0 到 1 之间的值,用于决定在多大程度上保留上一个时刻的元胞状态 ct-1。1 表示全保留,0 表示全放弃。输入门(Input Gate): 对应下图中 it 和????? 用于决定将哪些信息存储在这个时刻的元胞状态 ct 中,以及输出门
(Output Gate):用于决定输出哪些信息。
图3:LSTM 结构示意图
资料来源:Alom et al. [1],
神经网络股票周频收益率模型表现
深度神经网络模型在预测股票收益方面也有着广泛应用。Nelson et al. [2] 尝试了利用 LSTM 模型和一系列量价特征预测股票收益并取得了不错的效果。传统LSTM 模型的最后一层是一个全连接神经网络,来将隐藏层的输出转为最后的预测。我们在本篇报告中则采用 LSTM+多个全连接神经网络,即多层感知器(MLP) 来作为股票收益预测的模型框架。并且我们尝试调整 LSTM 模型为双向来提升模型表现。预测股票周度收益率的模型细节如下:
数据输入:2013 年至今中证 1000 成分股个股行情 6 个量价指标:开盘价,最高价,最低价,收盘价,成交量,均价(VWAP);资金流 7 个指标:大单净流入,大单主动净流入,小单净流入,小单主动净流入,北向净流入,超大单净流入,成交笔数,共 13 个指标。
数据窗口及预测对象:用过去 80 个交易日的量价及资金流数据预测五个交易日后的个股超额收益(开盘至开盘)。
数据处理:对每个样本内的个股数据的每个指标进行时间序列上的去极值, 标准化,再对同时间的所有个股数据进行一次截面标准化。
模型结构及细节:双向 LSTM(128, 128) + MLP(256, 64, 64, 1),每半年对过去 825 个
原创力文档

文档评论(0)