量子增强的基于 LSTM 预测信号的强化学习在金融科技交易决策优化中的应用-计算机科学-量子强化学习-金融科技优化-量子神经网络.pdfVIP

量子增强的基于 LSTM 预测信号的强化学习在金融科技交易决策优化中的应用-计算机科学-量子强化学习-金融科技优化-量子神经网络.pdf

此“经济”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

量子增强的基于LSTM预测信号的强化学习

在金融科技交易决策优化中的应用

Yen-KuLiu,Yun-HueiPan,Pei-FanLu,Yun-ChengTsai,SamuelYen-ChiChen

Email:pecu@.tw

WellsFargo,NewYork,USA

Email:yen-chi.chen@

摘要—金融交易环境的特点是高波动性、众多宏观经济信方法中的高方差问题。然而,传统的A3C代理可能缺

本号以及动态变化的市场制度,在这种环境下,传统强化学习方法乏表示复杂、高维金融时间序列依赖关系[6]的能力。

往往难以实现突破性的性能。在这项研究中,我们通过整合量子

译量子机器学习(QML)提供了强大的工具来应对

电路设计了一个专门针对金融系统的强化学习框架。我们将比较

中(1)经典A3C与量子A3C算法的性能,以及(2)结合基于这些挑战。量子神经网络(QNNs)和变分量子算法

1LSTM的下周经济趋势预测对学习结果的影响。实验框架采用(VQAs)利用叠加和纠缠进行非线性变换,将数据嵌入

v

5了自定义的Gymnasium兼容交易环境,模拟离散交易行为,到大型希尔伯特空间中以区分细微模式[7]–[9]。这些量

3并根据投资组合反馈来评估奖励。实验结果显示,在嘈杂的金融子特征映射揭示了经典方法所忽略的相关性,在区块链

8

2条件下,特别是与预测信号相结合时,量子模型表现出优越的性分析等应用中显示出潜力[10],[11]。量子算法在高维或

1能和稳定性,即使在浅层量子电路深度下也是如此。

.嘈杂的数据集方面也表现出优势[12]–[14]。

7IndexTerms—量子强化学习,金融科技优化,预测信号,

0LSTM预测,量子神经网络量子计算通过在广阔的希尔伯特空间中的变分量

5

2子电路(VQCs)增强了表示能力[7]。量子特征映射将输

:I.介绍入编码为状态,提供了类似核方法的非线性嵌入[14]。

v

i

x金融市场本质上是复杂、随机的,并且经常由于宏混合架构改善了真实硬件上的分类性能[15]。最近,陈

r

a观经济的发展、地缘政治事件和不断变化的投资情绪而等人提出了A3C算法的量子增强变体,并证明了其在

出现突然的制度转变[1]。传统的算法交易策略——从经验上优于经典基线[16]。后续进展包括循环策略的集

简单的技术规则系统到基于深度学习的预测器——难成[17]和在A3C框架内应用可微分量子架构搜索[18]。

以快速适应这种非平稳环境[2]。通过将交易定义为一然而,将量子RL应用于实际金融任务的研究仍然相对

个顺序决策问题,强化学习(RL)已经成为一种强大的较少。

框架,可以直接从市场数据中学习适应性策略[3],[4]。在这项工作中,我们引入了一个用于每周SP500

在RL算法中,异步优势演员-评论家(A3C)[5]因交易的金融科技量子A3C代理,并结合了基于LSTM

其采样效率和稳定性而脱颖而出。多个并行代理同时探的宏观经济预测。我们的主要贡献包括对经典的A3C

索,并与全局网络共享梯度以加速学习并减轻策略梯度和混合量子-经典A3C在SP500交易中的直接比较,

突出了它们在表示能力和学习动态方面的差异。我们还

Thev

您可能关注的文档

文档评论(0)

zikele + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档