基于参数化量子线路的强化学习策略梯度方法.pdfVIP

下载本文档

10
0
约9.88千字
约 11页
2023-05-17 发布于四川
举报

基于参数化量子线路的强化学习策略梯度方法.pdf

本发明提供一种基于参数化量子线路的强化学习策略梯度方法，属于量子计算技术领域。因为该方法将输入状态密度矩阵输入至量子决策神经网络进行演化，从而输出决定动作对应的概率，因此，该方法相比传统的强化学习策略梯度算法需要训练的参数大幅减少，并且增加了智能体的优化方向，同时在测量后的输出数据设置全连接层还可以使得输出动作的输出维度可调，灵活性更强。

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 114819162 A (43)申请公布日 2022.07.29 (21)申请号 202210243614.7 (22)申请日 2022.03.12 (71)申请人上海图灵智算量子科技有限公司地址

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

基于参数化量子线路的强化学习策略梯度方法.pdfVIP

基于参数化量子线路的强化学习策略梯度方法.pdf

您可能关注的文档

最近下载

文档评论（0）

1亿VIP精品文档

相关文档