- 1、本文档共11页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
高效的张量化神经网络和张量网络算法的部分范数初始化
AlejandroMataAli
i3BIbermaticaFundazioa,QuantumDevelopmentDepartment,PaseoMikeletegi5,20009Donostia,Spain
IñigoPerezDelgadoandMarinaRistolRoura
i3BIbermaticaFundazioa,ParqueTecnológicodeBizkaia,
IbaizabalBidea,Edif.501-A,48160Derio,Spain
AitorMorenoFdez.deLeceta
i3BIbermaticaFundazioa,UnidaddeInteligenciaArtificial,
AvenidadelosHuetos,EdificioAzucarera,01010Vitoria,Spain
(10Dated:2025年7月10日)
我们提出了两种算法,用于通过部分计算张量化神经网络和一般张量网络的Frobenius范数及线性
逐元素范数来初始化层,具体取决于所涉及的张量网络类型。该方法的核心是在迭代过程中使用张量
子网络的范数,从而使我们能够通过导致发散或零范数的有限值进行归一化。此外,该方法还从中间
本计算结果的复用中获益。我们也将其应用于矩阵乘积态/张量列(MPS/TT)和矩阵乘积算子/张量列
译车矩阵(MPO/TT-M)层,并观察到了其相对于节点数量、键维数及物理维度的扩展性。所有代码均
中已公开。
Keywords:机器学习,张量网络,量子启发的其他方法
4
v
7
7I.介绍情况下得到应用。最著名的量子启发技术之一是张量
5网络[4,5],它们是对张量代数计算的图形表示。张量
6
0深度神经网络[1]在机器学习中被广泛用于在工网络具有通过诸如矩阵乘积态/张量列车(MPS/TT)
.
9业、研究及各种其他应用中取得良好效果。这种良好[6]或投影纠缠对态(PEPS)[7]等表示方式来“压缩”
0
3的性能使其得以应用于更复杂的场景,需要更多的参张量信息的强大能力。这使得我们可以用较少的参数
2数。因此,各种架构已被利用以提升其性能。最大的例保留所表示张量的重要信息。这种压缩已被以各种方
:
v子是大型语言模型(LLM)[2],它们使用了极大量的参式应用于几种机器学习模型,例如将矩阵分解为张量
i
x数,需要大型设备才能运行。内存需求成为了未来应网络[8,9]。它已被应用于神经网络[10],卷积神经网
r
a
用和人工智能当前发展路线可扩展性的一大限制。络[11],变压器[12],脉冲神经网络[13]或LLM[14,
随着量子计算被应用于各个领域,由于量子系统15]。张量网络也被用作主要模型,直接训练张量网络
处理信息的指数级容量,对量子信息压缩方法[3]的兴本身[16,17](图1)。
趣增加了。这是导致量子机器学习领域发展的一个原
我们的分析重点将放在生成大型张量
您可能关注的文档
- FAMOUS:一种在 UltraScale+ FPGA 上的 Transformer 注意力机制的灵活加速器-计算机科学-硬件加速器-变换器-注意力-自然语言处理.pdf
- 基于大型语言模型的合成音频对话生成框架使用大型语言模型-计算机科学-大语言模型-合成音频生成-文本到语音.pdf
- ReCAP:用于机器人外科手术技能评估中伪标签生成的递归交叉注意力网络-计算机科学-外科技能-机器人辅助手术.pdf
- 合作学生:在夜间物体检测中的无监督领域适应导航-计算机科学-机器学习-目标检测-导航.pdf
- 软件架构在巴西工业中的存在及实践现状-一项调查的初步结果-计算机科学-软件架构-工业.pdf
- 基于 SHAPLEY 的数据估值与互信息: 改进 K 近邻的关键-计算机科学-机器学习-模式识别-算法.pdf
- 相位编码出现在优化了模算术的递归神经网络中-计算机科学-循环神经网络-深度学习.pdf
- 单向铁路网络的奇偶性条件-计算机科学-机器学习-算法.pdf
- 关系感知网络结合基于注意力的损失函数用于少样本知识图谱补全-计算机科学-少量样本学习-知识图谱补全-算法.pdf
- JENSEN-SHANNON 散度幂的度量化-计算机科学-概率分布-算法.pdf
- 数据仓库:Redshift:Redshift与BI工具集成.docx
- 数据仓库:Redshift:数据仓库原理与设计.docx
- 数据仓库:Snowflake:数据仓库成本控制与Snowflake定价策略.docx
- 大数据基础:大数据概述:大数据处理框架MapReduce.docx
- 实时计算:GoogleDataflow服务架构解析.docx
- 分布式存储系统:HDFS与MapReduce集成教程.docx
- 实时计算:Azure Stream Analytics:数据流窗口与聚合操作.docx
- 实时计算:Kafka Streams:Kafka Streams架构与原理.docx
- 实时计算:Kafka Streams:Kafka Streams连接器开发与使用.docx
- 数据仓库:BigQuery:BigQuery数据分区与索引优化.docx
文档评论(0)