- 1、本文档共49页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
计算机
计算机/行业__题报告/2025.01.19
大模型系列报告?一ā?Transformer架构的过
去1ā在和未来
投资评级
投资评级:看好(维持)
最à12o^场表ā
计算机沪深300P证指数
41%
28%
16%
3%
-10%
-22%
分析师杨烨
SAC证书编??S0160522050001yangye01@
相s报告
相s报告
1.:电力信o化研究框架??一ā总章;2025-01-14
2.:英__达GB300含苞à放,s注液冷和电源?节;2025-01-14
3.:智驾o报?车^表ā强劲,首个Robotaxi法规出炉;2025-01-12
证券研究报告
核心ê点
核心ê点
Transformer架构的过去和ā在?人类大脑在p限的资源条tQ,通过神经元回路的自ā装和微调,实ā了高效的信o处理2~了`化信o处理,大脑发展了高效的信o选择和投注机制——注意力,而非依赖超大容à的处理能力2随着s们对大脑认知机制的深入了解?及计算机科学的?m,研究人员尝试通过算法à化大脑的认知?能,将人类的思维模式映射到人工智能P2
Transformer是一种基于注意力机制的神经网络架构,由GoogleBrain团队于2017年在论文:AttentionIsAllYouNeed;中e出2通过摒``统循?结构,Transformer利用自注意力机制并行处理序列元素,显著e升了ˉ?速度和长距离依赖建模能力2Transformer架构的灵活性,使wr~__多非自然语言处理领域Y?模型构建的基础框架,展ā出广阔的T用前o,包括但O限于能够将O\模态的数据映射到统一的特à表示空间,促?跨模态T用发展2目前,人工智能大模型的?化主要依赖于人工版本的更新2而随着技术的发展,研究人员k在探索自s?化的模型,使w能够自主完善和学`由自身生r的经验,D而èú人工智能U更高级的智能发展2`前AI的局限性或在于w学`效率的PQ,而非数据O足2真k的智能O仅是数据à的堆?,而是在于对信o的压缩和e炼,类似于通过总结第一性原理的方式获×更深层l的智能2
Transformer架构的未来?}管Transformer凭借着ā多`势r~如今的主流架构,但w并非}善}美,?p无法?免的局限性,例如计算复g度高和计算r本高2目前对Transformer架构的未来,主要p两条道路,一是被更`ù的全新架构??,D是在原p架构基础P通过`化注意力机制等方式?行升级,à两条道路都是通?计算复g度更P1计算r本更P1效率更高à个目标2目前研究人员k在?极探索可能×?或增强Transformer的全新架构,并e出了数个潜在的??架构,例如RetNet1Mamba1RWKV1Hyena1线性注意力机制等2无论选择哪条路?,最ā的目标都是实ā更高的性能1更强的泛化能力1更P的资源消耗,?èúAI在更多实×场o中的T用,\时?w更à可持续的n惠化的发展2
投资建°?短期来看,Transformer架构依然是大模型的主流,建°T点s注基础?施领域的公ù,如英__达1海Z信o1寒n纪1`创数据1英维克1中科曙Z1浪潮信o1润泽科技1欧?通1曙Z数创等,\时持续s注全球各大模型厂商1学界的创新?展2
风险e示?技术迭?O及预期的风险ā商业化落地O及预期的风险ā政策支持O及预期风险ā全球宏ê经济风险2
?阅ü最^一页的T要声明!
行业__题报告
行业__题报告/证券研究报告
内容目录
内容目录
1Transformer架构的过去和ā在 4
1.1人脑带来的启示?数据的无损压缩 4
1.2TransformerT?而生?Attentionisallyouneed 6
1.3Transformer的`势?规模扩展1多模态能力 9
2Transformer架构的未来 12
2.1Transformer架构的局限性 12
2.2Transformer架构的挑战者 13
2.2.1RetNet 14
2.2.2Mamba
您可能关注的文档
- 2024年连锁咖啡门店发展蓝皮书-GeoQ智图.docx
- 2024年智慧园区WLAN通感一体发展及应用白皮书-世界无线局域网应用发展联盟.docx
- 2024年智能网联汽车网络安全年度报告-鹏城实验室&为辰信安.docx
- 2024小红书内容增长力报告.docx
- 2025年度企业用云十大趋势报告-阿里云.docx
- 2025年全球金融市场:三条线索+三大趋势-工银亚洲研究.docx
- 2025年数智赋能+推动热电能源绿色高质量发展报告-全应(夏建涛).docx
- 2025年中国影视短剧行业简析报告-嘉世咨询.docx
- 2025年主动元数据,DataOps建设新支点白皮书-Aloudata.docx
- 2025年自研or外采CRM橙皮书-纷享销客.docx
最近下载
- 踝泵运动护理宣教课件PPT.pptx
- 2023年辽宁理工学院汉语言文学专业《现代汉语》期末试卷A(有答案).docx VIP
- 楼梯 栏杆 栏板(一)22J403-1.docx VIP
- 2025年部编版新教材语文一年级下册第三单元教案.docx
- 敖包相会简谱曲谱.pdf VIP
- 2023年国家公务员录用考试《行测+申论》真题(地市级)及答案解析.pdf
- “日月昌明,松鹤长春”长者生日会方案设计.pdf
- CMR Evaluation Report for XXX Catheter XX导管CMR 评估报告-MDR.docx
- OTDR(光时域反射仪)使用方法及图解.pptx VIP
- 2024年四川绵阳中学中考自招数学复习题及答案解析.pdf
文档评论(0)