非+Transformer+架构的端侧大模型创新研究与应用-ROCK+AI.docx

下载文档

0
0
约7.8千字
约 76页
2025-01-18 发布于山西
举报
版权申诉
保障服务

非+Transformer+架构的端侧大模型创新研究与应用-ROCK+AI.docx

1、本文档共76页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

非Transformer架构的端侧大模型创新研究与应用

演讲人：刘凡平

ROCKAI,CEO

01端侧大模型的现状与挑战

02ROCKAI的端侧大模型的实践

03未来趋势

端侧大模型的现状与挑战

1.1大模型时代的端侧需求

以全行业视角

工信部赛迪研究院数据显示，预计2035年生成式人工智能有望为全球贡献近90万亿元的经济价值，其中我国将突破30万亿元，占比超过四成。浙商证券预计到2028年全球大模型市场规模将达到1095亿美元，2022~2028年复合增长率约为47.12%。

以终端设备视角

IDC预测，2024年中国终端设备市场中，将有超过半数的设备在硬件层面具备针对AI计算任务的算力基础，至2027年，这一比例将进一步攀升至接近80%的水平。瑞银预计生成式AI智能手机出货量将从2023年的5000万部增长到2027年的5.83亿部，到2027年收入将达5130亿美元，未来面向广大C端用户的端侧大模型市场前景广阔。

1.2狭义的端侧：以推理为核心

对于“狭义端侧模型”而言，软硬件技术的核心目标在于为用户提供大语言模型推理服务，在软硬件协同优化下实现了大语言模型在终端设备上的本地化应用，训练和微调并非端侧需要考虑的任务。

AIPCAI手机具身智能

1.3现有大模型在端侧应用的局限性

1.4目前端侧大模型的主流技术方法

1.5行业针对大模型的创新研究

Domain

Subdomain

MoE

Multimodality

AGI

OverallScore

ModelArchitecture

TransformerModels

RecurrentNeuralNetworks

MixtureofExperts

MultimodalModels

TrainingTechniques

SupervisedLearming

UnsupervisedLeaming

ReinforcementLearning

TransferLearning

ApplicationDomains

NaturalLanguageUnderstanding

NaturalLanguageGeneration

ConversationalAI

CreativeAI

ComplianceandEthicalConsiderations

BiasMitigation

DataSecurity

AIEthics

PrivacyPreservation

AdvancedLearning

Self-supervisedLearning

Meta-learming

FineTuning

HumanValueAlignment

EmergingTrends

MultimodalLearning

InteractiveandCooperativeAIAGIDevelopment

AGIContainment

ROCKAI大模型的实践

2.1ROCKAI大模型发展历程

Yan架构通用大模型

国内首个非Attention机制大模型，行业领先的非Transformer架构大模型

自主知识产权安全、可控、可信

标准Transformer架构基于Transformer架构Yan架构：自然语言Yan架构：通用全模态

1234

行业主流的大语言模型架构局部创新算法的大模型架构，

Dolphin系列模型

已通过网信办备案

自研非Transformer架构的低算力通用自然语言大模型

2024年1月发布

Yan

您可能关注的文档

文档评论（0）

4A方案 + 关注: 实名认证

服务提供商

擅长策划，|商业地产|住房地产|暖场活动|美陈|圈层活动|嘉年华|市集|生活节|文化节|团建拓展|客户答谢会

咨询作者（1395人已咨询）已休息

1亿VIP精品文档

更多 >

非+Transformer+架构的端侧大模型创新研究与应用-ROCK+AI.docx