- 1、本文档共34页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[Table_PageText]
深度分析|计算机
目录索引
投资要点5
一、大模型常使用文本图片视频等公共数据集混合体作为预训练语料库8
(一)数据成为影响AI大模型效果的重要差异化环节8
(二)AI大模型训练数据来源分类12
(三)AI大模型训练数据获取途径19
二、AI大模型训练面临的数据版权挑战20
(一)训练数据需求下,数据版权诉讼激增20
(二)授权合作,内容持有者的新道路23
(三)诉讼或合作?内容持有者面临的选择、机会与挑战27
三、AI巨头将持续加码数据合作,需关注数据版权纠纷重点案例29
(一)数据版权纠纷尚无判例,需关注重点案例29
(二)AI巨头将持续加码数据合作,确保数据的合法来源31
四、投资建议34
五、风险提示36
(一)内容价值难以准确量化36
(二)行业竞争加剧36
(三)数据侵权阻碍下游应用进展36
识别风险,发现价值请务必阅读末页的免责声明
3/38
[Table_PageText]
深度分析|计算机
图表索引
图1:大模型的技术路径多集中在Transformer架构衍生出的三大技术路线9
图2:ScalingLaw提出大模型的性能主要与计算量、训练数据量和模型参数量三
您可能关注的文档
- 北交所策略AI赋能下2024Q2PC与手机市场稳步复苏,北交所消费电子产业链盘点.pdf
- 北交所新质生产力专题系列报告(一):深度解析微晶玻璃产业链,北交所包含产业链核心公司.pdf
- 化工周期新起点系列3-工业硅:周期见底,关注供给端扰动预期.pdf
- 兆易创新公司深度报告:存储%2bMCU国内龙头,自研DRAM打开成长空间.pdf
- 中小盘新股市场迎三大变化,发行上市生态持续优化.pdf
- 齐鲁银行业绩高增,资产质量继续改善.pdf
- 全面深化改革新阶段,关注风险偏好的底部修复.pdf
- 银行行业2024Q2公募基金银行持仓分析:配置比例被动上升.pdf
- 中国联通算网生态大会召开,持续关注算力产业链.pdf
- 通信行业自动驾驶:单车智能与车路云共发展,通信板块大有可为.pdf
文档评论(0)