20230427-上海证券-传媒行业GPT系列专题之二：GPT_4引领认知革命，Deep Speed加速行业发展.pdfVIP

下载本文档

0
0
约2.38万字
约 28页
2023-05-02 发布于广东
举报
版权申诉

20230427-上海证券-传媒行业GPT系列专题之二：GPT_4引领认知革命，Deep Speed加速行业发展.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

证券研究报告 2023年4月27日行业：传媒增持（维持） GPT-4引领认知革命 Deep Speed加速行业发展 ——GPT系列专题之二分析师：陈旻 SAC编号：S0870522020001 主要观点我们将 “A I+传媒”的研究框架体系定义为 “通用大模型”+ “行业小样本”的技术架构， “A I+传媒”在应用层表现效力优劣的关键取决于通用大模型对垂直应用的适配程度及迭代速度， 1、适配程度是指：多模态的输入及输出是否匹配应用层的输入及输出。比如GPT-4属于 “图+文”多模态输入+ “文”单模态输出，因此输入模态为 “图或文”且输出模态为 “文”的垂直应用更适配GPT-4。 2、迭代速度是指：应用层产生的 “行业小样本”的数据量是否匹配大模型的迭代要求。根据我们对GPT模型的理解，比如Bing A I产生的 “行业小样本”源自Bing的搜索结果，ChatGPT产生的 “行业小样本”源自用户的反馈和互动。因此我们认为，对于超出GPT所使用的预训练数据库范围（2021年9月前）的事实性表述，Bing A I反馈的是搜索的结果，ChatGPT反馈的是用户主动的观点，Bing A I反馈的效果比ChatGPT更好。我们认为 “行业小样本”的价值取决于数据数量及数据质量，数量大且质量高（多模态）的应用场景复用及迭代A I能力的效力更强，因此更进一步理解我们的研究框架，我们将 “行业小样本”的结构分层（中层小模型+下层应用及内容），并将 “行业小样本”的结合方式分类（调用+训练）： 1、 “行业小样本”的数据集来自小模型或应用及内容：A I产业链包括上层大模型、中层小模型、下层应用及内容，包括应用及内容直接接入大模型或通过小模型接入大模型两种方式，即 “大模型+应用及内容”或 “大模型+小模型+应用或内容”，其中具备特定功能的A IGC软件产品及MaaS我们理解为 “小模型”+ “应用”的技术范式，本身具备较高质量的A I能力，若接入匹配的多模态大模型，有望实现能力上的质变突破。 2 主要观点 2、 “行业小样本”的结合方式包括 “能力调用”及 “能力训练”两类：（1） “能力调用”是指下游垂类场景直接调用通用大模型的通用能力，并基于垂类场景内产生的特性化数据不断提升调用能力在垂类场景内的适配程度。我们认为现阶段下游应用及内容主要采取此类方式接入大模型能力，此类方式可高效快速调用大模型先进能力，在时间上及成本上具备优势。我们认为 “能力调用”匹配 “A I+传媒”的第一层利好，即通过A I降本增效，大幅提高数据及内容的供给量。内容产业本质由供给决定需求，因此内容供给量的明显提升将有效带动传媒基本面拐点及增量空间出现。（2） “能力训练”是指下游垂类场景将通用大模型针对特性化数据集进行再训练，从而形成垂类场景专属大模型。例如彭博社利用自身丰富的金融数据源，基于开源的GPT-3框架再训练，开发出了金融专属大模型BloombergGPT。我们认为 “能力训练”匹配 “A I+传媒”的第二层利好，即下游垂类场景本身的数据或内容反过来 “再训练”通用大模型（或开源大模型），形成传媒内容场景专属大模型，形成更稳定且高质的内容输出。我们认为训练难度文本图片视频影视游戏，且内容数量逐步递减但内容质量逐步递增，即偏后端的影视、游戏在内容数量上训练量级不足，因此高质量的内容形态首先通过 “能力调用”输出A IGC 内容，再将A IGC内容 “再训练”大模型以解决高质量内容数量不足的问题（合成数据 “再训练”范畴）。