生成式人工智能赋能智慧司法及相关思考.pptx

下载文档

0
0
约3.51千字
约 64页
2025-04-09 发布于中国
举报
版权申诉
保障服务

生成式人工智能赋能智慧司法及相关思考.pptx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

;

生成式模型

?学习“数据如何生成的”（联合概率分布）

?目标：学习数据背后的“完整故事”，包括数据的分布规律，甚至能自己“编故事”（生成新样本）。

?像什么：一个画家，不仅会判断“这是猫还是狗”，还能亲手画出一只猫或狗。

?怎么做：先分别学习猫和狗的特征（比如猫的尖耳朵、狗的尾巴形状），然后建模它们的整体分布规律。;

生成式人工智能技术，是指具有文本、图片、

音频、视频等内容生成能力的模型及相关技术。

《生成式人工智能服务管理暂行办法》;

n生成式人工智能的典型代表：ChatGPT

nChatGPT：大数据+超算力，现象级AI应用引发范式革命;

ChatGPT

2022;

?GPT-2（2019）：展现零样本学习能力;

生成式人工智能发展脉络---以GPT为例;

ChatGPT

2022;

ChatGPT

2022;

在训练时，人工智能模型会不断地在句子中‘挖去’一个单词，根据剩下单词的上

下文来填空，即预测最合适的‘填空词’出现的概率，这一过程为‘自监督学习’。;

GPT的训练三板斧之二:提示学习与指令微调（人教机学）;

GPT的训练三板斧之三:人类反馈下强化学习（尝试与探索）;

引入

Self-attention;

ChatGPT

2022;

DeepSeek崛起之因：模型算法和工程优化的系统级协同创新;

?参数量：参数规模达670亿，拥有7B和67B的base及chat版本

?特色：具备强大的语言理解与生成能力，采用先进注意力机制和大规模无监督预训练技术，能处理文本生成、问答系统、文本摘要等多种自然语言处理任务，语言泛化能力突出。

?意义：标志着DeepSeek正式进军通用人工智能领域，为用户提供全新自然语言处理解决方案，推动通用大模型技术发展和应用。

DeepSeekLLM:ScalingOpen-SourceLanguageModelswithLongtermism

/qqarticle/details/14550137620;DeepSeekLLM;

?参数量：总参数高达6710亿，每token激活370亿参数

?特色：采用创新的MoE架构和FP8混合精度训练，在长文本生成、代码理解和数学推理等任务中表现卓越，能处理复杂数学问题，准确解析各类编程语言，长文本生成内容连贯、逻辑清晰。

?意义：巩固了DeepSeek在大模型领域的领先地位，展示其在技术创新和性能优化方面的卓越能力，为行业树立新标杆。;

?参数量：最大6710亿，也有通过蒸馏得到的参数在15亿到700亿之间的不同规模版本

?特色：新一代推理模型，性能与OpenAl的o1正式版持平并开源。在仅有少量标注数据的情况下，通过大规模使用强化学习技术，极大提升模型推理能力，在数学、代码以及各种复杂逻辑推理任务上表现出色。

?意义：打破了国际社会对AI研发“高投入、长周期”的固有认知，其开源和低成本特点，有助于普及AI技术，让更多开发者参与到人工智能的创新中，影响全球人工智能竞争格局。

DeepSeek-R1:IncentivizingReasoningCapabilityinLLMsviaReinforcementLeamning;

生成式人工智能发展脉络---以DeepSeek为例;

DeepSeek-R1：强化学习推理、小模型蒸馏以及工程化努力;

;

案多人少,345件/人/年并且持续上升

简单案件花费大量精力，重复劳动多;

28;

n问题：给定原告诉请和事实描述,目标是生成法官对原告述请支持与否的文本描述(判决及其理由)

n挑战：数据混淆偏差，因为原告只在胜诉率高时下才起诉，导致超过76%的民间借贷案件的原告诉请是被支持的

n想法：引入因果反事实模型，解决数据驱动所导致的混淆偏差;

n问题：给定原告诉请和事实描述,目标是预测法官对原告诉请支持与否

n挑战：数据驱动+知识指导，如何让模型学习法律判案知识

n想法：使用一阶谓词逻辑对法律知识进行编码，并将一阶谓词逻辑表达式转化为可微的、端到端训练的神经网络组成部分;

争议焦点生成;

?ChatGPT：高算力+大数据，现象级AI应用引发范

您可能关注的文档

文档评论（0）

沧海一粟2020 + 关注: 实名认证

内容提供者

文不能提笔控萝莉，武不能骑马战人妻，入佛门则六根不净，入商道则狼性不足，想想还是做文字民工！

咨询Ta 进入空间

1亿VIP精品文档

更多 >

生成式人工智能赋能智慧司法及相关思考.pptx