生成式人工智能赋能智慧司法及相关思考.pptx

生成式人工智能赋能智慧司法及相关思考.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

;

;

;

;

生成式模型

?学习“数据如何生成的”(联合概率分布)

?目标:学习数据背后的“完整故事”,包括数据的分布规律,甚至能自己“编故事”(生成新样本)。

?像什么:一个画家,不仅会判断“这是猫还是狗”,还能亲手画出一只猫或狗。

?怎么做:先分别学习猫和狗的特征(比如猫的尖耳朵、狗的尾巴形状),然后建模它们的整体分布规律。;

6;

生成式人工智能技术,是指具有文本、图片、

音频、视频等内容生成能力的模型及相关技术。

《生成式人工智能服务管理暂行办法》;

n生成式人工智能的典型代表:ChatGPT

nChatGPT:大数据+超算力,现象级AI应用引发范式革命;

ChatGPT

2022;

?GPT-2(2019):展现零样本学习能力;

生成式人工智能发展脉络---以GPT为例;

ChatGPT

2022;

ChatGPT

2022;

在训练时,人工智能模型会不断地在句子中‘挖去’一个单词,根据剩下单词的上

下文来填空,即预测最合适的‘填空词’出现的概率,这一过程为‘自监督学习’。;

GPT的训练三板斧之二:提示学习与指令微调(人教机学);

GPT的训练三板斧之三:人类反馈下强化学习(尝试与探索);

引入

Self-attention;

ChatGPT

2022;

DeepSeek崛起之因:模型算法和工程优化的系统级协同创新;

?参数量:参数规模达670亿,拥有7B和67B的base及chat版本

?特色:具备强大的语言理解与生成能力,采用先进注意力机制和大规模无监督预训练技术,能处理文本生成、问答系统、文本摘要等多种自然语言处理任务,语言泛化能力突出。

?意义:标志着DeepSeek正式进军通用人工智能领域,为用户提供全新自然语言处理解决方案,推动通用大模型技术发展和应用。

DeepSeekLLM:ScalingOpen-SourceLanguageModelswithLongtermism

/qqarticle/details/14550137620;DeepSeekLLM;

?参数量:总参数高达6710亿,每token激活370亿参数

?特色:采用创新的MoE架构和FP8混合精度训练,在长文本生成、代码理解和数学推理等任务中表现卓越,能处理复杂数学问题,准确解析各类编程语言,长文本生成内容连贯、逻辑清晰。

?意义:巩固了DeepSeek在大模型领域的领先地位,展示其在技术创新和性能优化方面的卓越能力,为行业树立新标杆。;

?参数量:最大6710亿,也有通过蒸馏得到的参数在15亿到700亿之间的不同规模版本

?特色:新一代推理模型,性能与OpenAl的o1正式版持平并开源。在仅有少量标注数据的情况下,通过大规模使用强化学习技术,极大提升模型推理能力,在数学、代码以及各种复杂逻辑推理任务上表现出色。

?意义:打破了国际社会对AI研发“高投入、长周期”的固有认知,其开源和低成本特点,有助于普及AI技术,让更多开发者参与到人工智能的创新中,影响全球人工智能竞争格局。

DeepSeek-R1:IncentivizingReasoningCapabilityinLLMsviaReinforcementLeamning;

生成式人工智能发展脉络---以DeepSeek为例;

DeepSeek-R1:强化学习推理、小模型蒸馏以及工程化努力;

;

案多人少,345件/人/年并且持续上升

简单案件花费大量精力,重复劳动多;

28;

n问题:给定原告诉请和事实描述,目标是生成法官对原告述请支持与否的文本描述(判决及其理由)

n挑战:数据混淆偏差,因为原告只在胜诉率高时下才起诉,导致超过76%的民间借贷案件的原告诉请是被支持的

n想法:引入因果反事实模型,解决数据驱动所导致的混淆偏差;

n问题:给定原告诉请和事实描述,目标是预测法官对原告诉请支持与否

n挑战:数据驱动+知识指导,如何让模型学习法律判案知识

n想法:使用一阶谓词逻辑对法律知识进行编码,并将一阶谓词逻辑表达式转化为可微的、端到端训练的神经网络组成部分;

争议焦点生成;

?ChatGPT:高算力+大数据,现象级AI应用引发范

文档评论(0)

沧海一粟2020 + 关注
实名认证
内容提供者

文不能提笔控萝莉,武不能骑马战人妻,入佛门则六根不净,入商道则狼性不足,想想还是做文字民工!

1亿VIP精品文档

相关文档