法律大模型构建的模式选择和实践路径.pdfVIP

  • 0
  • 0
  • 约3.72万字
  • 约 16页
  • 2026-01-27 发布于福建
  • 举报

法律大模型构建的模式选择和实践路径.pdf

第46卷第1期吉首大学学报(社会科学版)Vol.446No.

2025年1月JournalofJishounver(SocialSciences)Jan.2025

工智能与大数据D0I:10.13438/j.cnki.jdxb.2025.01.003

法律大模型构建的模式选择和实践路径

李鑫

(四川大学法学院,四川成都610207)

摘要:法律人工智能算法模型的发展先后经历了总结推理规则的“推理期”、构建专家知识的“知识期”和运

用机器学习的“学习期”,现在已经进入法律大模型构建的“大模型期”。法律大模型构建一般以通用大模型

为底座,构建模式主要有通用大模型微调模式与专家知识库增强模式,两种构建模式在数据准备、算力资源、

训练过程等方面存在显著差异。目前国内外相关研究已纷纷投入法律垂直领域大模型构建的探索实践,但

受到数据质量偏低、法律知识不全、算法解释困难、提示工程缺失等问题的限制,法律大模型的研究和应用尚

未达到预期效果。在构建法律大模型时,应充分考虑模型开源程度、训练参数量、领域相关性、服务模式、应

用场景等因素选择合适的通用大模型作为模型底座,然后按照法律数据、法律知识、指令工程、结果评估等四

个关键步骤提升模型效果,在几大核心业务场景的应用实践中,进一步总结和反馈法律大模型存在的问题,

并对其进行持续调整和优化。

关键词:人工智能;法律人工智能;法律大模型;通用大模型;数据

中图分类号:D926;TP18文章编号:1007-4074(2025)01-0021-16

基金项目:司法部国家法治与法学理论研究课题(22SFB5004)

作者简介:李鑫,男,博士,四川大学法学院教授,博士生导师。

2018年,一种革命性的预训练语言模型横空智能研究者迅速投人了较大的研究热情,自2023

出世,在自然语言处理(NLP)领域迅速掀起研究年开始就发表了大量的研究成果。目前国内关于

热潮。这一类型的算法模型可以利用更大的语料法律和大模型的相关理论研究主要集中在生成式

库和更加复杂的神经网络来进行NLP任务训练,人工智能的侵权责任承担、个人信息保护、法律治

从而为NLP任务提供前所未有的处理能力,通过理路径、司法应用前景等问题上。可以看到,当前

这种预训练过程得到的语言模型被称为大规模语的理论研究更侧重于通用大模型应用后的法律治

言模型(LLM,以下简称“大模型”)。目前,国内理问题,但对于通用大模型本身构建的理论认识

外典型的通用大模型有BERT、GPT、LLaMA、文以及如何构建垂直领域的法律大模型尚未投人足

心一言、通用千问等。以GPT为代表的通用大够的关注。当前法律人工智能领域的研究正面临

模型的特别之处在于其使用了前所未有的计算参一系列挑战,包括法律规则高度复杂、法律数据质

数和海量数据,能够跨越任务和领域的限制,解决量不高、法律知识不断更新、标注数据动态调整以

数学、编程、视觉、医学、法律、心理学等领域中新及算法模型创新瓶颈等问题。尽管通用大模型已

颖或困难的任务。探索人工智能技术与法律领域在其他领域展示了新技术优越性以及打破算法模

的深度结合以辅助法律工作,一直是法律人工智型构建瓶颈的巨大潜力,但在法律人工智能领域

能研究的重要方向。当以通用大模型为基础的生能否借助大模型解决现有的客观问题,仍然需要

成式人工智能迅速出现并火爆后,国内法律人工进一步的研究和探索。因此,本文的研究重点是

*收稿日期:2024-11-08

修回日期:2024-11-18

22吉首大学学报(社会科学版)第46卷

厘清法律大模型的构建机理,总结法律大模型构计算机系统,开创了美国计算机检索法律信息系

建的实践路径,以期为法律大模型构建工作提供统的先河[3]。1986年,北京大学法律系经济法研

理论参考。

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档