完美的效率还是负责任的正义——大语言模型时代数字司法的价值反思.pdfVIP

  • 0
  • 0
  • 约2.66万字
  • 约 13页
  • 2026-01-26 发布于福建
  • 举报

完美的效率还是负责任的正义——大语言模型时代数字司法的价值反思.pdf

完美的效率还是负责任的正义?

大语言模型时代数字司法的价值反思

雷磊

内容摘要:大语言模型时代的数字司法在价值上最显著的优势是实现了几近完美的效率,但

因为无法进行价值判断而很难满足实质正义的要求,更无法实现司法裁判所要求的“负责任

的正义”。负责任的正义是一种基于论证和代表的程序正义,要求司法裁判同时提起“真实性

宣称”与“正确性宣称”。基于大语言模型的技术限制,数字司法既因为幻觉问题和完美训练

集问题而存在真实性缺陷,又由于只能掌握“语词”(标识)而非真正的“语言”(意义),以及存

在用数字技术消解司法程序空间的倾向而遭遇正确性或可证成性缺失的问题。基于大语言

模型的伦理限制,人工智能系统不应为司法裁判负责,人类法官也不应放弃自己的道德自

主,将司法裁判的责任推给机器。在根本上,大语言模型只是裁判辅助技术,既不能、也不应

为司法裁判的正义负责。

关键词:大语言模型效率正义责任道德自主数字司法

中图分类号:DFO文献标识码:A

一、引言:大语言模型时代的数字司法

当下,技术赋能司法的程度不断加深。人工智能在司法审判活动中的角色也从“数字书记员”开

始迅速转变为“法官同伴”,“人机协作”或“人机共融”开始成为数字司法的新趋势。1}以大语言模型为

代表的生成式人工智能的广泛应用更是加速了这种趋势。无论是OpenAI公司研发的ChatGPT,还是深

度求索公司研发的DeepSeek-V3和R1,都让普通用户深刻感受到人工智能可能给日常生活带来的变

革。大语言模型是预训练语言模型的升级版。2)早期的自然语言处理通常用统计模型来生成语言,最

著名的例子是隐马尔可夫模型(HMM)。这一模型用词汇出现的概率来预测下一个词,进而生成语言。

*中国政法大学钱端升讲座教授。

本文系2024年度国家社会科学基金重大项目“应对新一轮科技革命的法治体系完善与基本法理研究”(项目批准号:24ZD133)

的阶段性研究成果

【1]参见雷磊:《数字司法的理论反思:意义、问题与监管》,载《交大法学》2024年第6期。

【2】关于大语言模型的技术演进,参见陈慧敏、刘知远、孙茂松:《大语言模型时代的社会机遇与挑战》,载《计算机研究与发展》

2024年第5期。

4

完美的效率任的正义?

尽管今天的大语言模型背后的数学基础已经超越了简单的隐马尔可夫模型,但其基本原理依然是相

似的,即基于以往人类文本中出现的语言,预测每个词(句子、段落)后面的下一个词是什么(预测即

生成)。只是与预训练语言模型相比,大语言模型包含数百亿或更多参数,因而大幅扩展了模型体量、

预训练数据量和总计算量,可以更好地根据上下文理解自然语言并生成高质量文本。它基于神经网

络模型而产生,具有小模型不具有的“涌现能力”。(3)

大语言模型直接针对人类语言,而文本是法律的表达方式,生成文本是法律领域的基本工作。所

以,在大规模语料库上进行预训练后,让模型多学习裁判文书等法律文本(能力引导),或者对模型

生成的文本进行人工标注(对齐微调),看起来就可以在法律这个垂直领域产生富有成效的法律大

语言模型。与通用大语言模型相比,法律大语言模型具备更强大的法律大数据分析和处理能力,更专

注于解决法律问题。由此,机器人法官“秒生成”裁判文书的图景似乎已不再是幻想。在高校系统,东

南大学率先发布了深度推理法律垂域大模型“法衡-R1”。在司法系统,深圳市中级人民法院推出了全

国首个司法审判垂直领域大模型。【4}而在世界范围内,两年前就已诞生“全球大语言模型审判第一

案”。5】

对于大语言模型司法应用的场景及其优缺点,已有学者进行了系统的分析。(6)与此相比,本文聚

焦大语言模型时代数字司法的价值问题。具体而言:法律是人类的一种价值实践,而司法是这种价值

实践的典型应用场景。当基于大规模法律语料库和统计模式的法律大语言模型被全面引人司法裁

判时,它是否与这种价值实践的深层机理相符?如果我们以“正义”来统称司法裁判所追求的价值,那

么问题在于:司法裁判中的正义是一种什么样的正义?数字司法又能否和应否为司法裁判的正义负

责?

二、数字司法的价值对齐:从效率到负责任的正义?

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档