法律知识图谱的基础 Schema.org 映射:表示巴西法律规范作为 FRBR 作品.pdfVIP

  • 0
  • 0
  • 约2.7万字
  • 约 14页
  • 2026-03-09 发布于北京
  • 举报

法律知识图谱的基础 Schema.org 映射:表示巴西法律规范作为 FRBR 作品.pdf

法律知识图谱的基础S映射:

表示巴西法律规范作为FRBR作品

HudsondeMartim1

1FederalSenateofBrazil,hudsonm@senado.leg.br

摘要

本为机器可读性构建法律规范是建立高级AI和信息检索系统(如法律知识图谱LKGs)的关

译键前提。基于《文献记录功能需求》(FRBR)模型,本文提出了一种基础映射方法,将抽象的

中工作——在我们的法律GraphRAG框架[1]中具体化为节点范数——映射到可互操作的词汇表

2/立法议案。以Normas.leg.br门户网站作为实际案例研究,我们展示了如何通过

v

7JSON-LD描述该工作实体,考虑了稳定的URN标识符、规范间的相互关系以及生命周期属性。

2这种结构化和正式的方法为创建一个确定性和可验证的知识图谱提供了至关重要的第一步,它

8

0可以作为法律AI应用的正式“事实依据”,克服纯概率模型的局限性。

0

.

8关键词:法律知识图谱,数据建模,S,链接数据,FRBR,信息检索,法律人工智能。

0

5

2

:1介绍

v

i

x

r开放政府数据(OGD)倡议对于通过使政府生成的信息公开访问来增强透明度和公共参与至关

a

重要。然而,虽然OGD的原则已经确立,但将其应用于法律领域提出了独特且重大的挑战。法律

规范不是静态的数据点。它们是具有动态生命周期的复杂、结构化文档,其特征为正式层次结构、

广泛的内部规范引用以及通过时间版本不断演变。

简单地将法律文本作为开放文件(例如,PDF或纯文本)发布无法捕捉这种丰富的语义结构,

阻碍了需要机器可读数据的高级法律技术和人工智能应用的发展。为了弥合这一差距,本文详细描

述了一种使用广泛采用的S词汇表对巴西法律规范进行结构化、标准化映射的方法。我们

特别关注将法律规范建模为一个概念性的工作,从而建立了一个更全面和确定性表示法律知识的基

础层。

1.1开放政府数据的重要性

开放政府数据(OGD)计划通过无限制地发布公共部门信息,对于增强透明度、问责制和创新

至关重要[2]。通过使由公共资金生成的数据自由获取,政府可以刺激经济增长、改进内部工作流

1

程并赋予公民参与政策制定的能力[3]。这一开放原则在法律领域尤为相关,尽管如我们将讨论的

那样,它带来了独特的结构性挑战。

1.2构建机器可读法律规范的挑战

虽然OGD原则提供了“为什么”,但法律数据的性质决定了“如何”。与表格数据不同,法律

规范具有深层次的层级结构(例如标题、章节、条款),并通过修订和废除随着时间演变。这种时间

动态性意味着法律规定中的“正确”文本取决于特定的时间点[4]。此外,规范之间的引用网络创建

了一个复杂的关系图,这对于正确的解释至关重要但在非结构化格式中会丢失。

这种缺乏结构化、机器可读的数据仍然是推进法律科技应用(如法律知识图谱(LKGs)和高级

AI驱动检索系统)的关键瓶颈。这些系统需要一个确定的、可验证的“事实依据”[1],而没有正式

的数据模型则无法实现这一点。

1.3我们的贡献:巴西法律作品的S映射方案

为了应对这些挑战,并重点关注巴西国会Normas.leg.br门户倡议,我们建议通过JSON-LD和

链接数据将巴西立法统一映射到/立法提案词汇。我们的方法以法律工作的基础概念

为中心。

本文的核心贡献是详细说明了如何将概念性法律规范(理解为抽象的工作)并将其具体化为我

们法律图RAG框架[1]中的范数节点,映射到sdo:立法。该实体代表了法律工具的整体,独立于

特定的文本版本或格式。我们详细说明了描述该法律工作的关键

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档