- 0
- 0
- 约2.7万字
- 约 14页
- 2026-03-09 发布于北京
- 举报
法律知识图谱的基础S映射:
表示巴西法律规范作为FRBR作品
HudsondeMartim1
1FederalSenateofBrazil,hudsonm@senado.leg.br
摘要
本为机器可读性构建法律规范是建立高级AI和信息检索系统(如法律知识图谱LKGs)的关
译键前提。基于《文献记录功能需求》(FRBR)模型,本文提出了一种基础映射方法,将抽象的
中工作——在我们的法律GraphRAG框架[1]中具体化为节点范数——映射到可互操作的词汇表
2/立法议案。以Normas.leg.br门户网站作为实际案例研究,我们展示了如何通过
v
7JSON-LD描述该工作实体,考虑了稳定的URN标识符、规范间的相互关系以及生命周期属性。
2这种结构化和正式的方法为创建一个确定性和可验证的知识图谱提供了至关重要的第一步,它
8
0可以作为法律AI应用的正式“事实依据”,克服纯概率模型的局限性。
0
.
8关键词:法律知识图谱,数据建模,S,链接数据,FRBR,信息检索,法律人工智能。
0
5
2
:1介绍
v
i
x
r开放政府数据(OGD)倡议对于通过使政府生成的信息公开访问来增强透明度和公共参与至关
a
重要。然而,虽然OGD的原则已经确立,但将其应用于法律领域提出了独特且重大的挑战。法律
规范不是静态的数据点。它们是具有动态生命周期的复杂、结构化文档,其特征为正式层次结构、
广泛的内部规范引用以及通过时间版本不断演变。
简单地将法律文本作为开放文件(例如,PDF或纯文本)发布无法捕捉这种丰富的语义结构,
阻碍了需要机器可读数据的高级法律技术和人工智能应用的发展。为了弥合这一差距,本文详细描
述了一种使用广泛采用的S词汇表对巴西法律规范进行结构化、标准化映射的方法。我们
特别关注将法律规范建模为一个概念性的工作,从而建立了一个更全面和确定性表示法律知识的基
础层。
1.1开放政府数据的重要性
开放政府数据(OGD)计划通过无限制地发布公共部门信息,对于增强透明度、问责制和创新
至关重要[2]。通过使由公共资金生成的数据自由获取,政府可以刺激经济增长、改进内部工作流
1
程并赋予公民参与政策制定的能力[3]。这一开放原则在法律领域尤为相关,尽管如我们将讨论的
那样,它带来了独特的结构性挑战。
1.2构建机器可读法律规范的挑战
虽然OGD原则提供了“为什么”,但法律数据的性质决定了“如何”。与表格数据不同,法律
规范具有深层次的层级结构(例如标题、章节、条款),并通过修订和废除随着时间演变。这种时间
动态性意味着法律规定中的“正确”文本取决于特定的时间点[4]。此外,规范之间的引用网络创建
了一个复杂的关系图,这对于正确的解释至关重要但在非结构化格式中会丢失。
这种缺乏结构化、机器可读的数据仍然是推进法律科技应用(如法律知识图谱(LKGs)和高级
AI驱动检索系统)的关键瓶颈。这些系统需要一个确定的、可验证的“事实依据”[1],而没有正式
的数据模型则无法实现这一点。
1.3我们的贡献:巴西法律作品的S映射方案
为了应对这些挑战,并重点关注巴西国会Normas.leg.br门户倡议,我们建议通过JSON-LD和
链接数据将巴西立法统一映射到/立法提案词汇。我们的方法以法律工作的基础概念
为中心。
本文的核心贡献是详细说明了如何将概念性法律规范(理解为抽象的工作)并将其具体化为我
们法律图RAG框架[1]中的范数节点,映射到sdo:立法。该实体代表了法律工具的整体,独立于
特定的文本版本或格式。我们详细说明了描述该法律工作的关键
您可能关注的文档
- ModelNet40-E:一个面向点云分类的不确定性感知基准测试.pdf
- 通过对抗引导课程采样增强基于扩散的数据集蒸馏.pdf
- SketchAgent:从手绘草图生成结构化图表.pdf
- 具有风险保证的故障检测中的校准预测集通过显著性检验.pdf
- 展示了联网和自动驾驶车辆在网络安全、安全性和隐私问题方面的标准和方法.pdf
- WIP:通过 AI 驱动的同伴代理增强基于游戏的学习.pdf
- 基于图的交互增强网络用于稳健的多模态情感分析.pdf
- RoboLinker: 一种基于扩散模型的人类与陪伴机器人之间的匹配服装生成器.pdf
- CSIRO-LT 在 SemEval-2025 任务 11 中:适应多语言情感识别的大型语言模型.pdf
- Q8bot 的设计:一款采用零电线构建的微型低成本动态四足机器人.pdf
- 课时时间- 联合时间与临床建模用于纵向 DCE-MRI 中的小乳腺病变分割.pdf
- MECAT:一个用于细粒度音频理解任务的多专家构建基准.pdf
- BAR 猜想:具有真实性和推理能力的预算约束大型语言模型服务的可能性.pdf
- 面向多传感器卫星图像的高分辨率配准和超分辨率处理.pdf
- 不确定性下的协作医疗分诊:多智能体动态匹配方法.pdf
- 实时视听语音增强使用预训练的视觉表示.pdf
- DYNARTmo:一种用于可视化语音运动模式的动态发音模型.pdf
- 各向同性重新网格化与夹角优化.pdf
- 墓碑铭文解释的多模态语义分析.pdf
- MEGANet-W:一种基于小波驱动边缘引导注意力框架的弱边界息肉检测方法.pdf
最近下载
- 八篇党支部党员在学习贯彻党的创新理论、加强党性锤炼、联系服务群众、发挥先锋模范作用、改作风树新风五个方面202年度个人对照检查.docx VIP
- 统编版(2024)新教材八年级历史下册第二单元第5课《艰辛探索与曲折发展》【名师课件】.pptx VIP
- 复旦西方社会思想史课件07启蒙运动.ppt VIP
- 湿地调查表格和说明.pdf VIP
- 羊水栓塞诊断与处理专家共识解读课件课件.pptx VIP
- 人教版五年级数学下册《25的倍数的特征》同步练习.docx VIP
- GB/T 4706.1-2024家用和类似用途电器的安全 第1部分:通用要求.pdf
- 2022年义务教育学业四年级德育质量检测三.docx VIP
- 标准图集-皖2002S203 硬聚氯乙烯(PVC-U)、聚乙烯(PE)双壁波纹管埋地排水管道工程安装图集.pdf VIP
- 复旦西方社会思想史课件08苏格兰学派.ppt VIP
原创力文档

文档评论(0)