- 1、本文档共94页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
摘要
上下位关系是一种基本的语义关系,其被用于描述两个概念之间的“is-a”
关系。随着深度学习技术在自然语言处理领域的迅速发展,预训练语言模型在上
下位关系识别任务上发挥了重要作用,但是,基于上下位关系的法律行为-法条推
理算法仍然存在输入模型的文本信息语义表征弱,现有的上下位知识树质量低,
行为-法条推理任务缺少可用的图谱与推理评价体系的问题。本文基于预训练语言
模型,对中文法律领域的上下位知识树构建和行为-法条推理算法进行了研究,成
功构建了法律概念间的上下位知识树,实现了从法律行为概念到法律条文的精准
推理。本文的主要工作内容及创新点如下:
(1)提出了一种在中文法律领域内构建词汇的上下位分类树的方法
CHRRM(ChineseHypernymRelationshipReasoningModel),该方法在传统判别模型
的基础上增加了上下位词汇发现模块和词汇释义模块,然后通过判别模型结合大
语言模型生成的词汇释义来预测词对间的上下位关系,最后将上下位关系作为全
连接图的边,通过最大生成树算法将该全连接图重整为一棵最大生成树,作为输
出的上下位知识树。该方法在WORDNET数据集上实现了67.9的F1值,相对基
线算法提升15.6%。在自建的法律领域数据集上微调过后,该方法达到了76.3的
F1值。该方法通过增加词汇释义模块,解决了传统模型对词汇的语义表征不足的
问题,并通过预训练模型实现了上下位知识树构建任务,给出了一种构建高质量
上下位知识树的方法。
(2)改进了K-BERT(Knowledge-enabledBidirectionalEncoderRepresentation
fromTransformers)模型,给出了一种基于上下位知识树和改进的K-BERT模型的
行为-法条推理的方法。该方法首先将K-BERT的损失函数更换为二元交叉熵损失
函数,使K-BERT能应用于多标签分类和排序任务,然后使用改进后的K-BERT
理解法律领域知识树和行为序列文本,使输入的行为能通过多标签分类映射到相
应的法条并使用宽容度评估推荐效果,从而实现根据行为进行法条推荐的算法。
该方法在DuEE数据集上达到了94.3%的召回率,在动态宽容度设置下达到83.7%
的行为-法条推理召回率,在10宽容度设置下达到93.4%的召回率。该方法通过改
进K-BERT的损失函数,解决了K-BERT不适用于法律领域多标签分类的问题,
通过引入宽容度概念,解决了行为-法条推理任务缺少评价体系的问题。
(3)将本文所实现的算法整理为数据预处理模块、模型训练模块、行为-法条
推理模块,设计并开发了行为-法条推理的辅助研究系统,该系统提供了数据分析
与结构化功能、模型训练与存储功能、行为-法条推理功能,并能实现自动化与持
久化的运行。
关键词:BERT模型,短文本分类,上下位知识树,行为-法条推理
ABSTRACT
Ahypernymrelationshipisafundamentalsemanticrelationshipusedtodescribethe
is-arelationshipbetweentwoconcepts.Withtherapiddevelopmentofdeeplearning
technologyinthefieldofnaturallanguageprocessing,pre-trainedlanguagemodelshave
playedanimportantroleinhypernymrelationshiprecognitiontasks.However,
algorithmsforlegalbehavior-lawarticleinferencebasedonhypernymrelationshipsstill
facechallengessuchasweaksemanticrepresentationoftheinputtexttomodels,low
qualityofexistingtaxonomies,andthelackofavailableknowledg
文档评论(0)