- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
摘要
在司法领域,向法务工作人员推荐相似裁判文书可以帮助其进行案件分析,理清争议焦
点,协助纠纷双方客观分析现状,拉近双方的期望值,提高解决纠纷的质量和效率。如何快
速而精准地从裁判文书中提取特征信息,并以此为基础高效地对文书进行分类是相似文书推
荐的基础。
裁判文书冗余信息过多,因而关键法律要素提取困难。同时,各法律要素间存在复杂的
逻辑关系,相关性较强。本文针对裁判文书的特点,首先基于平均信息熵指标体系,提出了
一种法律文书表现力评估方法,可有效过滤出现频度较高但主题表现力较差的法律要素,从
而提高法律要素提取效果。其次,针对现有文本表示方法在逻辑关系表示上的不足,提出了
一种民事判决书信息网络模型,从文法基本维度构造法律要素关联网络,为文本分类提供数
据基础,并给出了该关联网络的构造算法。然后,针对传统文本向量化算法word2vec受上下
文窗口大小所限,容易陷入局部最优的缺点,提出了一种基于Network Embedding的关联特
征提取算法,可有效发现法律要素之间的隐含逻辑关系,并给出了法律要素特征序列生成优
化算法。最后,基于法律要素关联特征,设计并实现了两种贝叶斯网络结构学习方法,并在
此基础上进行推理模型的构造,用于裁判文书分类。
实验结果表明,本文所提出的技术与算法在裁判文书的分类问题上,具有较现有的其他
方案更高的分类有效性。
关键字:裁判文书;关联特征;贝叶斯网络;文本分类
I
Abstract
The recommendation of similar adjudicative documents can help the dispute coordinators to
analyze and clarify the focus of disputes, and to improve the quality and efficiency of dispute
resolution. Judicial document feature extraction and classification are the basis of high quality
recommendations.
The key legal elements are essential as document features, while they are hard to be retrieved
since most judicial documents contain much redundant information. Furthermore, the element
correlations are vital to document classification as well. First, this thesis proposes an effective key
legal element extraction method.It evaluates the expressivepower of legal documentsbased on the
average information entropy weight index,then the legal elementswith high occurrence frequencies
but poor expressiveness are effectively filtered out. Second, a civil adjudicative information
network is proposed to model the key legal element and the correlations as a whole. The network
construction algorithm is designed and implemented in detail. Since the traditional Word2vec
algorithm is easily trapped in local optimum for the context window size limitation, this thesis
proposes a legal element correlatio
原创力文档


文档评论(0)