- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中国政法大学学报 2012年第3期(总第29期)
互联网环境中法律信息获取方法研究*
黄都培
[摘 要] 互联网的飞速发展,一方面为信息的获取提供了便捷的方式;另一方面,网络
中大量且多义性的信息又为准确、高效的知识获取提出了难题。本文就网络环境中法律信息的获
取问题,通过对国内外领域知识检索的研究,提出并设计了一套基于法律信息主题词表及元数据
的语义检索思路和模型,为法律领域的知识获取进而辅助司法判案决策提供了可借鉴的方法。
[关键词] 互联网 法律信息 知识获取 知识单元 元数据 语义检索
[作 者] 黄都培(1957 年—),女,北京人,中国政法大学科学技术教学部教授,计算
机科学与技术硕士,民法专业研究生。研究方向为计算机应用。
中图分类号: 文献标识码: 文章编号:
D90 A 1674—0602(2012)03—0022-09
一、引 言
今天,计算机网络和信息技术的迅猛发展大大地推动了社会的发展,它的影响和溯及力已经遍
布整个社会的方方面面,并且在法律领域逐渐显示出强有力的优势,无论是对日常的司法业务处理,
还是法学研究与司法办案决策都赋予了新的方法和思路,越来越发挥着它的辅助支持作用。
然而面对着网络中越来越错综复杂、难以描述的模糊问题和海量非结构化的数据,如何满足对
其高效的查询请求,以更低的成本、更准确的数据和更迅捷的速度作出正确的决策,是当前信息获
取和利用所面临的关键问题。司法决策人员在查询目标不很明确的状况下选择决策依据时,注重的
是如何从浩如烟海的数据中快速地调出与案件相关的法律、法规及判例,而不是遍历庞大的互联网
或数据库资源漫无目标地搜寻。而目前大多数网络搜索引擎和信息获取工具是基于检索提问式关键
词匹配技术,在检索的过程中常常出现的两类主要问题是“信息过载”和“内容不匹配”。前者指在
检索过程中系统返回的信息量过多,与查找相关或不相关的内容都冒出来,使用户应接不暇,难于
接受;后者指因对同一个概念的表述出现多义、歧义,返回的信息并非用户真实的查询意图和内容,
查准率和查全率都得不到保证。
要解决网络环境中上述信息获取存在的问题,实现真正意义上的面向法律领域的知识检索,从
理论层面上,必须构建以法律领域知识为基础的用于语义检索的元数据标准,用来对网页中的相关
信息标引和知识抽取,以便将用户查询请求准确地与网页上查询的法律知识目标相匹配;这就要求
我们对来自网页或数据库的法律信息进行整理、组织和特征分析,依据法律领域专家所设计的法律
* 本文系教育部人文社会科学规划基金项目——“法律信息元数据及其语义检索研究”(项目编号:08JA820039)成果。
·22·
1
·互联网环境中法律信息获取方法研究·
信息规范标准,建立可利用和共享的法律知识单元和元数据,以达到智能和准确的语义检索,实现
面向法律领域的知识获取,为司法业务信息化和司法决策信息化提供更加有力的支撑。
二、法律信息资源的构成与语义特征分析
(一)法律信息知识单元的组织
一般来说,在法律文献中的知识内容是由若干个知识单元组成,知识单元之间的结构关系是相
对固化的。用户在网上查找其中的知识时,只能按照编者事先组定的线性方式读取,即使只想获取
其中某一部分事实或数据,也要在获取全文的基础上根据需要逐个筛选,这显然不能满足用户的实
际需求。如果能将这种线性的知识块(文献)分解为各种面向用户问题域或基于事实域的认知层次的
活化知识单元,并将这些知识单元予以激活,重新组合、联结、转化为特定环境、特定需要的知识,
将大大提高法律文献知识的利用率与共享性。因此,对于网页中法律文献资源及其知识内容进行有
效的提炼、整序和知识单元的组织,进而对其分析和特征标引,实现按用户问题域的语义检索,就
成为网络环境中法律知识获取的关键。
通常的法律信息主要包括:法律公文(含司法文书)、文献,法律、法规、司法解释,司法案例、
判例,司法证据以及相关的声音、视频、图像等多媒体资料。按照司法领域惯用划分,可以将法律
信息根据其性质、作用或所属部门法系进行知识
文档评论(0)