法律术语特征研究.docxVIP

  • 3
  • 0
  • 约4.56千字
  • 约 14页
  • 2023-08-19 发布于浙江
  • 举报
? ? 法律术语特征研究 ? ? 那日松 刘 青 朱 磊 (杭州师范大学,浙江杭州 310036) 法律术语特征研究 那日松 刘 青 朱 磊 (杭州师范大学,浙江杭州 310036) 阐述了以三种方式快速获取候选法律术语集,并对该候选法律术语集进行人工术语标注来构造法律术语库的过程。再通过研究法律术语库,最终获得了法律术语的长度和一系列构词法特征。 法律术语,术语长度,术语词法特征 前言 术语抽取研究不是脱离语言而独立进行的,在法律术语抽取研究中需要语言学知识,可以借助构造法律术语知识库来辅助术语抽取[1]。通过快速建立法律术语库来挖掘法律术语的长度和一系列法律术语结构词法特征。 该研究的语料来源于香港双语法律信息系统(Bilingual Legal Information System,BLIS),选择其中50 500个文件作为实验语料。 一 快速构造法律术语库 研究中以三种方式获取候选法律术语集,通过对候选法律术语集进行标注来构造法律术语库,共获得8828个法律术语。 1.法律术语标注标准 法律术语标注的主要标准是判断词或词组是否具有明确的科学概念,如果概念不清楚,则不作为术语。 法律术语标注过程的判断依据有: (1)以法律术语部件作为过滤[2],比如:条、法、讼、例、约、罪、押、案、律、判、罚、诉、刑、审、证。 (2)过滤最不可能的词尾,比如:的、在等等(虽然也存在特

文档评论(0)

1亿VIP精品文档

相关文档