- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
论语料库在法律语言学研究中的构建设想
论语料库在法律语言学研究中的构建设想
法律语言学成为独立的学科以来,由于其独特的学科交义性和司法实践性备受关注并发展迅速。中国的法律语言学已经开始由理论研究转向应用研究,而仅仅依靠思辨和内省难以实现其应用于法律实践的目的,需要结合实证和量化的研究,即将理性主义和经验主义紧密地结合起来进行质量结合的研究。因此,研究者们开始建立法律专用语料库研究法律语言,通过概率性的分析得到客观的数据支持相关的研究结论。
法律专用语料库以现实中的法律言语为研究对象,能够为法律语言学研究提供客观、系统而且时效性强的原始语言事实,从形式上反映法律语言的概率、特征和模式,揭示法律语言的一般规律和特殊性。法律专用语料库的建设结合计算机语言学与语料库语言学,注重整体平衡性和代表性,呈现个性化、专业化和智能化的特点,涉及多语种并向多模态多维度转化,能够满足法律语言学应用研究的需要。
本文从语料库在法律语言学研究中构建的理论基础、方法、技术问题以及语料库分类构建四个主要方而展开讨论,展示法律语料库应用的前景。
一、构建的理论基础
语料库之所以能够在法律语言学研究中得到广泛应用,这和法律语言的社会属性、法律语言学研究的应用属性和对研究结果的客观性和科学性需求有着直接的关系。这三者决定了构建法律专用语料库进行法律语言学研究的理论基础。
1法律语言的社会属性。作为专门领域的应用语言,法律语言属于在现实的法律实践领域中构建的语言。法律现实是法律集体言语交际的结果,法律语言在建构、形成和改变法律世界或者现实。语料库的研究方法是一种自下而上的方法,它把语言作为一种社会现象而不是心理现象来分析。其通过研究社会实际发生的具体言语的集合来处理语言,具有社会性,这和法律语言的社会属性不谋而合。二者都是将发生在社会情境中的言语输出总体作为研究对象,揭示语言的规律以及语言与社会的关系。
2法律语言学研究的应用属性。二十一世纪的语言学研究已经走出学术的象牙塔,语言学家越来越关注如何用语言知识和语言研究的成果解决现实问题。法律语言学研究具有立足法律实践、上升到理论认识、重回法律实践的应用性特点,法律语言学追求的最终目标是解决法律领域中一切有关语言的问题。可以上特点决定了法律语言学研究中语言事实第一性,语言理论第二性的前提。应用语料库来研究法律语言,通过分析现实语料并辅之多层次的描写和解释相结合的方法,得出关于法律语言现象的结论,能够将语言学研究的理论结合实际,有助于解决法律实践领域中的问题。
3法律语言学研究的客观性和科学性。法律语言学的研究应用于立法、司法、执法和普法各个环节的法律实践,只有从客观中立的角度和追求科学性的前提下,才能够服务司法实践,实现公平与正义。法律语言学在很多情况下需要客观性和科学性的研究,如文本识别、语音识别、语言证据鉴定等。语料库的研究方法以批量的现实语境中的语料为基础进行数据索引统计与分析,进而归纳概率性的特征,这种方法属于在实际言语中发现和解释意义,更具客观性和科学胜。
二、构建的方法
目前应用语料库的语言研究主要有两种方法,即Tognini-Bonelli (2001)区分的基于语料库(corpus-based)与语料库驱动(corpus-driven)的方法。前者主张对文本进行语法及语义标注,并对语料进行附码,使语料发挥价值;后者是将语料库作为原始文本进行理论建构,不需要对语料进行标注。国内的法律语言学研究多是基于语料库的研究,即通过对法律语料的标注处理展示法律语言的特征和规律。事实上,我们也可以应用语料库驱动的方法,即对法律语料分析之前不做理论假设,通过索引、分类和归纳得到研究结论。如对法律语言中某个法律术语的意义进行总结。基于上述二者相结合的方法,我们构建法律语料库主要涉及以下步骤: 首先是法律语料的建库。该过程涉及对语料的采集提取、组织存储、分类编码和管理、著作权归属和文本格式等。根据法律语言的特点,不同类型的法律语料的取料原则应有所区别并进行分类处理,下文会具体说明。总体的取料原则是研究者需要保持法律语料的代表性、时效性和平衡性。
其次是对法律语料的加工处理。该过程是指对语料进行检索、统计、语法标注、句法语义分析等。我们可根据应用需求,只对生语料设置特定索引,也可以对从词汇、句法、语义、语用到语篇等不同层次的(文本或者多模态)语料标注、附码与索引。常用的语料库索引与附码软件包括AntConc ,AnnoTool, Powercrep, Wordsmith, wordpilot,可以用于生成法律词表及频率(frequency),词语检索并共现上下文(concord-ante)、关键词索引(key words)、词义排歧
您可能关注的文档
最近下载
- 河南能源集团网络安全攻防知识培训(分享版)(1).pptx
- 2025年党员考试试题及答案.doc VIP
- 湖南公务员考试真题2024.docx VIP
- mPGES-2作为吸入全身麻醉药物异氟醚作用靶点的应用.pdf VIP
- 案例研究-案例研究:设计与方法.pdf VIP
- 2024届高考物理一轮复习热点题型归类训练专题13动力学和能量观点的综合应用(原卷版+解析).docx VIP
- 烟草质量检验竞赛通用知识题库-上(单选、多选题库).docx VIP
- 德育常规工作培训(1).pptx
- OMRON欧姆龙安全产品F3SG-SR PG系列安全光幕 多光束安全传感器F3SG-SR PG 系列 F3SG-□SR□系列安全光幕 用户手册.pdf
- 保险的培训资料1—开拓准客户.ppt VIP
- 软件下载与安装、电脑疑难问题解决、office软件处理 + 关注
-
实名认证服务提供商
专注于电脑软件的下载与安装,各种疑难问题的解决,office办公软件的咨询,文档格式转换,音视频下载等等,欢迎各位咨询!
文档评论(0)