- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
精品文档,助力人生,欢迎关注小编!
赣南客家方言语音语料库建设的必要性分析
摘 要: 方言缺乏文字系统,难以采集和数字化,在社会政治生活中处于边缘地位,因此,方言语料库建设较少受到学界和社会关注。本文以赣南客家方言语音语料库的建设为切入点,从学术研究意义、实际应用价值和文化传承维护等方面论证方言语料库建设的必要性。方言语料库建设费时费力,但其意义深远,价值不可估量。
关键词: 客家方言 语料库 赣南地区 必要性
一、引言
语料库主要是指以电子形式储存并能以一定方式检索的语言资源库(Biber,2020;卫乃兴,2020)。语料库方法的语言研究发端于欧美国家,起初主要用于英语、法语等国际通用语言的研究。随着信息技术迅速发展和个人电脑的广泛普及,运用语料库逐渐成为语言研究的常规手段(McEnery
Hardie 2020)。当今大数据时代,官方语言(如普通话等)电子资源不断丰富,相关语料库的建设自然更加方便。然而,由于方言缺乏书写系统,通常没有文字资料留存,网上不会有大量电子数据产生,很难进行语料库采集和数字化。方言在社会政治生活中处于边缘地位,不容易受到学界和社会关注。因此,方言语料库的建设总体上还较为薄弱。本文以赣南地区的客家方言为例,探讨方言语音语料库建设的多重价值和必要性,以期引起有关部门和学界对方言语音语料库建设更多的关注。
二、国内汉语及方言语料库建设基本现状
汉语语料库的建设取得了较大成果,其中国家语委的“现代汉语通用平衡语料库”已达到了一亿字符以上(刘连元,1996);北京大学的现代汉语语料库经过长年积累不断发展壮大,已经达到3亿字符以上,可以在线检索(俞士汶,2020)。
语料库可以分为语音语料库和文本语料库。考虑到采集、存储和检索方便,早期语料库均以文本语料为主,上面所述的两大汉语语料库都是文本语料。文本语料库对于具有书面语的主流语言变体是基本适宜的,但是,因为方言大多只以口语形式传承,方言语料库一般需要通过语音形式采集和保存。
上个世纪80年代,北京语言文化大学开始建设“北京口语语料库”(北京语言大学语言研究所,2020),这是我国较早的方言语料库,将口语以文本转写的方式呈现,属于“口语”语料库,却并非“语音”语料库。该语料库已经对外开放检索(http:///yys/6_beijing/6_beijing_chaxun.asp)。
另外,美国宾夕法尼亚大学的语言数据联盟(Linguistic Data Consortium,http:///)已发布了我国普通话和粤语语音语料库。我国台湾的国立政治大学建成并公开包括国语(普通话)、客家话、闽南话的“汉语口语语料库”(http://00/)。2020年,国家语委启动了“中国语言资源有声数据库建设”项目,江苏省率先建成了本省方言语音数据库(http:///col/col82/index.html),北京市、上海市、广西壮族自治区和山东省等省市也开始建设本地区方言语音数据库。
1933年,罗香林以《客家研究导论》奠定了客家研究基础,并影响了客家方言在汉语方言体系中的位置(刘纶鑫,2020)。赣南地区客家方言是客家方言中比较重要的片区之一。到目前为止,客家方言的研究一般集中在语音、字词、习语和社会文化背景等内容,研究手段多以逻辑思辨和少量田野调查为主,尚未发现有基于较大规模语料库的相关研究(刘纶鑫,2020;温昌衍,2020)。2020年,南昌大学文学院建成的客赣方言数据库在第五届客家方言暨赣方言首届学术研讨会上进行了演示。该语言数据库由刘纶鑫教授主持开发,其中涉及的软件设计是上海师范大学潘悟云教授完成的。这个方言数据库将方言资料以电子化形式储存,便于查询和检索,主要是音韵内容,没有一般的话语资源(东石,2020)。2020年,由罗美珍等学者主编的《客家话通用词典》得到出版,为客家方言资料的保存与完善作出了极其有意义的贡献。不过略嫌遗憾的是,仅是文本形态,而且由于懂赣南地区客家方言的学者不是太多,赣南地区的客家方言资料收集显得有点单薄(罗美珍,2020)。从已有文献来看,汉语、北京话、粤语及一些少数民族语言(如蒙古语、维吾尔语等)的语料库建设已经比较成熟,但客家方言,尤其是语音语料库的建设却相对滞后,中山大学庄初升教授主持在研2020年度国家重大项目“海内外客家方言的语料库建设和综合比较研究”,侧重于描绘海内外客家方言的总体面貌。总体而言,由于口语语料采集费时费力,方言语音语料库的建设(包括客家方言)比较欠缺,从而严重制约方言研究的整体发展水平(范俊军,2020)。
三、学术研究意义
(一)运用语料库展开语言研究是基本趋势。语言研究大致有理性主义与经验主义之
您可能关注的文档
- 加强协调警员管理调研报告.doc
- 汉语目部动作词的比较.doc
- 关于挽救客家方言式微的几点思考.doc
- 方言及地域文化与对外汉语教学.doc
- 普通话与苏州方言异形同义词的比较.doc
- 南京方言程度副词研究.doc
- 郭锡良《古代汉语》(修订本)文选和引文部分勘误.doc
- 论中原官话的阴阳对转.doc
- 苗语动词“来”的使用语境及音义分析.doc
- 贵州汉语方言特点与普通话教学推广策略探析.doc
- 主题课程整理大班上.doc
- 2026人教版小学语文三年级上册期末综合试卷3套(打印版含答案解析).docx
- 2026人教版小学语文四年级下册期末综合试卷3套(打印版含答案解析).docx
- 2026人教版小学二年级上册数学期末综合试卷精选3套(含答案解析).docx
- 2026人教版小学语文四年级上册期末综合试卷3套(含答案解析).docx
- 2026人教版小学二年级下册数学期末综合试卷3套(打印版含答案解析).docx
- 2026年地理信息行业年终总结汇报PPT.pptx
- 板块四第二十一单元封建时代的欧洲和亚洲 中考历史一轮复习.pptx
- 中考历史一轮复习:板块四第二十单元古代亚、非、欧文明+课件.pptx
- 第二次工业革命和近代科学文化中考历史一轮复习.pptx
最近下载
- 部编人教版小学四年级语文上册单元测试卷附答案(全册).pdf VIP
- 2020年7月青海省普通高中学业水平考试物理(附解析).docx VIP
- 采空区处理施工方案.pdf VIP
- 华中科技大学814电路理论考研真题及答案1997-2013.pdf
- 中国多发性骨髓瘤自体造血干细胞移植指南(2021年版).pdf VIP
- 《给排水及暖通工程监理实施细则》.doc
- 2024—2025学年高二上学期期末物理试卷.docx VIP
- 人才引进合同模板(含2025年培养计划).docx
- 2024-2025学年中国药科大学《物理化学》试卷及答案.docx VIP
- 2025-2026学年小学数学三年级上册苏教版(2024)教学设计合集.docx
原创力文档


文档评论(0)