- 1、本文档共13页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
社会语言学研究方法和语音数据库建立
社会语言学研究方法和语音数据库建立
摘要:计算机语言学在信息科学和信息科学的研究领域扮演关键的角色。而语言学理论寻求对语言现象规律性的揭示与完整的解释。作为语言学和信息科学的乃至心理学与认知科学的结合的交叉学科,计算机语言学更加提供了研究与应用研究的绝佳界面。其中语料库语言学是语言学科中飙升的最快的学科之一,它综合了语言分析、语言教育、研究方法、统计学以及信息技术等多种学科,所以,建立昆明方言中四字熟语语音语料库可以对大量采集昆明四字熟语,而且可以将采集来的真实文本作为研究素材,通过统计方法得出结论后。因此,该语料库的建立不仅有利于研究昆明方言中四字熟语的基本结构,使用频率更加可以揭示昆明方言的社会性质,而且对于昆明方言与普通话之间的方音辩证提供辩证依据。
关键词:语料库,昆明四字熟语,计算机语言学,语音
中图分类号:H17 文献标识码:A 文章编号:1006-026X(2013)11-0000-02
前言
语料库和语料库方法的出现对社会语言学书面语研究起到了重要的促进作用,用语料库进行社会语言学研究还有很多改进的空间。社会语言学研究方法的特征概括为三个:定性与定量研究结合、解释性、实证性。尤其是在解释“语料或数据”时,认为定性研究所收集的数据主要是词语而不是数字,定量研究所收集的数据主要是数字。这种解释似乎不够全面,利用语料库进行社会语言学研究,收集的数据既需要词语,也需要数字。笔者认为,随着现代信息技术的不断发展,利用语料库方法研究社会语言学将会是一种定量研究与定性研究完美结合的社会语言学研究的重要方法。
因为社会语言学研究在方法上的最大特点是在对言语社区语言使用进行定量和定性分析的基础上,揭示语言变量与社会变量之间的关系。早期的社会语言学研究更多的是注重口语的研究,语料库语言学的出现不但给社会语言学研究书面语带来了生机,同时也大大推动了这一领域的定性与定量有机结合的分析研究。因此,笔者将对方言语音的数据库建库设想进行阐述,希望能够从定量的角度出发,结合当代计算机技术希望对昆明四字方言语音研究有一定的拓展。
一.语音数据库建立的理论基础和特点
1.理论基础:语音语言处理
计算机语言学滥觞与上个世纪五六十年代的机器翻译研究。中文的相关也几乎同步开始,1960年在柏克莱州大学实验室,王仕元,C.Y.dougherty等人开始研究中英、中俄机器翻译。随着跨语言沟通与知识整合,语言科技的发展成为国际主流。
语音语言处理都是以人类语言为处理对象,但是处理的层面却不同。语音处理关注的是利用计算机对语音信号进行分析综合,从而实现合成和识别人类语音。而语言处理更多关注对人类语言的句法语义进行建模,终极目标是实现语言机器对人类语言的理解。
尽管语音处理和语言处理的对象是人类的语言,不过传统上这是两个互相独立的学科,对于这两个领域的研究和教学也是相互独立的,内容页不会相互交叉,但是近年来,随着这两个科学的进一步发展,他们之间的关系变得日益密切,两个学科间的联系不断加大,人们开始意识到语音对于语言理解的重要价值,反过来,语音处理研究也需要关注语言处理的进展,将语言处理的成果运用到语音识别和语音合成研究,有利于提升语音处理性能。例如,在20世纪80年代,隐马尔可夫模型被用来解决词性自动标注问题,就是受到该模型应用在语音识别研究中获得成功的启发。同时,该模型带动了语料库为基础的经验主义方法在语言处理领域的全面复苏。
2.对于语音语言学学科特点的讨论
语音和语言处理均是对技术背景要求很高的交叉学科,搞清楚发音的生理机制,需要对人类的发音器官以及声学知识有足够的了解,也需要为语音和语言建立数学模型,并运用计算机的手段方法去实现语音和语言的计算处理。然后,语音和语言的研究人员主要来自于理工专业。因此大多数关于语音和语言处理的书籍教材都假定读者有较强的理工专业背景,书中充满了各种数学推导公式。但是对于传统意义上属于人文学科的语言学专业的学生来说,大量理工数学推导公式无疑会为他们造成很多理解上的困扰。然而,作为语言学专业的学生,他们不仅可以更容易成为语音和语言处理研究的参与者,而且,他们更容易成为语言和语音技术的使用者和实践者,更好的借助语言和语音处理工具。他们可以更好地观察和分析语言,从而推动语言学本省的研究。
二.关于昆明方言四字熟语语音数据库的建库依据和要求
在昆明方言词汇系统中,有很多昆明人常常使用的三字或四字的固定语句,这些固定语句结构紧密,言简意赅,具有独特的造句功能和表意功能,已经成为昆明方言中特殊而又不可缺失的重要词汇组成部分。
而且,三字,四字熟语很好的体现了昆明方言的地域性、特殊性、生动性、幽默性的特点。因此笔者提出了建立昆明方言四字熟语语音
您可能关注的文档
最近下载
- 初中历史教师备课与授课.ppt VIP
- 62推销理论(教案)(商务谈判与推销).docx VIP
- 眼科学---巩膜扣带术.ppt VIP
- 2024年山东省平原县事业单位公开招聘教师岗笔试题带答案.docx VIP
- 新世纪全国高等中医药院校教材(第一版).doc VIP
- 初中语文2025届中考常考易错字词汇总(多音字+形声字+易错字形+易错成语)_可搜索.pdf VIP
- PADI开放水域潜水员理论考试A卷.docx VIP
- 社会责任全套培训记录表(含附属全套电子表格表).xls VIP
- 路科笔试真题完整版1.5.1.pdf VIP
- (人教版)八年级物理上册《第一章机械运动》单元测试卷含答案.docx VIP
文档评论(0)