聚类分析在外国语言学研究中的应用探讨.docxVIP

聚类分析在外国语言学研究中的应用探讨.docx

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
聚类分析在外国语言学研究中的应用探讨 【摘要】 对聚类分析在语言研究中的应用领域进行了阐述,并围绕聚类分析在外国语言学研究中的应用价值与前景进行探讨与研究,希望能够为推动聚类分析在外国语言学研究中的应用发展带来一点理论支持。 【关键词】 聚类分析 外国语言研究 应用所谓的聚类分析,又被称为数值分类学,这是一种多元统计分类技术。在社会各领域中,聚类分析都有着广泛的研究与运用,并取得了一定的成效。以外国语言学研究为例,相较于其他方法,聚类分析在语言统计中具有突出优势,鉴于此,针对聚类分析在外国语言学研究中的应用具有重要的研究价值。 一、聚类分析在语言研究中的应用领域 在语义、句法型式、认知语言学、心理学语言学、计算语言学以及社会语言学等多个领域,聚类分析都具有一定的应用价值。通常情况下,聚类分析是结合到语料库数据一起使用。关于聚类分析在外国语言研究中的应用领域,具体阐述如下: 1.词汇语义学 语言学中的有一个假设:语言项目的语境分布信息对该语言项目的语义、功能特点进行了揭示,语言成分的分布条件或限制就是语言成分的意义所在。语料库将词汇的分布环境信息涵盖其中,以共现词及其频率为例,基于语料库中的共现特征的频率信号的获取,剧烈分析可以对近义词、反义词的意义与用法有一个客观、系统的辨析。相关人员就提出词汇行为轮廓研究方法就对聚类分析加以运用。值得一提的,实验表明,同(近)义词的类或簇的心理现实性比较突出。在词汇语义学中,在词典编纂、外语教学领域聚类分析往往具有较强的适用性。 2.句法型式研究 在对语料库中句法结构进行聚类时,聚类分析能够提供一定的帮助,并且在经验数据性的句法研究中,聚类分析也具有适用性。例如人们在聚类语料库中某个单词的全部索引时,对该词汇的全部句法型式进行识别与提取,进而就可以使我们对特定单词的句法行为的认识变得更加系统与全面。在基于数据驱动的句法研究、词典编纂以及外语教学而言,其应用价值显然是比较大的。 所谓的型式,就是短语单位,其组成部分包括名词、形容词以及补足语成分。研究型式句法是为了将不同词类的所有型式抽象、归纳出来。在对句法型式进行抽取与概括时,聚类分析主要采取如下做法:首先对句法型式的一系列特征集合进行建构,然后进行每个索引行为中具体语言信息向对应型式特征信息的转换,基于对相似度算法的应用,将聚类分析用于同一检索词析出的索引行中,并将每组索引行中的公共特征项提取出来,最后使相关单词的句法型式的自动识别与提取得以实现,具体如下图所示。 3.语言风格变异研究 对于一个语篇而言,其呈现的语言结构单位的使用统计特征分为很多种,例如词长、句长、型符类符比、词性比例、句型比例等等。大量研究表明,根据文本体裁的不同,语言结构特征就客观而言存在变异。在语言结构单位特征频率分布的差异的影响下,语言风格变异自然就会形成。语篇风格、文体也是基于这些频率分布差异得以构成的。此外,站在一个作者的角度,其语言中表现出来的语言结构单位的个性化使用统计特征也必然包含了很多种,我们可以统计出一个作者不同作品的语言使用情况,基于分析获取该作者对不同语言结构单位使用的统计特征。相反的,我们也可以通过作者对语言结构单位使用的统计特征,将聚类分析运用将作者身份已知的文本以及身份未知的文本分析中,然后以分析结果为参考,对这些匿名作品的作者进行有效识别。 4.语言的地理变异 语言的地理变异又被称为方言聚类,在语言学这一领域中聚类分析有着非常长的应用历史。在上世纪80年代初,就有研究人员在方言分类的研究中运用了聚类分析,并取得了理想的成效。之后,欧洲方言计量学研究中,以某些研究人员为代表的对聚类分析的应用越来越广泛。 5.语言的社会变异 语言变异与社会结构之间有着非常复杂的关系,在研究中如果选择传统方法,显然是无法取得理想的效果的,究其原因就在于传统的研究方法的盲目性比较强,并且系统性有所缺失,大部分情况下需要以个人经验或灵感对语言提出假设并展开研究,而相较于规模庞大的语言数据而言,个人经验或灵感显然是微不足道的。而聚类分析应用则是传统方法的问题得到有效规避,这种方法能够为研究者在规模庞大的语言数据中寻找数据结构提供支持,然后与数据结构为基础,对相关研究变量进行有效分析、提取,使不同变量之间的关联被系统性的发现出来,然后通过假设对理论模型进行建构。 二、聚类分析的应用分析及发展前景 相较于定性的分类方法,聚类分析的客观性与可重复性是其应用价值的重要体现。聚类分析是以事实与数据为基础得到运用的,这是其客观性特点的体现。当然不可否认,聚类分析并没有将所有主观因素排除掉,在某些方面的选择上其主观性依然存在,例如算法选择、距离计算

您可能关注的文档

文档评论(0)

y31245 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档