语言学理论中依存树库的应用分析.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语言学理论中依存树库的应用分析.doc

  语言学理论中依存树库的应用分析 语言学理论中依存树库的应用分析 前言目前在语言知识的获得方法上已经取得了重大突破,即由传统手工方法完成了向语料库辅助方法的过渡,进而促进了语言知识获得准确率和效率的提升,同时还能够将研究者的片面性和主观性获得,该方法使得语言学方法论和理论均取得了很大的发展。基于计算机语言学家是提出依存树库者,故而在进行研究的过程中语言学理论研究着并未重视,但是随着了解层度的加深,使得在语言学理论中依存树库被不断的应用,并且也将一定的研究成果获得。   一、依存树库概述   所谓的树库就是这标注了语义信息、句法、词类的语料库,在语言处理上存在困难和复杂性,因此,要想将语言知识获取,就必须将标有语言信息的语料库充分应用。目前人们将树库作为了知识源、句法结构获得、句法分析结果评价的主要工具,并且相关研究者对其重视度也在不断增强。并且国外研究发现,树库囊括了丰富的句法分布和词类信息,是研究句法和词类的重要依据。同时还可以将语言信息从树库中抽取,在研究语言学时将树库作为重要工具。目前国内外开发了众多树库,其中以PSG句法标本文由论文联盟.L.收集整理注和DG句法标注为主要的句法标注体系,其中前者建立的汉语短语结构树库包括了北京大学的汉语树库、台湾中央研究院的汉语树库、清华大学的句法树库及其美国的宾州树库等。依存语法与短语结构语法对比之下,前者对于汉语句法结构的描述更适合,这主要是因为汉语中语法意义的表达主要是通过虚词和语序表示的,并且汉语的词间关系具有复杂性。然而依存树库是在依存语法的基础上标注句法体系的语料库,在描述句法结构时主要是通过将词与词之间的关系建立实现的。   二、语言学理论研究中依存树库的应用   1.研究语言类型学在语言学中,语言类型学属于一门显学,其任务是总结人类语言共性及其跨语言比较。学者刘海涛研究了汉语句法的类型学特征与汉语依存树库的相关性得出,汉语中50%左右的依存关系是在不相邻词间发生,使句子中依存关系形成的两个词间平均存在着1. 84个词,换言之2. 84就是汉语的平均依存距离。汉语属于AdjN、VO、SV型语言,还是对混合型语言。该研究结论与其他语言类型学家得出的结果具有相同性。刘明杰也研究了不同语体文本的依存树库,同时对比了英汉依存距离,并得出,英语与汉语的依存距离相比,前者更小,由此可见,依存树库对于研究语言类型学可操作性很强,能够帮助我们对汉语句法结构的特点更好从依存句法角度了解,并对人类语言普遍性的发现有利。   2.研究语言中的词类高松以依存树库统计了现代汉语动词、名词、从属词、支配词的依存关系类型,得出了动词和名词句法功能分布概率,对前人的研究结果进行了补充,同时也验证了研究结论。袁芬瑜以依存树库对英语名词的搭配进行了描述,并且将英语名词依存关系分析得出,同时还对英语名词的罕见句法、主要、次要功能进行了总结。在对前人理论检验的同时,也将改进建议提出。陈芯莹研究了虚词,资源选择为汉语依存句法树库,将复杂网络分析技术和方法运用的情况下,对汉语句法中的介词在、动态助词了和结构助词的的特点进行了研究,同时对虚词的被支配力和支配力做了计量地分析。   3.研究广播电视语体语言学研究的核心领域就是语体研究,刘丙丽将实话实说、新闻联播作为了依存树库,同时还自建了两个依存树库,并将其作为资源,对口语体和书面语体不同句法成分的差异进行了分析,得出在口语体和书面语体中句法成分的各词类比重差异显著,同时还将不同语体中充当句法成分时各优势词类统计得出。   4.研究外汉语教学依存树库对于外汉语教学中词汇教学具有重要的作用,通常使用频率及其词语搭配情况等信息与词汇教学具有密切相关性。高松的研究统计了偏误频率最高的50个错词,并将其根据错误频率进行甲、乙、丙三级划分,并将不同等级错词的配价信息在依存树库中提取,并将其制作为配价词表。其研究结果显示了在实际使用中高频错词可能出现的所有用法和情况,同时将各个用法出现的频次统计,实现了量化信息的统计,有助于外汉语词汇教学。   三、依存树库对语言学理论研究的启示   1.将依存树库的应用领域拓展除了将依存树库应用于计算语言学研究之外,还可将其在理论语言学研究中应用。依存树库对语言学理论研究来说,具有语言资源可靠、语言数据真实、客观的特点。时至今日,学者将依存树库应用于语言学理论研究,使用的方为主要包括了对外汉语教学研究、电视节目语体研究、现代汉语虚词的地位研究、英语词类句法功能的计量研究及其汉语的语言类型学研究等。可见依存树库对于理论语言学研究具有有效性和可行性。要想将依存树库资源优势充分利用,就必须对语言知识深入挖掘,将语言现象发现更多,这样才能够将依存树库的应用领域不断拓展,并将其应用于语言学理论研究中。进而对语言计量更加深入、细致的研究

文档评论(0)

ggkkppp + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档