- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据语言学研究形势探究
摘要:近年来随着科学技术的发展,大数据、数据库等概念频繁地出现在人们视野。其中,大数据以及构建外文语料库在学术研究领域蔚然成风。通过查阅相关的期刊、论文和书籍对其有一定的了解。本文从大数据是什么,构建语料库对于语言学研究的意义是什么,以及在大数据背景下语言学研究的形势变化入手,对当今大数据背景下数据和语言学研究的现状进行简要的解释和讨论,同时希望对数据库有一个比较整体的认识和了解。
关键词:大数据;语言学研究;语料库
一、前言
随着计算机科学技术的快速发展人们迎来了信息时代。信息时代的一个重要特点就是大量的数据的涌现。这使得人们的生活方式和思维方式发生改变,也对语言学研究产生重大的影响。语言学研究离不开对语言资料搜集、处理、整合。传统的语言研究在搜集语料方面是十分低效的,需要大量的人力去翻阅典籍、做记录。现在通过大数据与语言研究的结合,使得这些问题都迎刃而解。根据不同的语言研究目的,学者们将会构建不同内容的语料库,从而完成对语料的处理、加工等事宜。可以说,大数据开启语言研究的一个新的天地。
二、大数据
近年来在计算机科学领域最火的一个词就是“大数据”。对于“大数据”,人们起初是一个朦胧的认识状态,但是,随着科技发展以及对大数据的运用,人们开始认识到大数据的巨大作用和意义。大数据不仅改变着人们的日常生活方式,而且对人们的思维方式也有了潜移默化的影响。与此同时,它也拉近不同领域之间的距离,从而对交叉学科发展具有重要的意义。它带动着各个领域的发展,使人们更加清晰地认识我们所生活的世界。大数据不仅仅是体现在它数据的庞大上,更重要的是透过这些庞大的数据背后所隐藏的信息价值——人类认知、行为的模式以及人和社会、自然交互的规律。在过去的科学研究中,我们能利用的资源是有限的,或者说很难搜集到比较全面的信息内容,很多时候人们都是通过有限的事例来总结普遍的规律。这样往往会使人忽略掉一些重要的规律,甚至走向错误的方向。大数据却可以快速高效为我们提供相应的数据信息,同时也会提供相关信息,这是在传统研究方式中不曾有的操作。身处在这个大数据的时代,我们不可避免要受到它的影响。通过网络,我们可以快速便捷的找到需要的信息,也能通过编辑、搜索等产生各种数据。我们总是接收、检索新信息和处理现有信息。通过不同地区、不同领域、不同国家,在某一时段内信息的检索和处理,我们可以对其在该时间段的状况有一个初步了解和预判。例如:2018年的春运,我们通过大数据获取各地间往返的客流量以及他们所选取的交通方式,进而在飞机航班、高铁发车次数、火车列次上作出相应的调整,减轻了客运枢纽的压力,减轻了春运的压力。语言作为人类的交际工具,广泛应用于各个领域。古往今来,人们不断开拓新事物、新领域,随之相应地语言体系也逐渐形成并壮大。因此大数据为语言学研究提供了大量的事实语料。同时,也在影响着语言研究的方法。面对大量的事实语料,我们要对其进行科学地分析、处理以及整理,这需要一个完整的系统工具来完成这项任务。
三、语料库——语言学研究工具
20世纪60年代开始语料库语言学逐渐建立。语料库语言学是以经验主义和科学理性主义为哲学基础,自下而上的归纳法为其方法论。从建立起,就一直以真实语料为研究的基础,以大量的日常用语为依据,以概率为特征,通过统计量化的手段建立模型。语言学研究应该以语言事实为依据,广泛地、细致地搜索语言资料。随着计算机的发展,通过构建语料库来进行语言研究已经成为一个趋势。语料库是储存了很多事实语料的库房。语言学要重视对自然真实语料的意义研究,所以,语料库的数据不仅要追求“量”,也要重视其“质”。语料库作为语言研究的工具,需要收录大量的真实语料。在构建语料库时,文本采集要有一定的标准,采集的文本量也要达到电脑可以处理的规模。其中,需要对采集来的文本进行标注、赋码等过程的加工。语料库在语言研究的各个领域都有重要的作用。在语言教育的领域,对语料词频、读音、句型、搭配等进行分析统计,可对语料有十分清晰的把握。在应用语言学领域也运用广泛。如:利用相关的系统软件,对语料库可以进行句法、词汇、口语、语义、语言变异、话语分析等的研究。除此之外,还能通过运用语料库技术进行语音合成、识别的任务等。在社会语言学领域,依据大规模真实语料进行社会语言现象、语言变异等分析,可以得到更加客观的准确的数据和结论。在文学领域,开拓文学研究同语料库相结合的新型研究模式。通过构建文学典籍及作品评论的语料库,并对其进行标注和检索等处理和加工。分别研究当中的人物形象、作品风格、主题、意象等进行分析,可以为观点提供更加客观的数据支撑。在翻译领域,为了提高翻译的效率和准确性会利用建成的双语平行语料库。同时,双语平行语料库
您可能关注的文档
最近下载
- 2024—2025学年广东省佛山市顺德区九年级上学期期中考试化学试卷.doc VIP
- 阿托品化与阿托品中毒的主要区别.docx VIP
- 麦克维尔多联机安装说明书.pdf VIP
- Unit 2 Section B(1a-Project)课件人教版2024新教材七年级上册英语.pptx VIP
- 南京大学《算法设计与分析》ppt课件 L12 - DAG.pdf VIP
- 南京大学《算法设计与分析》ppt课件 L11 - GraphTraversal.pdf VIP
- CH_T 7002-2018CN 无人船水下地形测量技术规程.docx
- 生产现场质量问题分析与解决培训.ppt VIP
- SMP-03-005-00 委托生产文件管理规程.pdf VIP
- 南京大学《算法设计与分析》ppt课件 L10 - Union-Find.pdf VIP
我们是专业写作机构,多年写作经验,专业代写撰写文章、演讲稿、文稿、文案、申请书、简历、协议、ppt、汇报、报告、方案、策划、征文、心得、工作总结代写代改写作服务。可行性研究报告,实施方案,商业计划书,社会稳定风险评估报告,社会稳定风险分析报告,成果鉴定,项目建议书,申请报告,技术报告,初步设计评估报告,可行性研究评估报告,资金申请报告,实施方案评估报告
原创力文档


文档评论(0)