- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于语料库拍卖第四十九批检索分析
基于语料库拍卖第四十九批检索分析
【摘 要】 随着计算机的普及与应用,语料库语言学也得到了蓬勃的发展,为语言学研究提供了一套全新的研究思路和方法,广泛用于语言学研究的各个层面,比如人们利用各种语料库索引软件来做词汇搭配,翻译以及中介语的描述和分析等等。文本索引作为一种强有力的文本索引工具,近年来在文学作品的研究中也发挥了独特的作业。利用文本索引软件如:wordsmith tools,tact,concordance 等,为研究某个作家的某部或者多部作品的语体风格的形成和主题的表达提供了可靠的量化依据。
【关键词】 计算机 索引 文体 主题 分析
Abstract : Corpus is undergoing a fast growing in recent years due to the highly development of the computer technology, and now corpus is a new way to learn language, it has been widely applied in varieties fields of language studies, for example, people applied it for lexical learning,translation and the analysis and description of interlanguage. Nowadays, text index tools such as wordsmith tools, tact, concordance provide a reliable quantity to study the language style and theme of the text.
Key words: computer, wordsmith,style,
theme analysis
品钦来自长岛,曾于美国海军服役两年,并在康奈尔大学获得了英语学位。在于1950年代末期和1960年代早期发表了几篇短篇小说后,他开始创作他赖以成名的长篇小说: 《V.》(1963年), 《叫卖第49组》 (1966年), 《万有引力之虹》 (1973年), 《葡萄园》 (1990年), 《梅森和迪克逊》(1997年)和 《抵抗白昼》 (2006年)。品钦被许多读者和批评家视作当代最优秀的作家之一。他是麦克阿瑟奖和布克奖获得者,并几度获得诺贝尔文学奖提名。但其创作的作品构思奇谲,语言晦涩,令读者望而却步。不过《拍卖第四十九批》却是品钦作品当中的“小制作”,小归小,却是“五脏俱全”。对于初接触品钦作品的读者来讲,了解这位后现代主义大师独特的艺术风格和后现代性,走进《拍卖第四十九批》文本世界,可谓明智之举。本文就基于语料库,使用WORDSMITH 软件检索《拍卖第四十九批》,对其进行量化分析,分析这篇小说在语言应用,情节发展,以及人物刻画等方面的特点。
1.文本的总体特征及分析
主要的统计特征有:文件的字节数(bytes)、形符数(tokens,指文本一共有多少个词)、类符数(types,指文本一共有多少个不同的词形)、类符形符比(type/token ratio)、标准化类符形符比(standard type/token ratio)、平均词长(average word length)、句子数(sentences)、平均句长(sentence length)、句长标准差(standard deviation of sentence length)、段落数(paragraphs)、平均段落长(paragraph length)、段落长标准差(standard deviation of paragraph length)等等。
从文本的字节数、形符数和句子数可以推断文本的篇幅长度。单纯的形符数和类符数不能反映文本的本质特征,但两者的比率却在一定程度上反映了文本的某种本质特征,即用词的变化性。一般说来,类符形符比越高,用词变化性越高。但英语的词汇是有限的,如果文本不断扩大,形符数将随之扩大,然而类符数的增加却不能保持同步,所以当文本容量达到一定程度时,类符数的增加将越来越小,两者的比率无法反映用词的变化性。因此我们需要采用标准化类符形符比来反映用词的变化性。其计算方法是按一定的长度分批计算文本的类符形符比,然后求出它们的平均值(杨惠中,2002)。利用平均句长和句长标准差可以判断文本的句子是否比一些简易文本句子要长。同理,可以比较段落长。根据平均词长,可以计算低于该词长的类符数在总类符数中所占比例,以判定该文本的词汇难度。
把《拍卖第四十九批》的文本用wordsmit
您可能关注的文档
最近下载
- 国有企业招投标培训课件.pptx
- 浅析卡尔斯塔米茨的《bE大调第七协奏曲》的曲式特点和演奏技巧.docx VIP
- 台威变频器T3000说明书.pdf
- 2023崇左幼儿师范高等专科学校教师招聘考试真题题库.docx VIP
- 数控机床夹具设计本科设计论文(论文).doc VIP
- 北京小米科技责任有限公司员工激励机制分析.docx
- 2023年崇左幼儿师范高等专科学校教师招聘考试笔试试题及答案解析.docx
- prominent普罗名特-操作手册-操作说明书-干粉投加系统Ultromat® TD 18.20-30.20-38.20.pdf
- 5s管理病区护理.pptx
- Midea 美的 BG-DC41洗碗机 说明书.pdf
文档评论(0)