- 1、本文档共32页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
深化案例: 作者是谁?让数学来证明 《红楼梦》是一人所作?此书成书200多年前:曹雪芹、高鄂 1981年在首届《红楼梦》研讨会上,美国威斯康星大学讲师 陈炳藻独树一帜,宣读了〈从词汇上的统计论〈红楼梦〉作者的问题〉的论文。用计算机对字、词出现的频率进行统计处理、分析,得出作者为一人。 语体风格是人们在语言文字表达活动中的个人言语特征,是人格在语言文字活动中的具体表现。这种风格在一定程度上通过数量特征来刻画。例如,句长和词长可以代表作者造词句的风格,当然,反映作者风格的不是单个词的词长和单个句子的句长,而是以一定数量的语料为基础的平均句长和平均词长。此外,字、词在作品中出现的频率也是个人风格的体现。利用计算机计算一部作品或作者平均词长和平均句长。对作品或作者使用的字、词、句的频率进行统计研究。从而了解作者的风格。这被称之为计算风格学。 梳理出方法 让佚名作者现身 “作者考证”有时是一个很困难的问题 计算风格学可被应用来解决这种问题。我们看两个例子。 出现于16世纪90年代的一部五幕剧《爱德华三世》,表现了14世纪英王爱德华三世统治时期勇武的骑土精神、但该剧作者究竟是谁,戏剧界争论了几百年。不久前.通过电脑对该剧的语言风格进行分析莎翁作品的权威机构——阿顿公司正式确认《爱德华三世》是莎士比亚的一部早期作品。莎剧专家说、这部作品本身所表现出的深刻人性、博大精神和文辞语言的华丽无可辩驳地“用莎士比亚自己的声音”证明了它的来源。 1964年,美国统计学家摩斯泰勒和瑕莱斯考证了12篇署名“联邦主义者”的文章作者,可能的作者是两个人.一个是美国开国政治家汉密尔顿.另一位是美国第四任总统安迪逊。究竟是哪一位呢?统计学家在进行分析时发现汉密尔顿和麦迪逊在已有著作中的平均句长几乎完全相同。这使得这一能反映写作风格特征的数据此时失效了。于是统计学家转而从用词习惯上来找出这两位作者的有区别性的风格特征,最后终于找到了两位作者在虚词的使用上有明显的不同。汉密尔顿已有的18篇文章中,有14篇使用了”enough”一词 而麦迪逊在他的14篇文章中根本未使用“enough”一词。汉密尔顿喜欢用“WHINLE” 而麦迪逊总是用“whilst。汉密尔顿喜欢用”“upon”而安迪逊很少用、然后 再把两位可能的作者的上述风格特征指标与未知的12篇署名“联邦主义者”的文章中表现出来的相应的风格特征进行比较。结果发现那位署名“联邦主义者”的作者就是美国第四任总统麦迪逊。这样就了结了这一考据学,长期悬而未决的公案、两位统计学家所使用的数学方法也得到了学术界的认可。 《同静的顿河》是不是抄袭 长篇小说《静静的顿河》是一部既磅磷壮观又委婉细腻 扣人心弦的史诗性长篇小说.是当代世界文学中流传最广泛、读者最多的名著之一。他的作者肖洛霍夫因此获得1965年诺贝尔文学奖、但小说出版后即有人说这本书是肖洛霍夫从一位名不见经传的哥萨克作家克留柯夫那里抄袭来的。俄国流亡在国外的一些作家加索尔仁尼琴、安德维杰等认为《静静的顿河》的大部分内容是抄袭哥萨克作家克留柯夫的作品,理由是该书第一卷出版时、肖洛霍夫年纪尚轻.并无生活经历;另外 他以后未能写出具有同样文学价值的作品。肖洛霍夫充其量只是合作者罢了。 为了弄清楚谁是《静静的顿河》的真正作者.捷泽等学者采用计算风格学的方法进行考证。具体办法是把《静静的顿河》四卷本同肖洛霍夫、克留柯夫这两人的其他在作者问题上没有疑义的作品都用计算机进行分析,获得可靠的数据。并加以比较,以期澄清疑问,得出谁是真正作者的结论。 在理性的世界里,所有的判断都是统计学 如何中让数据说话:数据需要收集、整理、描述、分析、判断。 形成一种好的统计思维(与确定性思维不同),它的基本思维模式是归纳的,特征之一是通过部分的数据来推测全体数据的性质,统计结果具有随机性,统计推断有可能犯错误。 日常生活:为老奶奶统计卖牛奶的数量、民意调查、药是否有效、求职策略。 社会生产:质量控制、产品验收、进出口检验、项目投资、劳动保护、国民经济。 自然科学:天王星光环、估计种群的数量、血样的分析 社会科学:文学著作权、考古 体育艺术:评分的方法。 如何得到得到敏感性问题的诚实反应 在统计调查中,问卷的设计是一门很大的学问,特别是对一些敏感性的问题。例如学生在考试中有无作弊现象,社会上的偷税漏税等,更要精心设计问卷,设法消除被调查者的顾虑,使他们能够如实回答问题。否则,被调查者往往会拒绝回答,或不提供真实情况。下面是一个对敏感性问题的调查方法。 某地区公共卫生部门为了调查本地区
您可能关注的文档
- 数学技术方法在水文学中的应用.ppt
- 数学成才之路必修五阶段性测试题.ppt
- 数学指导《第16讲三角形与全等三角形》.ppt
- 数学思考:不规则图形的周长.ppt
- 数学指导《第35讲代数计算题》.ppt
- 数学指导《第19讲图形的相似》.ppt
- 数学指导《第30讲视图与投影》.ppt
- 数学提高每日一题1.ppt
- 数学教学中的问题与对策.ppt
- 数学教学法-几何典型解法(OK).ppt
- springbooot+vue基于java的房屋维修系统毕业论文.doc
- 中国消防救援学院《单片机系统实验》2023-2024学年第一学期期末试卷.doc
- 2025年溧阳纺织化学品项目申请.pptx
- 景区门票包销合同模板(3篇).docx
- 【股票技术指标学习指南】第七章第三节货币需要量的测算.doc
- 2025春 _ 人教版七年级英语下册【unit4】看音标写单词.doc
- 2025春 _ 人教版七年级英语下册【unit5】看音标写单词.doc
- 2025春 _ 人教版七年级英语下册【unit6】看音标写单词.doc
- 2025春 _ 人教版七年级英语下册【unit7】看音标写单词.doc
- 2025春 _ 人教版七年级英语下册【unit8】看音标写单词.doc
最近下载
- 《边坡与结构体雷达监测技术要求》.pdf VIP
- 一元一次方程应用题100道 .pdf VIP
- kebf5变频器伺服使用使用说明书f5m.doc
- 2025湖北恩施州利川市选调市外教师60人笔试参考题库附答案解析.docx VIP
- 2025湖北恩施州利川市选调市外教师60人笔试模拟试题及答案解析.docx VIP
- 服务标响应速度方案.docx VIP
- 2025湖北恩施州利川市选调市外教师60人笔试备考题库及答案解析.docx VIP
- 2025湖北恩施州利川市选调市外教师60人备考试题及答案解析.docx VIP
- 砌筑井抹灰工程方案(3篇).docx VIP
- 2019通信中级传输与接入(有线)宝典.pdf VIP
文档评论(0)