作者可能是谁.docVIP

  • 11
  • 0
  • 约1.05千字
  • 约 3页
  • 2016-11-27 发布于天津
  • 举报
作者可能是谁

作者可能是谁 通过数据分析可以回答许多历史问题,比如利用频数分布可以推测一部历史作品的作者可能是谁.这种通过统计一些特殊词语在作品中使用的频数,并根据频数分布推断作者的做法已经得到广泛应用.在美国就有一个典型的例子. 美国历史上有一部著名的论文集,其中有12篇论文不知道是詹姆斯·麦迪逊(James Madison,记为M)写的还是亚历山大·哈密尔顿(Alexander Hamilton,记为H)写的.为了推测作者是谁,统计学家对论文集以外M的50篇文章和H的48篇文章进行了分析,统计每篇文章使用介词by、from、to的次数,结果发现,他们在使用介词by的数量上有很大区别. 统计学家是怎样计算一篇文章中使用by的次数呢?他们是按1000字计算的,比如一篇文章包含2500个单词,其中有45个by,则这篇文章使用by的次数是:. 利用这种方法,统计学家分别计算了M的50篇文章和H的48篇文章中by的使用次数,并以2为组距对次数(x)进行分组,整理得到下面的频数分布表: 次数x 频数(H) 频数(M) 1≤x <3 2 0 3≤x <5 7 0 5≤x <7 12 5 7≤x <9 18 7 9≤x <11 4 8 11≤x <13 5 16 13≤x <15 0 6 15≤x <17 0 5 17≤x <19 0 3 总计 48 50 从表中我们可以看出H和M使

文档评论(0)

1亿VIP精品文档

相关文档