李楠 数理统计作业.docVIP

  • 9
  • 0
  • 约7.19千字
  • 约 22页
  • 2016-11-08 发布于贵州
  • 举报
李楠 数理统计作业

自然语言中困惑度问题的统计分析 姓名:李楠 学号:20120102015 专业方向:计算机应用技术 2012年11月2日 摘 要 数理统计学是研究随机现象统计规律性的一门数学学科,它以概率论为基础,研究如何收集、整理和分析带有误差的随机数据,建立适当的随机数学模型,并在此基础上对随机现象的本质规律性给出推断和预测,为决策提供科学依据。 本文依据数理统计学的知识,通过测试一百多篇语料的困惑度,得出110个样本数据,通过对困惑度样本数据加工处理和汇总后,给出矩估计和极大似然估计、给出参数估计区间、给出参数的检验和检验,进行非参数拟合优度检验,从而得出相应的结论,即判断一个语言模型的好坏。 关键词:困惑度;数理统计;参数估计;假设检验 目录 前言 3 一、采集样本及数据整理 4 1、数据的搜集方法及说明 2、数据整理:给出频数、频率分布表及说明 3、画出直方图和折线图并给出说明 4、画出经验分布函数 二、假定总体服从正态分布,给出,的估计 10 1、矩估计法 2、极大似然估计 3、若总体不是正态分布请探求其参数估计,并写出方案 三、参数区间估计 12 1、方差未知,求数学期望的置信区间 12 2、数学期望,均未知,求方差的置信区间 13 注:可先假设总体是正态时进行讨论,若总体不是正态

文档评论(0)

1亿VIP精品文档

相关文档