- 9
- 0
- 约7.19千字
- 约 22页
- 2016-11-08 发布于贵州
- 举报
李楠 数理统计作业
自然语言中困惑度问题的统计分析
姓名:李楠
学号:20120102015
专业方向:计算机应用技术
2012年11月2日
摘 要
数理统计学是研究随机现象统计规律性的一门数学学科,它以概率论为基础,研究如何收集、整理和分析带有误差的随机数据,建立适当的随机数学模型,并在此基础上对随机现象的本质规律性给出推断和预测,为决策提供科学依据。
本文依据数理统计学的知识,通过测试一百多篇语料的困惑度,得出110个样本数据,通过对困惑度样本数据加工处理和汇总后,给出矩估计和极大似然估计、给出参数估计区间、给出参数的检验和检验,进行非参数拟合优度检验,从而得出相应的结论,即判断一个语言模型的好坏。
关键词:困惑度;数理统计;参数估计;假设检验
目录
前言 3
一、采集样本及数据整理 4
1、数据的搜集方法及说明
2、数据整理:给出频数、频率分布表及说明
3、画出直方图和折线图并给出说明
4、画出经验分布函数
二、假定总体服从正态分布,给出,的估计 10
1、矩估计法
2、极大似然估计
3、若总体不是正态分布请探求其参数估计,并写出方案
三、参数区间估计 12
1、方差未知,求数学期望的置信区间 12
2、数学期望,均未知,求方差的置信区间 13
注:可先假设总体是正态时进行讨论,若总体不是正态
您可能关注的文档
最近下载
- 部编版三年级语文下册各单元同步习作指导(提纲式).pdf VIP
- 覆土式液化石油气储罐的工程应用及设计分析.pdf VIP
- 统编版语文三年级下册第1-8单元作文填空式仿写.docx VIP
- 2025年国税系统副处级领导后备干部选拔笔试真题及答案解析.docx
- 电力系统分析习题集及答案解析 .pdf VIP
- 2025企业级AI Agent(智能体)价值及应用报告.pptx
- 装箱单(中英文)模板.doc VIP
- QC∕T 1067.1-2017 汽车电线束和电气设备用连接器 第1部分:定义、试验方法和一般性能要求.pdf
- 打桩送桩工程量计算案例.pptx VIP
- 基坑开挖监理实施细则.docx VIP
原创力文档

文档评论(0)