数模讲稿.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数模讲稿.ppt

1 概率模型 自然界中的现象总的来说可以概括为两大现象: 确定性现象和随机现象。 在确定性现象中可以忽略随机因素的影响,在随机现象中必须考虑随机因素的影响。 确定性离散模型,主要使用差分方程方法、层次分析方法以及比较简单的图的方法和逻辑方法等方法建立模型; 确定性连续模型,主要使用微积分、微分方程及其稳定性、变分法等方法建立模型; 随机性模型,是指研究的对象包含有随机因素的规律,以概率统计为基本数学工具,其结果通常也是在概率意义下表现出来。随机因素的影响可以用概率、平均值(即数学期望)等的作用来体现。 1.1 概率论基础知识 1.2 常见概率分布及其数字特征 二项分布 泊松分布 指数分布 负二项分布 均匀分布 正态分布 1.3 林德贝格-勒维中心极限定理 指数增长模型(马尔萨斯人口模型) 阻滞增长模型(Logistic模型) 人口发展方程 2 统计回归模型 离散程度(方差,标准差,极差,四分位极差,变异系数) 分布形状(偏度系数,峰度系数) 充分统计量:不损失有效信息的统计(考虑方差达到最小的完备充分统计量) 衡量统计量的标准:无偏性,渐近无偏性,相合性,均方误差(包含了方差及偏差) 统计推断:找到描述总体的真实分布或对某些问题的解答,包括统计量的分布,参数估计(点估计,区间估计),假设检验,统计决策等。 统计量的分布:相当于随机变量函数的分布情况,大样本下的中心极限定理。 参数估计:点估计与区间估计 点估计:用样本值的某个函数值(即统计量的值)作为参数值的估计。点估计的方法有:矩估计法,极大似然估计法,最小二乘估计法,贝叶斯估计法 区间估计:以一定的置信水平保证参数落入某随机区间的一种估计,此法考虑到统计量的随机性。因而较为常用。区间估计的方法有:枢轴量法,大样本法,假设检验法,自助法(bootstrap法) 假设检验:用统计方法检验某种想法或问题是否正确的一种统计手段。 原假设与备择假设:地位是不对等的 检验:在样本空间里考虑,如何切割样本空间,一部分支持原假设,一部分支持备择假设(接受域,拒绝域) 两类错误 显著性水平 检验统计量(在原假设成立的 小概率事件原理 2.2 统计建模过程: step1:理论建模(问题的形成及建模) 这部分事实上与数据无关,主要是用统计、概率、数学语言去描述问题,然后形成统计模型去表达该问题(主要考虑到随机性)。 注:一定要弄清楚问题的背景,避免遗漏重要因素或包含不重要因子; 理解解决问题的目标; 确信客户要达到的目标; 用统计语言描述问题。 step2:收集数据(抽样调查,试验设计,观测数据) 注: 数据是观测到的,还是实验得到的? 如何收集有代表性的数据? 分类数据还是连续数据 数据是如何编码的? 数据测量的单位(量纲) 注意有没有异常数据 step3:统计建模(确定总体的概率分布,常常包括:非参数成分,参数成分,随机成分。重点是考虑确定性部分与协变量的关系,即系统误差部分) step4:数据分析(图形法(直观但不精确):统计图形;数值法(精确但不直观):回归分析,贝叶斯分析,变量的选择…,等等;常常结合使用) step5:推断或统计决策 对整个统计建模过程的注记: 若可能,可用多种统计方法进行计算 不同模型的假设与结果可以轻稍的差别 数据分析本质上是交互的 结论应是多种模型下的一致结果(多种模型支持相同的结果) 重要的因子应出现在不同的模型中(重要的因子一定在模型中出现) 定性结论与定量结论 2.5 判别分析 判别分析—在已知研究对象分成若干类型,并已取得各种类型的一批已知样品的观测数据,在此基础上根据某些准则建立判别式,然后对未知类型的样品进行判别分类。 距离判别法—首先根据已知分类的数据,分别计算各类的重心,计算新个体到每类的距离,确定最短的距离(欧氏距离、马氏距离) Fisher判别法—利用已知类别个体的指标构造判别式(同类差别较小、不同类差别较大),按照判别式的值判断新个体的类别 Bayes判别法—计算新给样品属于各总体的条件概率,比较概率的大小,然后将新样品判归为来自概率最大的总体。 2.6 聚类分析 研究对样品或指标进行分类的一种多元统计方法,是依据研究对象的个体的特征进行分类的方法。 聚类分析把分类对象按一定规则分成若干类,这些类非事先给定的,而是根据数据特征确定的。在同一类中这些对象在某种意义上趋向于彼此相似,而在不同类中趋向于不相似。 聚类分析的基本思想 在生产实际中经常遇到给产品等级进行分类的问题,如一等品、二等品等,在生物学中,要根据生物的特征进行分类;在考古时要对古生物化石进行科学分类;在球类比赛中

文档评论(0)

dreamzhangning + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档