数模讲稿.pptVIP

下载本文档

6
0
约 75页
2017-03-14 发布于江西
举报
版权申诉

数模讲稿.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

数模讲稿.ppt

1 概率模型自然界中的现象总的来说可以概括为两大现象：确定性现象和随机现象。在确定性现象中可以忽略随机因素的影响，在随机现象中必须考虑随机因素的影响。确定性离散模型，主要使用差分方程方法、层次分析方法以及比较简单的图的方法和逻辑方法等方法建立模型；确定性连续模型，主要使用微积分、微分方程及其稳定性、变分法等方法建立模型；随机性模型，是指研究的对象包含有随机因素的规律，以概率统计为基本数学工具，其结果通常也是在概率意义下表现出来。随机因素的影响可以用概率、平均值（即数学期望）等的作用来体现。 1.1 概率论基础知识 1.2 常见概率分布及其数字特征二项分布泊松分布指数分布负二项分布均匀分布正态分布 1.3 林德贝格-勒维中心极限定理指数增长模型（马尔萨斯人口模型）阻滞增长模型（Logistic模型）人口发展方程 2 统计回归模型离散程度（方差，标准差，极差，四分位极差，变异系数）分布形状（偏度系数，峰度系数）充分统计量：不损失有效信息的统计（考虑方差达到最小的完备充分统计量）衡量统计量的标准：无偏性，渐近无偏性，相合性，均方误差（包含了方差及偏差）统计推断：找到描述总体的真实分布或对某些问题的解答，包括统计量的分布，参数估计（点估计，区间估计），假设检验，统计决策等。统计量的分布：相当于随机变量函数的分布情况，大样本下的中心极限定理。参数估计：点估计与区间估计点估计：用样本值的某个函数值（即统计量的值）作为参数值的估计。点估计的方法有：矩估计法，极大似然估计法，最小二乘估计法，贝叶斯估计法区间估计：以一定的置信水平保证参数落入某随机区间的一种估计，此法考虑到统计量的随机性。因而较为常用。区间估计的方法有：枢轴量法，大样本法，假设检验法，自助法（bootstrap法）假设检验：用统计方法检验某种想法或问题是否正确的一种统计手段。原假设与备择假设：地位是不对等的检验：在样本空间里考虑，如何切割样本空间，一部分支持原假设，一部分支持备择假设（接受域，拒绝域）两类错误显著性水平检验统计量（在原假设成立的小概率事件原理 2.2 统计建模过程： step1:理论建模（问题的形成及建模）这部分事实上与数据无关，主要是用统计、概率、数学语言去描述问题，然后形成统计模型去表达该问题（主要考虑到随机性）。注：一定要弄清楚问题的背景，避免遗漏重要因素或包含不重要因子；理解解决问题的目标；确信客户要达到的目标；用统计语言描述问题。 step2:收集数据（抽样调查，试验设计，观测数据）注：数据是观测到的，还是实验得到的？如何收集有代表性的数据？分类数据还是连续数据数据是如何编码的？数据测量的单位（量纲）注意有没有异常数据 step3:统计建模（确定总体的概率分布，常常包括：非参数成分，参数成分，随机成分。重点是考虑确定性部分与协变量的关系，即系统误差部分） step4:数据分析（图形法（直观但不精确）：统计图形；数值法（精确但不直观）：回归分析，贝叶斯分析，变量的选择…,等等；常常结合使用） step5:推断或统计决策对整个统计建模过程的注记：若可能，可用多种统计方法进行计算不同模型的假设与结果可以轻稍的差别数据分析本质上是交互的结论应是多种模型下的一致结果（多种模型支持相同的结果）重要的因子应出现在不同的模型中（重要的因子一定在模型中出现）定性结论与定量结论 2.5 判别分析判别分析—在已知研究对象分成若干类型，并已取得各种类型的一批已知样品的观测数据，在此基础上根据某些准则建立判别式，然后对未知类型的样品进行判别分类。距离判别法—首先根据已知分类的数据，分别计算各类的重心，计算新个体到每类的距离，确定最短的距离（欧氏距离、马氏距离） Fisher判别法—利用已知类别个体的指标构造判别式（同类差别较小、不同类差别较大），按照判别式的值判断新个体的类别 Bayes判别法—计算新给样品属于各总体的条件概率，比较概率的大小，然后将新样品判归为来自概率最大的总体。 2.6 聚类分析研究对样品或指标进行分类的一种多元统计方法,是依据研究对象的个体的特征进行分类的方法。聚类分析把分类对象按一定规则分成若干类，这些类非事先给定的，而是根据数据特征确定的。在同一类中这些对象在某种意义上趋向于彼此相似，而在不同类中趋向于不相似。聚类分析的基本思想在生产实际中经常遇到给产品等级进行分类的问题，如一等品、二等品等，在生物学中，要根据生物的特征进行分类；在考古时要对古生物化石进行科学分类；在球类比赛中