数学建模复习资料学习.doc

  1. 1、本文档共22页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
PAGE 1 关于2012数学建模的学习 数据收集 数据的间接来源:如果与研究内容有关的原信息已经存在,我们只是对这些原信息重新加工、整理,使之成为我们进行统计分析可以使用的数据,则把它们称为间接来源的数据。从搜集的范围看,这些数据可以取自系统外部,也可以取自系统内部。数据取自系统外部的主要渠道有;统计部门和各级政府部门公布的有关资料,如定期发布的统计公报,定期出版 各类统计年鉴;各类经济信息中心、信息咨询机构、专业调查机构、各行业协会和联合会提供的市场信息和行业发展的数据情报;各类专业期刊、报纸、书籍所提供的文献资料;各种会议,如博览会、展销会、交易会及专业性、学术研讨会上交流的有关资料;从互联网或图书馆查阅到的相关资料等等。取自系统内部的资料,如果就经济活动而言,则主要包括业务资料,如与业务经营活动有关的各种单据、记录;经营活动过程中的各种统计报表,各种财务、会计核算和分析资料等。 数据的直接来源: 通过调查方法获得数据 调查数据方法:随机抽样调查、分层抽样调查、系统抽样调查 收集数据的方法:问卷、面访、电话、 收集数据应考虑的几个问题:1、抽样框中的有关信息 2、目标总体的先后 3、调查问题的内容 4、有形辅助物的使用 5、实施调查的资源 6、管理与控制 7、质量要求 通过实验方法获利数据 实验方法获得数据要注意控制变量法的应用,实验过程中会遇到一些问题如人的意愿、心理问题、道德问题,实验获得数据还要考虑采用好的统计方法 数据分析 图表展示分析数据,根据图表可以直观地看出数据分布情况及走势。(统计图:表格、条形统计图、拆线统计图、扇形统计图、频数分析直方图、频率分布直方图) 数学参数分析数据 集中程度:平均数、中位数、众数(即出现次数最多的,在一定 程度上可以代表一组数据,异众比率()能够说明众数是否准确刻画整组数据,比率大则可以用众数代表整组数据) 离散程度:异众比率、方差、标准差、极差 分布形状:偏态SK(偏态是对数据分布对称性的测度:,如果一组数据的分布是对称的,则偏态系数等于0;如果偏态系数明显不等于0,表明分布是非对称的。若偏态系数大于1或小于-1,被称为高度偏态分布;若偏态系数在0.5~1或-1~-0.5之间,被认为 是中等偏态分布;偏态系数越接近0,偏斜程度就越低)、峰态K(峰态是刻画平峰或尖峰程度的测度峰态通常是与标准正态分布相比较而方的。如果一组数据服从标准正态分布,则峰态系数的值等于0;若峰态系数的值明显不等于0,则表明分布比正态分布更平或更尖,通常称为平峰分布或尖峰分布) 数学期望 数据处理 数据处理有是优化处理的内容好坏,即如何有效有利用、选择数据常见方法有分组取组中的平均数进而减少数据量分析数据所反应的信息。 线性回归 一元线性回归模型; 在一元线性回归模型中,是的线性函数加上误差项,反映了由于的变化而引起的的线性变化;是被称为误差项的随机变量,反映了除和之间的线性关系之外的随机因素对的影响,是不能由和之间的线性关系所解释的变异性。式中称为模型的参数 上述模型的前提是 因变量与自变量有线性关系 在重复抽样中,自变量的取值是固定的,即自变量不是随机的 误差项是一个期望值为0的随机变量,即 对于所有的自变量,的方差都相同 误差项是一个服从正太分布的随机变量,且独立,即 描述因变量的期望值如何中依赖于自变量的方程称为回归方程 样本统计量和代替回归方程中的未知参数,得到估计的回归方程 (该方程用最小二乘法来实现,即用MATLAB程序来实现 PLOYFIT(X,Y,2) ) 利用回归方程进行预测 预测是指通过自变量的取值来预测因变量的取值 用Excel时行回归分析的操作步骤; 选择‘工具’下拉菜单,并选择‘数据分析’选项 在分析工具中选择‘回归’,然后单击‘确定’ 当对话框出现时;在‘Y值输入区域’方框内输入数据区域($A$2:$a$26),在‘X值输入区域’方框内输入数据区域($B$2:$B$26),在‘置信度’选项中给出所需的数值,在‘输出选项’中选择输出区域($c$30),在‘残差’分析选项中选择所需的选项 相关系数(Multiple R)反映两个变量之间线性关系强度的统计量 不相关或相关程度极弱 低度相差 中度相关 高度相关 判定系数(R Square)是对估计的回归方程拟合优度(回归直线与各观测点的接近程度)的度量,其取值范围【0,1】判定系数越接近于1则回归直线与各观测点越接近。反之,越接近于0则回归直线的拟合程度越差。 调整的判定系数(Adjusted R Square) 标准误差 观测值的个数 显著性水平(Significance F) 五、时间序列分析和预测 第一部份、时间序列及其分解 时间序列是同一现象在不同时间上的相继观察值排列而成的序列。它可以分平稳序列和非平稳序

您可能关注的文档

文档评论(0)

189****6140 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档