- 1、本文档共32页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
东油数学建模
结论 删除 全文主要通过运用统计分析的两种方法来求解实际数学问题,从而熟悉聚类分析和多元线性回归的应用,使快速的用统计分析的方法来解决实际生活中的数学问题。 在本文中,我们重点讨论了2015年数学建模竞赛试题“互联网+时代的出租车资源配置模型”当中的出租车资源“供求匹配”程度问题。其中我们采用了聚类分析方法中的欧式距离法把12个经济指标分为三类,得到了12类经济指标的谱系图;其次我们通过计算每类中每一变量与其余变量的Pearson相关系数,得到了各类中的典型指标;最后我们通过聚类分析得到的典型变量,得到了初步的多元线性回归模型。经过模型检验和模型修正,得到最优回归模型。最终,我们由这一系列的数据处理工作,计算得到各城市出租车资源的供求匹配率。 * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * Northeast Petroleum University 《数学模型课程设计》 题目:数学模型课程设计 姓名:沈小伟 学号:141001140228 班级:信计14-2 指导教师:刘今子 时间:2016年6月27日 目录 基本理论 常用方法 典型实例 数学模型案例 基本理论 聚类分析的概念 聚类分析指将物理或抽象对象的集合分组成由类似的对象组成的多个类的分析过程。聚类分析的目标就是在相似的基础上收集数据来分类。 聚类分析的原理 聚类分析是将样品或变量按照它们在性质上的亲疏程度进行分类的多元统计分析方法。聚类分析时,用来描述样品或变量的亲疏程度通常有来两个途径,一是把每个样品或变量看成是多维空间上的一个点,在多维坐标中,定一点与点,类和类之间的距离,用点与点间距离来描述样品或变量之间的亲疏程度:另一个是计算样品或变量的相似系数,用相似系数来描述样品或变量之间的亲属程度聚类分析的步骤 1. 数据预处理, 2. 为衡量数据点间的相似度定义一个距离函数, 3. 聚类或分组, 4. 评估输出 基本理论 回归分析的概念 回归分析(regression analysis)是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。 回归分析的原理 (1)确定变量之间是否存在相关关系,若存在,则找出数学表达式; (1)根据一个或几个变量的值,预测或控制另一个或几个变量的值,且要估计这种控制或预测可以达到何种精确度。 回归分析的步骤 1.根据自变量与因变量的现有数据以及关系,初步设定回归方程;? 2.求出合理的回归系数;? 3.进行相关性检验,确定相关系数;? 4.在符合相关性要求后,即可根据已得的回归方程与具体条件相结合,来确定事物的未来状况,并计算预测值的置信区间; 常用方法 方法1:谱系聚类法 方法2:多元线性回归 常用方法 删除 方法1:谱系聚类法 谱系聚类可以用两种方式来测量: 1、采用描述个体对(变量对)之间的接近程度的指标,例如“距离”,“距离”越小的个体(变量)越具有相似性。 2、采用表示相似程度的指标,例如“相关系数”,“相关系数”越大的个体(变量)越具有相似性。 计算聚类距离指标D(distance)的方法非常多:按照数据的不同性质,可选用不同的距离指标。欧氏距离、欧氏距离的平方、曼哈顿距离、切比雪夫距离、卡方距离等; 常用方法 删除 方法2:多元线性回归 多元线性回归模型,(multivariable linear regression model )在实际经济问题中,一个变量往往受到多个变量的影响。例如,家庭消费支出,除了受家庭可支配收入的影响外,还受诸如家庭所有的财富、物价水平、金融机构存款利息等多种因素的影响。 多元线性回归模型的一般形式为: Yi=β0+β1X1i+β2X2i+…+βkXki+μi i=1,2,…,n 其中 k为解释变量的数目,βj(j=1,2,…,k)称为回归系数。上式也被称为总体回归函数的随机表达式。它的非随机表达式为 E(Y∣X1i,X2i,…Xki,)=β0+β1X1i+β2X2i+…+βkXki βj也被称为偏回归系数(partial regression coefficient) 典型实例 实例1——聚类分析 下面是聚类分析的一个简单例子。有五个样品,每个只测量了一个指标,分别为1,2,6,8,11,我们用最短距离法将它们分类。 (1)计算五个样品两两间的距离,得初始类间的距离矩阵D(0), (2)由D(0)知类间最小距离为1,于是将G1和G2合并成G6,并计算G6和其他类之间的距离,的新的距离阵D(1) 典型实例 删除 (3)由D(1)知,类间最小距
文档评论(0)