- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十二章 回归分析3题
摘要
本文主要研究的是矿物分布的模型建立,通过对已知数据的分析,先画出散点图,在建立合适的回归模型,有线性模型,二次模型,双曲线模型,对数模型等。运用matlab软件,通过比较模型的剩余标准差,选出最合适的模型是二次模型。
关键词:散点图 回归模型 剩余标准差
Ⅰ 问题重述
1.1 一矿脉有13个相邻样本点,人为地设定一原点,得出样本点到原点的距离为x,并设每一样本点处的金属含量为y,画出散点图,并建立合适的回归模型。
Ⅱ 问题分析
Ⅲ 模型假设
本题需要先画出散点图,然后对其进行分析,建立模型。从数理统计的观点看,这里涉及的都是随机变量,根据一个样本计算的系数,只是它们的一个点估计,应该对它们做区间估计或假设检验,如果置信区间太大,甚至包含了零点,则系数的估计值就显得毫无意义。这样也可以用方差分析的方法对模型的误差进行分析,对拟合的优劣给出评价。
具体地说,回归分析在一组数据的基础上研究这样几个问题:
建立因变量y与自变量之间的回归模型:
对回归模型的可信度进行检验;
判断每个自变量对y的影响是否显著;
诊断回归模型是否适合这组数据;
(5)利用回归模型对y进行预报和控制。
Ⅳ 符号说明
Ⅴ 模型建立和求解
Matlab统计工具箱用命令regress实现多元线性回归,用的方法是最小二乘法,用法是:b=regress(Y.X),其中,,b为回归系数估计值,这里Y,X同上,alpha为显著性水平(缺省时设定为0.05),b,bint为回归系数估计值和它们的置信区间,r,rint为残差(向量)及其置信区间。Stats是用于检验回归模型的统计量,有四个数值,第一个是R2,第二个是F,第三个是与F对应的概率P,Pα拒绝H0,回归模型成立,第四个是残差的方差。
1.1绘制散点图如图1.1:
分析图像,若将第一个数据点删除,则线性关系比较明显,但也不能排除其他模型的拟合效果,接下来可以将这几种模型加以比较。
1.1.1 线性模型
输入程序得到图(1.2):
b = 108.2581 0.1742
bint = 107.2794 109.2367 0.0891 0.2593
stats = 0.6484 20.2866 0.0009 0.5965
现行相关系数R2=0.6484,拟合效果一般,P=0.0009在第一个点为异常点(仅指线性模型下),予以剔除
b = 109.0668 0.1159
bint = 108.8264 109.3072 0.095 0.1360
stats = 0.9428 164.8060 0.0000 0.0267
剔除第一个点后R2=0.9428,拟合效果更好,P=0,而且没有异常点。
线性模型为:
对该模型求剩余标准差:得:。
1.1.2二次曲线
因为第一个点偏离太多,将其剔除后重新输入程序得:p = -0.0043 0.2102 108.6718,二次模型为:,对该模型求剩余标准差:.
1.1.3双曲线模型
双曲线模型类似于,可以将x倒数代换转化为线性模型来求。输入程序得到如图(1.4):
b =111.4405 -9.0300
bint =111.1068 111.7743 -10.6711 -7.3889
stats =0.9302 146.6733 0.0000 0.1184
可明显观察到有两个异常点,剔除后再次输入程序得图(1.5)
输出结果:b =111.5653 -10.9938
bint =111.2882 111.8424 -13.5873 -8.4002
stats =0.9309 107.7623 0.0000 0.0221
双曲线模型:。
对该模型求剩余标准差:rmse=01487。
3.1.4对数曲线
类似于双曲线模型,输入程序可得图(1.6)
输出结果:b =106.7113 1.5663
bint =105.6382 107.7844 1.0828 2.0499
stats =0.8221 50.8285 0.0000 0.3018
剔除异常点,重新输入程序计算可得图(3.7):
输出结果:b =107.9762 1.0496
bint =107.6403 108.3121 0.9037 1.1956
stats =0.9625 256.7014 0.0000 0.0175
对数模型:
对该模型求剩余标准差:rmse=0.1324.
1.2结果比较
对几个模型进行比较可得,二次模型的标准剩余差最小。如表(1.1)
线性模型 二次模型 双曲线模型 对数模型
您可能关注的文档
- 医疗机构申请执业登记注册书--样本解析.doc
- 医疗机构效验申请书解析.doc
- 医疗器械货架寿命指导原则解析.doc
- 医疗质量控制指标(二甲评审)2014解析.doc
- 医师考核口腔模拟试题4解析.doc
- 医师考核题2解析.doc
- 医学统计学重点简答题解析.doc
- 医院感染管理核心制度全文解析.doc
- 依帕司他与甲钴胺治疗糖尿病周围神经病变的疗效观察解析.doc
- 仪表工高级题库解析.doc
- 小学科学:ESP8266智能插座电路原理与动手实践研究教学研究课题报告.docx
- 《金融开放浪潮下我国多层次监管体系构建与创新研究》教学研究课题报告.docx
- 区域教育质量监测中人工智能应用的数据质量分析与优化策略教学研究课题报告.docx
- 《金融科技监管中的数据治理与合规性要求》教学研究课题报告.docx
- 《3D打印技术在航空航天领域中的多材料制造与复合材料应用》教学研究课题报告.docx
- 《绿色金融发展中的政府职能与市场机制研究》教学研究课题报告.docx
- 《植物工厂多层立体栽培光环境调控技术对植物生长发育节律的调控机制探讨》教学研究课题报告.docx
- 销售团队年度业绩总结.docx
- 银行风险管理与金融危机防范.docx
- 银行网络攻击预警与快速响应机制.docx
文档评论(0)