- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
浅谈理化检测数据的多元回归.doc
浅谈理化检测数据的多元回归
摘 要: 在钢铁生产领域,控制质量的主要依据为理化检测数据。结合宣钢生产的实际,构建理化检测数据多元回归模型,并对多元回归分析步骤进行深入分析,借助该模型能够对机械性能与化学成分之间的关系进行分析。
关键词: 理化检测数据;多元回归分析;运行环境
中图分类号:TP3 文献标识码:A 文章编号:1671-7597(2013)0110171-01
0 前言
对于钢铁生产领域而言,对质量进行有效控制的依据主要是理化检测数据,因此要注意在生产实践中对理化检测数据进行收集和整理。本文结合宣钢生产的实践,借助计算机构建理化检测数据回归分析模型并展开相应分析,以对钢材机械性能与化学成分之间的关系展开深入分析,实现对数据资源的有效利用。
1 理化检测数据的多元回归模型及分析
1.1 模型
先检验各个自变量之间的相关性。两个变量的相关性表示其数值变化趋势的相似程度,相关性高的变量在回归方程中的解释能力相似,在极端的情况下,两个变量的相关性系数为1,那么在回归方程中必须去掉其中一个变量。因此,变量之间的相关性越大,其在回归方程中的综合解释能力越小,这时候就有必要将其中某个变量剔除掉了。
利用MATLAB软件的corrcoef函数可以很方便地得出各变量的相关系数。corr是correlation的缩写,coef是coefficient
的缩写,corrcoef表示协相关系数。对于一般的矩阵X,执行R=corrcoef(X)后,R中每个值的所在行a和列b,反应的是原矩阵X中相应的第a个行向量和第b个列向量的相似程度(即相关系数)。计算公式是:C(1,2)/SQRT(C(1,1)*C(2,2)),其中C表示矩阵[f,g]的协方差矩阵,假设f和g都是列向量,则得到的数就是f和g的协方差。
有 个变量 ,随机变量 ,且有变量的变化会带动随机变量的变化,二者间的线性关系可以描述为:
,这就是回归方程,在上述公式当中,
为回归系数, 表示随机变量,也叫剩余误差。开展回归分析主要是以 为主要依据,得到 组针对随机变量 的观测数据,即: ,这也是开展回归分析的主要目的所在。 是与回归系数
相对应的估值,为准确确定估值的可靠性,需要对所有估值进行统计检验。
1.2 分析
图1 多元回归分析步骤框架图
多元回归分析步骤详见图1所示。
根据上述多元回归分析步骤框架图可以得知,开展多元回归分析的第一步就是理化检测数据库的构建。笔者所举的宣钢的全部检验站都是借助计算机来进行检验和判定,并在计算机中对相应的检测数据进行保存;第二步,对分析数据进行筛选,在对理化检测数据进行选择时主要是以冶炼单位、轧制单位、生产日期、钢种及具体的规格为主要依据;第三步,确定分析参数。变量可以由 以及 等钢材机械性能来充当,化学成分元素以及具体的规格等可以作为自变量;第四步,将其中的异常数据予以剔除,这里所谈及的异常数据主要涉及以下几类数据:第一类是变量值为空或者零的数据;第二类是变量值恒定的记录,还有就是变量值和其均值之差的绝对值是其三倍甚至更多;第五步就是分步骤开展回归性分析。所谓逐步回归,就是以相关变量自身的重要性程度为主要依据,在一组变量当中按照既定步骤选出一个重要变量并将其带入到回归方程中;于此同时,在开展回归计算的过程中,对于最先被引入回归方程的变量而言,存在着这样一种可能性,即在其余变量被引入回归方程之后,最先引入的变量的重要性会相应降低,对于这些变量,也需要及时将其剔除出回归方程。为确保被引入回归方程中的变量确实具备重要性,或者被剔除出回归方程的变量确实是不重要的,还需要针对被引入或剔除出回归方程的变量进行显著性检验,检验合格方可继续进行下一步计算。在每一步计算过程中,变量的剔除是首先需要考虑的内容,只有确保变量有必要予以保留的情况下才考虑将其引入到回归方程中,如果无法对其进行剔除和引入,则需要结束逐步回归计算。
显著性检验临界值为服从F分布的 ,自由度为
,以样本数量为依据,结合所确定的显著水平系数,可以通过查表的方式将的数值确定下来,回归方程方程的可靠性取决于显著水平及选入的变量数量,当F值为0的情况下,意味着所有变量均被选入。在检验显著性的时候, 的作用分别是引入及剔除,并且前者不能小于后者,常使二者相等,但因为利用计算机进行计算存在舍入误差,这就存在出现 后果的可能性,所以,通常情况下常使
。逐步回归框图详见下图所示。最后一步就是将分析结果输出,将最大值、最小值、平均值以及标准偏差等相关变量统计值进行打印。
1.3 程序运行环境及特点
程序运行的硬件环境为:主机是不低于80586的微处理器;以及32MB
文档评论(0)