基于PLS的青藏铁路格拉段职工健康环境影响因素研究.docVIP

基于PLS的青藏铁路格拉段职工健康环境影响因素研究.doc

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于PLS的青藏铁路格拉段职工健康环境影响因素研究

基于PLS的青藏铁路格拉段职工健康环境影响因素研究 科技部国家科技支撑计划资助项目(2006BAC07B01)。 施庆生,陈建丽,李金凤 (南京工业大学 应用数学系,江苏 南京 210009) 摘要:青藏铁路格拉段平均海拔4500米,沿线高寒、低氧、气压低、干燥、强辐射。本文采用格拉段沿线10个领工区的环境测试指标及相应工作人员生理指标数据,应用偏最小二乘(PLS)回归方法进行统计分析,探寻格拉段工作人员生理指标(脉搏、收缩压、舒张压、血氧饱和度)的重要环境影响因素,进行高原职业危害因素鉴定,并为制定相应的卫生保障措施提供依据。研究结果表明,气压、氧分压和海拔高度是影响地面作业人员生理指标的主要影响因素,另外,格拉段高寒、多风的气候特点也是重要影响因素。 关键词:青藏铁路;偏最小二乘;生理指标;环境影响因素 中图分类号:O213.9 文献标识码:A 青藏铁路格拉段恶劣的自然环境,对长期工作、生活在这条铁路线上的工作人员的身心健康和劳动能力产生很大的影响[1]。本文采用对格拉段10个领工区的环境测试指标及相应工作生活人员生理指标数据采用偏最小二乘(PLS)模型进行统计分析,探寻高原环境与工作人员生理指标(脉搏、收缩压、舒张压、血氧饱和度)的关系,从而分析高原低压、缺氧、高寒、多风等自然因素对青藏铁路地面作业人员的影响,进行高原职业危害因素鉴定,为制定相应的卫生保障措施提供依据。 一、多因变量偏最小二乘回归原理 由于本文所研究的是格拉段自然环境对地面作业人员多个生理指标之间的建模问题,样本量较少,自变量个数多且共线性复杂的高维数据。在这种条件下,多因变量偏最小二乘(PLS)回归模型是一个比较好的选择。偏最小二乘(PLS)回归分析在建模过程中集中了主成分分析、典型相关分析、多元线性回归分析方法的特点,具有计算量小、预测精度高、无需剔除任何自变量的优点,特别在自变量较多且共线性复杂的情况下相当有效。 1、多变量偏最小二乘回归方法的基本思路 设有个因变量和个自变量,取个观测样本点后构成自变量数据集和因变量数据集。偏最小二乘的基本方法是[2]: 首先,在自变量数据集和因变量数据集中分别提取第一成分和,要求和尽可 能大地提取各自数据集中的变异信息,且和的相关程度最大。 然后,建立对的回归及对的回归,如果回归方程达到满意的精度,则停止计算。否则,利用被解释后的残余信息以及被解释后的残余信息进行第二成分的提取,直到能达到一个较满意的精度为止。 最后,偏最小二乘建立对最终对提取的个成分的线性回归,然后再表达成关于原自变量的回归方程,即偏最小二乘回归方程。 2、多变量偏最小二乘回归方法的基本算法 第一步:将和进行标准化处理,标准化后的自变量矩阵和因变量矩阵分别记为和。 第二步:从和中分别提取第一个成分,,,其中为的第一主轴,为的第一主轴。为了满足成分提取的要求,则需求解下列优化问题: 由拉格朗日算法可得,为对应于矩阵最大特征值的单位特征向量,为对应于矩阵最大特征值的单位特征向量。 然后,分别求和对的三个回归方程 其中,回归系数向量为 。 第三步:用残差矩阵和取代和,提取第二个成分,并求和对的回归方程 如此计算下去,如果的秩为,则有 由于都可以表示成的线性组合,以上两式可以还原为关于的回归方程: ,其中系数体现了标准化的向量对的作用强弱。 3、成分个数的确定 偏最小二乘多数情形下只需选取前个成分就可以得到一个比较可靠的模型。如果后续的成分已经不能为解释提供更有意义的信息,采用过多的成分只会破坏对统计趋势的认识,引导错误的预测结论。对于成分的提取,本文采用广泛应用的确定成分个数的交叉有效性系数来确定。对全部因变量,成分的交叉有效性定义为 对每一个因变量,定义为 其中,,是原始数据中第个样本点在第个因变量上的取值,是利用前个成分回归建模计算得到的的估计值,是在样本点中去掉第个样本点,用个成分建模计算出的的估计值。 当,或至少有一个时,可以确定成分个数为。 三、格拉段地面工作人员生理指标自然环境影响因素的PLS回归分析 1、变量与数据选取 本文样本数据来源于中国铁道科学研究院环控劳卫研究所2007年11月5日到14日采集的格拉段各工区的环境测试数据和环境测试场所相应工作生活人员生理指标数据。剔除缺失数据,最后选择了格尔木、沱沱河、秀水河、五道梁、纳赤台、不冻泉、安多、那曲、当雄、拉萨10个领工区相关数据,分析所用数据为环境测试指标及相应工作生活人员生理指标数据的平均值。自变量即环境测试指标为温度(x1)、湿度(x2)、风速(x3)、气压(x4)、氧分压(x5)、二氧化碳(x6)和海拔高度(x7)。因变量为相应工作生活人员脉搏(y1)、收缩压(y2)、舒张压(

文档评论(0)

ranfand + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档