毕业基于数据挖掘算法的地铁站内温度时序预测方法.docx

毕业基于数据挖掘算法的地铁站内温度时序预测方法.docx

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于数据挖掘算法的地铁站内温度时序 预测方法 摘要:提出了基于数据挖掘算法的地铁站内环境温度时序预测的方法。分别建立了支持向量数据(SVR)、 BP神经网络、决策树三种预测模型,对比了-?般的输入■输出建模方法与基于时间时间延迟方法的预 测结果,以及不同时间延迟下三种数据挖掘模型的预测结果。结果表明:基于时间序列的预测模型效 果比一般的输入-输出模型效果更好;当吋间延迟为1时,三种模型的预测精度相对较高,且在此条件 下,模型的预测效率也最高;基于SVR的时间序列预测模型精度比BP神经网络和决策树更高. 关键词:数据挖掘时序分析地铁站站厅温度 引言 地铁站作为乘客从地面到乘车的过渡环境,保证其舒适性、安全性是地铁站运营的 工作重点之一。地铁站位于地下、自然通风条件较差,内部环境的维持主耍依赖于暖通 空调(HVAC)系统。相比于地面建筑,地铁站最大的特征Z—是人员流动频繁,客流 量急剧变化容易引起站内环境温度的波动,出现客流高峰时期站内温度偏高,客流高峰 过后温度偏低等现彖。这既影响了地铁站的舒适性,同时在一定程度上增加了空调用能。 因此,如果能够通过提前预测站内环境温度的变化,进而优化HVAC系统控制,改善客 流变化引起的舒适性变化,并减少市于滞后控制引起的机组能耗,这对于地铁站节能与 舒适性控制有重要的理论意义和研究价值。 已有的文献中对于地铁站站厅环境温度的预测研究鲜有报道。传统的方式是通过建 立仿真平台进行模拟,但这些模型通常是稳态或半稳态的,不适合于处理高频率的扰动 因素,导致其结果与实际情况有差异⑴。本文提出了基于数据驱动的地铁站内环境温度 的建模。通过对收集的地铁站实测数据进行分析,用相关系数描述了不同变量与地铁站 站厅温度Z间的相关关系;利用支持向量数据(SVR)、BP神经网络、决策树CART三 种数据挖掘算法建立了预测地铁站站厅温度的时间序列模型,通过建立性能指标评价三 种模型的预测结果,得到了最佳的预测模型。 1基于数据挖掘算法的时间序列预测模型 常用数据挖掘算法可以分为两类:有监督算法、无监督算法。其屮常用的有监督算 算法包括:支持向量机、人工神经网络、决策树、随机森林等;常用的无监督算法包括 聚类分析、关联规则分析等⑵。本文采用有监督算法中的SVR、BP神经网络和决策树 CART算法进行建模分析。 1.1支持向量回归(SVR) 支持向量回归rti于其良好的泛化性被广泛用于能耗、电力预测等方面4Jo对于给 定的训练数据集合{(也」),2 1,2,...,N} , SVR利用非线性映射0:兀T仅旺)将数据集 映射到m维特征空间,其特征空间的回归函数可以表示为: 为了计算(1)中的閔口 4并使得估计真实风险最小,构建如下目标函数: 1 1 JV 卿訓+C戒X+G X-(坷心“+历金+纟 并服从: (69^9(X-) + /?) — yi 5 £ + $ 弘0点 nO,i = l,2,..?,N 在本文中,选取了不敏感惭数作为模型的损失幣数,SVR模型计算出的支持向 量具有稀疏性,模型结构较为简单。 1.2 BP神经网络 BP神经网络是一种多层前馈网络,包含输入层、隐含层和输出层。通常采用梯度 下降法调整权值和阈值使网络的实际输岀值和期望输出值的均方误差最小⑸。对于隐含 层,其表达式为: hj = /(X 吗兀 + 勺),j = 1,2,…,m (3) /=| 砌为输入层第/个节点与隐含层第./?个节点之间的连接权值;/为隐含层激励幣数;cij 为隐含层第/个节点的阈值。输出层的表达式为: A =^hjCOik + 仇,R = 1,2,?..,/ (4) J=i 为第丿?个隐含层节点与第k个输出层节点之间的连接权值;bk为第k个输出层节点的 阈值。 1.3决策树 决策树通过树形结果将数据集从根节点分布至各个叶节点,组成不同的类別用于制 定决策。其中,CART决策树作为最广泛使用的决策树之一,既能够处理逻辑性数据集, 也能解决数据屮的缺失问题⑹。对于回归问题,CART树的每个节点的分裂规则定义为 使该节点的二次方差最小,即: L _ R min RE(〃丿=工(幵一九尸+工(儿-yR)2 (5) /=0 r=0 其屮X和升为节点的左、右分支,L和R分别为左右分支的样本个数,z和弘分别 为左右分支的平均输出,对于所有取值,使得二次方差最小的划分作为父节点,并以此 创建子节点,每个子节点再以同样的方式递归产生下一个父节点,直到不能再创建子节 点为止。 2 时间序列预测原理及模型性能评价指标 2.1时间序列预测原理 吋间序列分析模型是数据挖掘中常用的工具,建立在系统观测数据基础上的吋I可序 列模型可以用來研究系统运行状态或预测未來值⑺。经典的线性时序模型ARMA、AR、 MA以及ARIMA的建模算法已经获得诸多成果⑻

文档评论(0)

ggkkppp + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档