基于模糊c均值的高铁旅客票票行为研究.docxVIP

基于模糊c均值的高铁旅客票票行为研究.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于模糊c均值的高铁旅客票票行为研究 0 旅客购票行为特性的提出 目前,中国铁路运营距离为14万公里,其中高速铁路线路距离为2.6万公里。随着高铁路线规模的快速扩张,列车选择方案也变得越来越多样化。从铁路运输公司的角度来看,研究高铁旅客的选择行为特征对合理分配高铁线路的运输能力、提高运营效率和社会效益具有重要意义。 近年来, 基于铁路旅客出行行为的研究获得了一系列成果.文献[1]对高速列车和高频率列车换乘等旅客出行模式选择的角度进行了研究.文献[2]从旅客主体特性、列车特性和随机因素3方面, 对列车效用值分析了旅客乘车选择行为特征.文献[3]采用各种聚类算法对旅客就不同等级客票产品选择进行了研究.文献[4]对城际列车旅客出行时段和出行方式的选择进行了分析.文献[5]利用模糊综合评价方法对城际旅客的选择行为进行了分析.文献[6]提出高速铁路旅客出行时间选择的多项Logit模型, 分析了影响旅客出行时间选择行为的关键因素.以上研究主要对铁路旅客出行的某种选择行为 (出行时间选择、出行模式选择和客票产品选择等) 进行研究.然而所有出行选择的最终表现形式都是以“购票行为”来实现.旅客购票行为是基于旅客出行各种选择行为的结果, 体现了旅客出行的选择偏好, 能更加全面地反映旅客的出行特性.因此研究高铁旅客购票行为特性有利于高铁售票组织策略的合理制定和列车能力利用率的提升. 高铁旅客购票行为属性的特征变量较多, 分析关键变量是研究购票行为的重要基础.传统的旅客出行选择行为研究, 主要依据研究者经验选择部分特征变量.但各种特征变量之间是相互制约和关联的, 不同特征变量均可导致旅客不同的购票行为, 因此需要综合分析各种特征属性.由于特征变量较多, 要实现对每个旅客的购票行为进行分析实则不易.运用PCA可在综合分析的基础上挖掘关键特征变量;为了在不知先验信息的情况下, 通过购票旅客样本挖掘不同购票行为特性的内在联系, 采用无监督学习的聚类分析可有效实现将具有类似购票属性的旅客进行分类, 从而发现不同类旅客的购票行为特性. 本文以贵广高速铁路D类与G类列车的购票旅客统计数据为样本, 研究高铁旅客购票行为特性.旅客购票行为属性包含多种特征变量, 首先利用主成分分析法 (PCA) 1 高铁旅客购票行为统计分析 通过对贵广高铁本线列车进行调研, 选取非特殊季节2016年11月21~27日期间运营的所有列车, 自预售-60天至发车之日的旅客购票相关信息, 共计7×61=427天的不同售票信息.通过多次调研, 先后共获取到该线20个乘降作业车站的相关数据、164种不同车次列车, 共计67 009次购票, 一共售出229 543张客票. 首先对预售期内列车售票情况进行统计分析, 得到一周内每日发车的累计售票量百分比 (图1) .由此可知, 高铁旅客的购票行为具有一定特征分布规律, 其特征属性是影响分布的主要原因, 需首先分析购票旅客行为的特征属性. 2 旅客购票量的拟合 高铁旅客出行特征属性分为:出行因素 (旅客出行OD与出行日期等非特殊情况下不会改变的因素) 、购票因素 (旅客为实现出行计划, 在购票时可进行选择的因素) 和个体因素 (旅客年龄和性别等个体属性) , 如表1所示. 表1中, “单次出行人数”是指每次出行的旅客人数, 在实际购票过程中的反映旅客的单次购票量.旅客单次购票量的概率密度函数 (单次购票强度) 可通过对购票数据的拟合得到, 其结果呈指数分布 (图2) , 表达式为 3 特征属性的主要组成分析 3.1 主成分分析原理 为避免因包含过多影响较小的变量影响分析和解决问题, 首先对特征变量采用主成分分析.主成分分析主要利用降维思想, 最终采用少数变量尽可能多地反映原来变量的信息, 再根据相关系数发现强相关的特征变量, 并作为关键因素给予更多的考虑和关注. 记矢量X 当Y 求得所有主成份特征变量i与j的相关系数r: 3.2 关键影响因素的选取 根据以上分析方法可得到图3, 进而得到当主成分数b=2时, 贡献值可满足阈值条件 (大于90%) . 根据PC1和PC2与特征变量的相关系数r, 选取|r|0.6的特征变量为关键属性:单次出行人数、购票提前天数、出行OD城市人均GDP和购票渠道 (图4) . 4 多组分析与高铁游客的购买行为 4.1 基于fcm的双重聚类算法 FCM算法是一种基于划分的聚类算法, 其思想是使得被划分到同一类的对象之间相似度最大, 而各类之间的相似度最小 式中: 为了使式 (6) 达到极小的必要条件, 采用拉格朗日乘子法进行求解.设拉格朗日乘子为λ=[λ 由最优一阶条件: 因此, 改进FCM聚类算法与FCM算法的核心思想相同, 其主要步骤: Step 1初始化聚类中心矩阵 Step 3根据模糊划分矩阵 Step 4判定阈

文档评论(0)

lgjllzx + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档