2、问题分析.docVIP

  1. 1、本文档共15页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2、问题分析

深圳市交通小区的划分 北京邮电大学世纪学院 于乾坤、郭威、盛乾坤 摘 要 本文选题来源于2011年全国大学生数学建模夏令营的D题,借助于D题给出的大量出租车GPS终端记录数据,对深圳市的交通小区的划分做了详细的研究。 首先对于给出的海量数据进行筛选,利用数据库(Microsoft SQL Server 2005)剔除不合理的数据,分析筛选后得到的数据,确定深圳市的经度在区间,纬度在。 在第一问题中,把车辆状态从“0”变为“1”的点,记为出租车载客的起讫点。同时将深圳市出租车活跃区域,按照经纬度以为单位划分成面积为的小方格。根据出租车的起讫点,统计每个小方格中的出租车的数量。利用MATLAB对其进行曲面拟合,从而得到深圳市出租车数量统计分布图。 在第二个问题中,把第一问中所得到的原始数据按照不同差异点进行分类:孤立差异点、大量聚集差异点、大量分散差异点。然后利用DBSCAN算法的基本思想,对数据进行穷举和迭代优化。经过不断地提高数据的筛选条件,生成完整聚类数据表,剔除弱关联度的聚类数据,结合深圳市实际地理情况,最终得到符合上述差异点分类的交通小区和小区代表点的经纬度。 关键字: 数据筛选,曲面拟合,聚类分析,DBSCAN算法 一、 问题重述 1 1.1 背景资料: 1 1.2 需要解决的问题: 1 二、 问题分析 1 2.1 对采集的出租车GPS终端数据的分析: 1 2.2 问题一的分析: 2 2.3 问题二的分析: 2 三、 模型假设 2 四、 符号说明 2 五、 模型的建立与求解 3 5.1 问题一的数据筛选: 3 5.2 问题二的解决方案及模型 4 六、 模型的评价 12 6.1 模型的优点 12 6.2 模型的缺点 12 七、 参考文献 13 问题重述 背景资料: 各大城市出租车越来越多的安装了GPS终端,这些终端能够每隔1分钟向出租车管理中心发送本车的位置、速度和方向等信息,是车辆GPS实时数据。原始数据主要保存出租车上装配的GPS终端所采集的数据,这些数据包括序号,车牌号码,GPS时间,经度,纬度,车辆状态(空车、重车),车辆速度,车辆方向(8个方向)等信息。 以深圳市为例,利用采集出租车GPS终端数据[1],对深圳市交通问题进行分析。 需要解决的问题: 问题一:根据出租车载客的起讫点,画出深圳市出租车数量统计分布图。 问题二:根据出租车载客的起讫点,结合深圳市的交通地图,恰当的划分交通小区,并选择小区中的某一点,用其经纬数值作为该小区的坐标。 问题分析 对采集的出租车GPS终端数据的分析: 数据采集时间段为2011/04/18-2011/04/26,出租车车辆总数为13798台。 数据概况: 数据总大小约9.7GB(ANSI字符格式下); 每辆车的数据记录条数约为5000-15000条不等,且波动很大; 因行车环境的影响,GPS数据采集间隔时间周期不恒定。 每个车辆轨迹数据文件均以车牌号命名,数据文件采用txt格式存储,数据文件由7个字段构成,分别如下: name 车牌号 time 采集时间点(格式:YYYY/MM/DD hh:mm:ss) jd 经度 wd 纬度 status 车辆状态(0=非打表,即:空载;1=已打表,即:重载) v 车速(单位为:km/h) angle 行车方向(0=东;1=东南;2=南;3=西南;4=西;5=西北;6=北;7=东北) 记录范例: 粤B000H6, 2011-04-18 00:07:53, 114.11834, 22.57485, 0, 0, 0; 粤B001H0, 2011-04-20 08:13:58, 113.948364, 22.563717, 1, 36, 6; 数据之中含有不合理数据,包括: 错误的打表信息,例如:车辆状态既不是0,也不是1; 错误的采集时间信息。例如:在终端数据中出现:1970/1/1 00:00:00。对于这种现象,将GPS所记录的打车时间判定为GPS初始化时间。 错误的经纬度信息。例如:在实际数据测量数据中,出现了经度纬度都为零,以及一些偏离绝大多数车辆所测得经纬度信息。 问题一的分析: 由于记录的数据具有相似的特点,对于这种类型的数据,可以直接运用Microsoft SQL Server 2005软件进行处理。在确定出租车起讫点之前,首先要剔出采集数据中的错误数据。其次对剩余的数据进行分析,对数据的分布进行总体预估。 按照车辆牌照进行聚类抽样,得到了深圳市内出租车的活跃矩形区域的经纬度为:东经113.7°至114.395°,北纬22.4°到22.695°。 而从深圳政府在线上[2]得到的深圳市经纬度信息:东经113°46′至114°37′,北纬22°27′至22°52′。 由于在采集的数据中,实际测量结果和官方结

文档评论(0)

75986597 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档