- 2
- 0
- 约1.01千字
- 约 3页
- 2017-09-03 发布于重庆
- 举报
本周主要工作围绕 “城市中人群运动模式查询”问题展开。运动对象的研究主要是以
Movement Point Objects 为研究对象 (包括车辆、人、动物、自然现象等),研究包括运动轨迹或
路线、运动是否受约束、个体运动还是群体运动、运动的不确定性以及运动的时空模式等。对于
运动的模式,论文 “
Towards a taxonomy of movement patterns”中总结如下:
其中 Laube 已经对常规的运动模式如 flock 、leadership、Encounter 等有较完整的定义和检测算法。
我们的问题依然集中在两个方面:
1、数据规模较大的情况下,如何提高检测算法
2、人群运动与其他MPO 有所不同,其模型是否可以有所创新
对于第一个问题,主要是想在HDFS 上构建索引提高检测和查询效率。本周花费了将
近一天多的时间理清了HDFS 的工作原理,特别是文件分割和读写过程。对于大文件,
HDFS 提供了专门的分割接口,将大文件分割后分成多个Mapper 进行读取,对于特定的
文件格式需要自己定义分割方法 (如图1)。
而文件的写入稍微容易些,但是其中需要注意namenode 和datanode 对于文件的处理上。在文
件的写入过程中namenode 其实监控整个写入过程
原创力文档

文档评论(0)