- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
GroundTruthGoogle是如何构建地图的
Ground Truth:Google是如何构建地图的
对于许多人来说,Google 地图已经成为日常生活的一部分,但是你知道 Google 地图是如何构建的吗?在我们能够看到的地图背后,其实还有一个更加复杂的地图,包括了现实世界中获取的庞大数据,而地图的构建中投入了大量的人力。最近,Google 向 Atlantic 网站的 Alex C. Madrigal 展示了深层的地图及其构建过程。这是公司第一次向外人展示 Ground Truth 计划。
一个搜索公司为何要去制造世界上最好的电子地图?在 Google 看来,地图同样与 Google 的使命密切相关。Manik Gupta 是 Google 地图高级产品经理,他告诉 Atlantic,“如果你观察下线下世界,会发现在我们真实生活的世界里,信息并不全是在线的。随着我们生活需求的增加,我们试图填补所看到的真实世界和在线世界的鸿沟,地图就是起这个作用的”。
Google 开发地图的办公室并不起眼,只是山景城郊区一栋低层建筑。在那里 Alexis 见到了 Gupta 以及地图团队的技术主管 Micheal Weiss-Malik。Micheal 原来是 NASA 的工程师,他 20% 的时间用在了 Google 火星地图上。
Micheal Weiss-Malik 向 Alexis 讲述了他们构建地图的过程。这需要许多步骤,从合作者那里获取数据,将它处理成合适的格式,然后和其它源头那里获得的数据合并。做完这些工作后,还需要进行其它操作,使用工具来传入数据,最终产出高质量的地图。
当他们构建美国地区的地图时,首先使用了美国审计局的 TIGER 数据库。但是那些地图并一定完全符合实际情况。为此,Google 会把这些数据与其他来源的数据进行比对,比如美国地质调查局的数据,以及 Google 街景车获取的数据。现在,Google 街景是非常重要的数据源。街景车的行程已经达到 500 万公里,每次行驶都会带来有用的数据,包括实际路况和大量的图片。Google 会通过算法从拍摄的图片中提取出交通标识,甚至将它们贴到深层的地图上面。
我们可以把这些街景车和网络上的爬虫做类比,只是它们可以爬取真实世界的文字信息。通过计算机图片识别技术,Google 能够为现实世界做索引。Google 地图副总裁 Brian McClendon 认为,通过 OCR 技术,Google 能够将世界上各种真实文字信息组织起来。目前构建地图的过程中,Google 会从图片中提取街道名称和地址,但是这只是个起步。Brain McClendon 说他们有 600 万商业机构和 2000 万个地址的“视觉代码” View codes ,通过 logo 配对,可以找出公司标识所在的位置。他们能够对获取的图片进行辨识,进行语义化的了解。
不过,将街景地图直接转换为可用的信息仍然是未来的事情。要对地图的实际意义进行理解,仍然需要人工投入。比如要了解某个交叉口是否可以拐弯,仍然需要有人去看,可能是实际驾驶,也可能是通过观察街景车拍摄的图片。
Alexis 了解到,Google 地图中投入的人工是非常大的。根据 Micheal Weiss-Malik 的说法,要制作一个国家的地图,需要上百个操作员来处理数据,对地图进行实时更新。每天都有上千的用户报告问题,对于那些能够解决的问题,地图团队在几分钟内处理掉大部分。一个例子:某个用户报告说 Google 地图上没有显示某个边远地区新建的环形路。这时候,卫星地图仍然没有显示这个改变,但是一辆 Google 街景车最近从那里路过,拍下了这条新路。于是,Google 的操作员开始快速绘出这条新道路,并且和地图上已经存在的结构连接。这只需要几分钟时间。
在了解到 Google 地图的构建过程之后, Alexis 认为没有其它公司能够像Google 一样获取如此大量的地理数据。这不仅是因为 Google 处理数据的能力,而且因为它能够投入大量的人力,去组合和清理数据。
可以想象,如此庞大的数据处理,对于任何公司都是不可能完成的任务。除了公司内部的操作员之外,Google 还要利用更广大的用户来帮忙。Google 的 MapMaker 产品就是一个这样的产物。通过 MapMaker,公众可以对 Google 地图进行编辑,这可以最大限度的利用人脑中的知识,将其变为互联网上的数据,Open Street 地图也是这样利用大众智力投入的。
未来的世界将是虚拟和现实结合的世界。这使得 Google 的地理数据成为最有价值的资产。对此,科幻小说家 Robin Sloan 是这样说的,“我认为这是 Google 的核心资产。在 50 年内,Google 将是一个
文档评论(0)