国际超大型数据库会议.pdfVIP

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
国际超大型数据库会议

第 9 卷  第10 期  2013 年 10 月 国际会议 国际超大型数据库会议 邹 磊 关键词 :超大型数据库 国际会议 北京大学 20 13 国际超大型数据库会议于20 13 年8 月在 稿的被录用论文,则在本年度的会议上作口头报告。 意大利里瓦德尔加尔达(Riva Del Garda) 举办。 所有录用的论文发表在 《超大型数据库会议论文集》 国际超大型数据库会议(International Confer- 上。这种类似于期刊的评审形式是为了避免国际学 ence on Very Large Data Bases, VLDB) 是由超大型数 术会议中 “一次性决定命运”的缺点,给作者和评 据库基金会举办的旗舰会议。该基金会是在美国成 审人之间提供更多交流的机会,尽量减少评审过程 立的非营利性组织,宗旨是 “促进世界范围内的数 的随机性 ;而且,与传统的期刊评审模式相比,大 据库及相关领域的学术交流”。在该基金会的资助 大缩短了评审时间。 下,催生了两本数据库领域顶级刊物,即《国际超 本次会议还接收了实验类论文(experiments and 大型数据库会议论文集》(PVLDB ) 和 《国际超大型 analysis track) 。实验论文是指通过实验的方法研究 数据库期刊》(VLDB Journal) 。 比较各个现有算法之间的性能差异,也可以通过实 验的方法来描述一个创新型系统是如何有效地利用 会议评审制度 数据库技术的。 本次会议录用了80 篇研究型论文、17 篇工业 主题报告 届论文和45 篇系统演示论文,录用率分别为23% , 32% 和46%。 本次会议安排了三场主题报告。脸谱公司副总 超大型数据库会议从2008 年开始,进行创新 裁杰伊 ·帕瑞克(Jay Parikh) 作了关于 “网络规模下 型的会议论文投稿和评审模式,采用类似于期刊的 的数据基础结构”(Data Infrastructure at Web Scale) 两轮评审模式。每月1 日是投稿截止时间,即一年 的报告。脸谱对于系统的可扩展性是非常重视的。 有 12 个投稿截止期。每月1 日投稿的论文通常在两 目前,脸谱的数据仓库容量已超过250PB (1PB=250 个月时间内获得第一轮4 位审稿人 (包括一位综合 字节),每天有600TB (1TB=240 字节)的数据加入。 审稿人)的意见。第一轮的审稿意见分为 “直接录 面对如此庞大的数据,脸谱采用了定制性的体系结 用”、“需要修改”和 “拒绝录用”。本次会议只有4% 构来支持其内部的数据仓库及其数据分析等任务。 的论文在第一轮被直接录用,23% 的论文被要求修 杰伊 ·帕瑞克在报告中提到了数据生命周期的概念, 改。修改后的论文需要在两个月内返回,然后启动 即数据可以分为“热数据”(hot data)、“暖数据”(warm 第二轮的评审。一般在两个月内完成最后的评审意 data) 和 “冷数据”(cold data) 三个阶段。针对处在 见。如果是上一年度4 月 1 日至本年度3 月 1 日投 不同时期的数据采用不同的处理方式,可以降低能 71 动态 第 9 卷  第 10 期  2013 年 10 月 耗,提高系统的可扩展性。为了提高系统查询速度, 12 脸谱构建了两个内部系统Puma 和Pre sto 。其中, 10 8 Presto 采用了内存处理方式,其效率明显优于Hive , 6 可以很好地支持交互式的数据分析任务。此外,杰 4

文档评论(0)

qwd513620855 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档