李雨倩-MapReduce连接优化-厦门大学数据库实验室.pptVIP

  • 5
  • 0
  • 约5.66千字
  • 约 19页
  • 2017-08-10 发布于天津
  • 举报

李雨倩-MapReduce连接优化-厦门大学数据库实验室.ppt

李雨倩-MapReduce连接优化-厦门大学数据库实验室

厦门大学数据库实验室 MapReduce 连接优化 报告人:李雨倩 导师:林子雨 2014.08.12 基于传统 MapReduce 的连接 这类算法主要通过实现map函数、reduce函数及之间的数据流传递,来完成数据连接运算。对于这方面的研究主要集中于两表等值连接、两表非等值连接(又称θ连接)、两表相似度连接、多表等值连接(星型连接、链式连接)、多表非等值连接等问题。 相似度连接 多表连接 相似度连接举例 For example,in master-data-management applications, a system has to identify that names “John W. Smith”, “Smith, John”, and“John William Smith” are potentially referring to the same person. As another example, when mining social networking sites where u

文档评论(0)

1亿VIP精品文档

相关文档