Hive join转化为MapReduce任务

  • Post author:
  • Post category:其他




8. Hive JOIN



join

查询时,需要注意几个关键点:


1)只支持等值join,因为非等值连接非常难转化为MapReduce任务

示例:select a.* from a join b on a.id = b.id是正确的,然而:select a.* from a join b on a.id>b.id是错误的。


2)可以join多个表,如果join中多个表的join的列是同一个,则join会被转化为单个MapReduce任务

示例:select a.

, b.

, c.* from a join b on a.col= b.col1 join c on c.col= b.col1被转化为单个MapReduce任务,因为join中只使用了b.col1作为join列。

但是如下写法会被转化为2个MapReduce任务。因为 b.col1用于第一次join条件,而 b.col2用于第二次 join

select a.*, b.*, c.* from a join b on a.col= b.col1 join c on c.col= b.col2;

<



版权声明:本文为qq_42164977原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。