8. Hive JOIN
写
join
查询时,需要注意几个关键点:
1)只支持等值join,因为非等值连接非常难转化为MapReduce任务
示例:select a.* from a join b on a.id = b.id是正确的,然而:select a.* from a join b on a.id>b.id是错误的。
2)可以join多个表,如果join中多个表的join的列是同一个,则join会被转化为单个MapReduce任务
示例:select a.
, b.
, c.* from a join b on a.col= b.col1 join c on c.col= b.col1被转化为单个MapReduce任务,因为join中只使用了b.col1作为join列。
但是如下写法会被转化为2个MapReduce任务。因为 b.col1用于第一次join条件,而 b.col2用于第二次 join
select a.*, b.*, c.* from a join b on a.col= b.col1 join c on c.col= b.col2;
<
版权声明:本文为qq_42164977原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。