
hive
文章平均质量分 83
锐明清风
这个作者很懒,什么都没留下…
展开
-
Hive的Order/Sort/Cluster/Distribute by比较
Hive中这四种by各有区别,相互之间衔接一些联系,值得简单总结一下,有利于不同场景下的切换使用。根据字段列,对行进行排序)*## 对col1的列值,进行降序排序,空值置于首位只使用sort by,数据随机分配到reducer中,不会出现数据倾斜问题;使用cluster by或者distribute by,因为使用了hash的规则,有很大可能会出现数据倾斜问题;总而言之,根据场景选择合适的by。原创 2024-03-30 10:37:48 · 539 阅读 · 0 评论 -
hive最全面的日期函数
收录hive2.1版本中所有的日期函数。标红的函数为常用函数。原创 2024-03-21 21:14:43 · 792 阅读 · 1 评论