目录
前言
上篇博客介绍了Hive中用于累计统计的开窗函数,本文接续上文介绍第二种:用于组内排序的开窗函数。用于组内排序的开窗函数使用频率远高于其他开窗函数,因为在工作中应用场景更多,比如分组排序、取每个分组内的Top n、组内随机抽样等等。下面我们对这类函数来做一个详细介绍。
1. 组内排序的开窗函数表
函数名 | 描述 |
---|---|
row_number() | 生成数据项在分组中的排名,排名即便相等也不会有并列排名,相同排名随机排序。例:1,2,3,4,5 |
rank() |
生成数据项在分组中的排名,排名相等时会产生并列排名,然后会在名次中留下空位。例:1,2,2,4,5 |