hive中的高阶函数:with cube函数,Grouping sets函数,With rollup函数

实际生产中,指标报表统计涉及多维分析,逐个开发计算sql工作繁冗。可创建统一目标维度分析聚合结果表,利用hive高阶聚合函数在一个sql中计算所有可能维度组合。介绍了Cube表模型,还阐述了hive的With cube、Grouping sets、With rollup三个高阶函数。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.应用背景:

实际生产中,各种指标的报表统计,往往都会涉及到多维分析,比如,统计日活数,日会话次数,日回头访客数,日新,日用户平均访问时长,访问深度……都需要从不同维度,各种角度去分析,如果上述维度分析需求,都逐个开发计算sql(逐个去group by聚合),工作繁冗!

那么,如何解决这个问题呢?

2.实现过程:

2.1 关键要点:

  1.  创建一个统一的目标维度分析聚合结果表,这个表应该包含所有的维度字段
  2.  利用hive的高阶聚合函数,在一个sql中,即可计算出所有可能的维度组合

2.2 Cube表模型:这种表,在业内通常被称之为: cube (多维数据立方体)

手机型号

操作系统

App版本

下载渠道

小时段

日活总数

江西

\n

\n

\n

\n

\n

\n

\n

1000

江苏

\n

\n

\n

\n

\n

\n

\n

1500

河南

\n

\n

\n

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值