Druid知识点

error0318

已于 2023-06-07 21:15:56 修改

阅读量407

点赞数

文章标签：大数据

于 2023-04-08 17:27:29 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/error311/article/details/130031707

版权

采用预计算的方式，主要解决的是对于大量的基于时序的数据进行聚合查询。数据可以实时摄入，进入到Druid后立即可查，同时数据几乎不可变的。

Druid还是一个实时处理时序数据的OLAP数据库，索引按照时间分片，查询时也是按照时间线去路由索引的

应用场景

点击流分析
服务器指标存储
供应链分析
数字营销/广告分析

使用范围

插入率很高，但更新很少
大多数查询都是聚合查询
查询等待时间为100ms到几秒
数据具有时间成分
有多个表，但每个查询仅仅只命中一个大的分布式表
具有高基数数据列（例入uid），并且需要对其进行快速计数和排名
数据来源为kafka，HDFS，之类的对象存储

功能特性

列式存储格式
可扩展的分布式系统
大规模并行处理
实时或批量摄取
自我修复，自我平衡，易于操作
云原生的容错架构，不会丢失数据
用于快速过滤的索引
基于时间的分区
近似算法（性能高，有误差）

特点

Druid实时的数据消费，真正做到数据摄入实时，查询结果实时
Druid支持PB级数据，千亿级事件快速处理，支持每秒数千查询并发
Druid的核心是时间序列，把数据按照时间序列分批存储，十分适合用于对按照时间进行统计分析的场景
Druid把数据分为三类：时间戳，纬度列，指标列
Druid不支持多表链接
Druid中的数据一般是使用其他计算框架（Spark等）预计算好的低层次统计数据
Druid不适合用户处理透视纬度复杂多变的场景
Druid擅长的查询类型比较单一，一些常用的SQL（group by等）语句在Druid里运行速度一般

博客等级

码龄7年

515
原创

115
点赞

254
收藏

57
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: ClickHouse 知识点

下一篇：: 字节跳动懂车帝一面

最新评论

projectEuler problem 17 .Number letter counts
error0318: 101:one hundred one 100表示的是hundred的前面这个
projectEuler problem 17 .Number letter counts
金牌讲师爱吃甜甜圈: 大佬 0-9出现次数的(9*10+100) 这个100是哪种情况
选数字（多人博弈）
落城雨: 我再想一下，谢谢
选数字（多人博弈）
error0318: 1：会产生一个趋同的值，如果限制在整数内选择的话，会趋向为1，否则的话趋向0 2：如果限定选择一样，就没有收益这个条件，《每个人也不会随机选择》，原因是随机选择对自己没有收益，我本次选择一定是要对自己有益的，就我个人观点，如果这次选择只是让自己极小概率获得收益，我一定在考虑把获得收益的概率上升。我可以预先判断随机得到的平均值为50，我选择50的2/3，其他人应该也会这么想，除非不想获得奖励
选数字（多人博弈）
落城雨: 我有个问题，如果这是一个进行多轮的游戏，选择最接近2/3的能获得奖励。这样的话，大家会产生一个趋同的值么？（如果再限定选择一样的话，就没有收益，大家都没有，这样的话会不会最终大家都随机，这样最好，毕竟概率都一样而且轮次无限）

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。