
Kafka
那记忆微凉
大数据+云计算+区块链+微服务+机器视觉
展开
-
Kafka Consumer详细描述和深度解析
客户端从kafka集群中消费数据,同时对于kafka broker的失败客户端可以自动进行处理,也可以自动的适应topic partition在集群间的迁移。允许使用consumer group来与broker进行交互以实现负载均衡。consumer维护着到broker的TCP链接以便获取数据。在使用consumer之后如果没有关闭这些链接的话会导致资源泄露,consumer不是线程安全的,有关...原创 2019-10-29 14:54:20 · 1170 阅读 · 0 评论 -
CDH5.14.X安装Kafka过程(Kafka版本选择的过程)
CDH5.14安装Kafka过程:在CDH官网中关于Kafka的安装和升级中已经说到,在CDH中,Kafka作为一个分布式的parcel,单独出来作为parcel分发安装包。只要我们把分离开的kafka的服务描述jar包和服务parcel包下载了,就可以实现完美集成了。注意集成之前请阅读官方文档,特别是版本支持方面。查看kafka与CDH版本对应:https://www.cloudera.com/...原创 2018-06-29 13:09:06 · 15515 阅读 · 2 评论 -
基于Spark技术实现大规模时间序列异常检测成功落地
最近一直忙于异常检测项目的上线,一直没有时间来更新博客,该系统已经在大规模时间序列场景稳定运行1个多月,简单总结一下。达到的目标,通过Spark对3万个服务器进行预测,每个服务器包括5个指标,每个指标对应一个时间序列,模型全量15万,全量训练用21个Core耗时3个小时,预测程序12个core运行状态良好,整个系统已经平稳运行一个月,整个系统预估能够支持上亿个模型进行同时训练和预测。设计到...转载 2018-07-18 09:29:27 · 2192 阅读 · 2 评论 -
Spark-聚类分析-出租车案例
通过分析出租车数据,然后使用KMeans对经纬度进行聚类,然后按照(类别,时间)进行分类,再统计每个类别每个时段的次数。数据地址 链接: https://pan.baidu.com/s/166dKRUpryHWZ2F8wLA3eyw 密码: g9dz数据格式以及意义:111,30.655325,104.072573,173749111,30.655346,104.072363,173...转载 2018-07-20 11:56:34 · 4163 阅读 · 4 评论