
storm
小狼_百度
百度,web系统,分布式系统,大数据,机器学习,人工智能等爱好者
展开
-
storm入门教程 第一章 前言
1.1 实时流计算互联网从诞生的第一时间起,对世界的最大的改变就是让信息能够实时交互,从而大大加速了各个环节的效率。正因为大家对信息实时响应、实时交互的需求,软件行业除了个人操作系统之外,数据库(更精确的说是关系型数据库)应该是软件行业发展最快、收益最为丰厚的产品了。记得十年前,很多银行别说实时转账,连实时查询都做不到,但是数据库和高速网络改变了这个情况。随着互联网的更进一步发转载 2014-07-14 15:55:02 · 683 阅读 · 0 评论 -
Storm-源码分析汇总
Storm FeaturesStorm 简介Storm Topology的并发度Storm - Guaranteeing message processingStorm - Transactional-topologiesTwitter Storm – DRPCStorm 多语言支持 Storm StarterStorm st转载 2014-08-06 17:24:35 · 11824 阅读 · 0 评论 -
Storm入门教程 第二章 构建Topology
2.1 Storm基本概念在运行一个Storm任务之前,需要了解一些概念:TopologiesStreamsSpoutsBoltsStream groupingsReliabilityTasksWorkersConfigurationStorm集群和Hadoop集群表面上看很类似。但是Hadoop上运行的是MapReduce jobs,而在Storm上运行的是拓转载 2014-07-14 15:57:07 · 737 阅读 · 0 评论 -
【Storm总结-6】Twitter Storm: DRPC简介
转自:http://xumingming.sinaapp.com/756/twitter-storm-drpc/-------------------------Storm里面引入DRPC主要是利用storm的实时计算能力来并行化CPU intensive的计算。DRPC的storm topology以函数的参数流作为输入,而把这些函数调用的返回值作为topology的输出转载 2014-07-14 16:35:23 · 621 阅读 · 0 评论 -
[Trident] Storm Trident 教程
英文原址:https://github.com/nathanmarz/storm/wiki/Trident-tutorial----------------Trident是在storm基础上,一个以realtime 计算为目标的高度抽象。 它在提供处理大吞吐量数据能力的同时,也提供了低延时分布式查询和有状态流式处理的能力。 如果你对Pig和Cascading这种高级批量处理转载 2014-07-14 16:32:51 · 694 阅读 · 0 评论 -
Storm入门教程 第五章 一致性事务
第五章 一致性事务Storm是一个分布式的流处理系统,利用anchor和ack机制保证所有tuple都被成功处理。如果tuple出错,则可以被重传,但是如何保证出错的tuple只被处理一次呢?Storm提供了一套事务性组件Transaction Topology,用来解决这个问题。Transactional Topology目前已经不再维护,由Trident来实现事务性to转载 2014-07-14 16:08:14 · 698 阅读 · 0 评论 -
storm入门教程 第四章 消息的可靠处理
转载自:量子恒道官方博客4.1 简介storm可以确保spout发送出来的每个消息都会被完整的处理。本章将会描述storm体系是如何达到这个目标的,并将会详述开发者应该如何使用storm的这些机制来实现数据的可靠处理。4.2 理解消息被完整处理一个消息(tuple)从spout发送出来,可能会导致成百上千的消息基于此消息被创建。我们来思考一下流式的“转载 2014-07-14 14:24:39 · 768 阅读 · 0 评论 -
Storm - Transactional-topologies
Storm guarantees data processing by providing an at least once processing guarantee. The most common question asked about Storm is "Given that tuples can be replayed, how do you do things like countin转载 2014-07-28 11:16:16 · 1278 阅读 · 0 评论 -
Storm Topology的并发度
一个Topology可以包含一个或多个worker(并行的跑在不同的machine上), 所以worker process就是执行一个topology的子集, 并且worker只能对应于一个topology一个worker可用包含一个或多个executor, 每个component (spout或bolt)至少对应于一个executor, 所以可以说executor执行一个compenent的转载 2014-07-25 16:55:47 · 1406 阅读 · 0 评论 -
Curator-Framework开源Zookeeper快速开发框架介绍
Zookeeper 客户端框架 Curator-Framework 来自Netflix公司,现在归Apache,目前版本2.0.1!在使用ZK开发时会遇到让人头疼的几个问题,ZK连接管理、SESSION失效等一些异常问题的处理,Curator替我们解决了这些问题,通过对ZK连接状态的监控来做出相应的重连等操作,并触发事件!更好的地方是Curator对ZK的一些应用场景提供了非常好的实现转载 2014-07-25 17:20:35 · 15339 阅读 · 0 评论 -
Twitter Storm源代码分析之DRPC架构细节
作者: xumingming | 可以转载, 但必须以超链接形式标明文章原始出处和作者信息及版权声明网址: http://xumingming.sinaapp.com/765/twitter-storm-code-analysis-drpc-arch/ 概述在前一篇文章中我们介绍了Storm DRPC是怎么利用Storm提供的Tuple, Spout, Bolt, Topo转载 2014-07-24 17:39:51 · 752 阅读 · 0 评论 -
Storm源码浅析之topology的提交
最近一直在读twitter开源的这个分布式流计算框架——storm的源码,还是有必要记录下一些比较有意思的地方。我按照storm的主要概念进行组织,并且只分析我关注的东西,因此称之为浅析。 一、介绍 Storm的开发语言主要是Java和Clojure,其中Java定义骨架,而Clojure编写核心逻辑。源码统计结果: 180 text files.转载 2014-07-23 15:34:07 · 6630 阅读 · 0 评论 -
Twitter Storm如何保证消息不丢失
本文翻译自: https://github.com/nathanmarz/storm/wiki/Guaranteeing-message-processingstorm保证从spout发出的每个tuple都会被完全处理。这篇文章介绍storm是怎么做到这个保证的,以及我们使用者怎么做才能充分利用storm的可靠性特点。一个tuple被”完全处理”是什么意思?就如同蝴蝶效应一样,从spo转载 2014-06-07 18:14:04 · 685 阅读 · 0 评论 -
storm 原理简介及单机版安装指南
目录[-]1、准备工作2、一个Storm集群的基本组件3、Topologies4、Stream5、数据模型(Data Model)6、一个简单的Topology7、流分组策略(Stream grouping)8、使用别的语言来定义Bolt9、可靠的消息处理10、单机版安装指南本文翻译自: https://github.com/nathanmarz/storm/wiki/Tuto转载 2014-06-07 18:12:24 · 979 阅读 · 0 评论 -
Storm入门教程 第三章 Storm安装部署步骤
本文以Twitter Storm官方Wiki为基础,详细描述如何快速搭建一个Storm集群,其中,项目实践中遇到的问题及经验总结,在相应章节以“注意事项”的形式给出。3.1 Storm集群组件Storm集群中包含两类节点:主控节点(Master Node)和工作节点(Work Node)。其分别对应的角色如下:1. 主控节点(Master Node)转载 2014-07-14 15:56:09 · 739 阅读 · 0 评论 -
Storm实战常见问题及解决方案
该文档为实实在在的原创文档,转载请注明:http://blog.sina.com.cn/s/blog_8c243ea30101k0k1.html类型详细备注该文档是群里几个朋友在storm实战中遇到的一些问题,及其对应解决办法。 相关描述² 其他相关文档请参考新浪博客http://blo转载 2014-08-11 14:30:47 · 61878 阅读 · 4 评论