Storm Applied 读书笔记

Storm Applied

Storm是个实时数据流处理框架, 其用于对数据进行实时处理,便于及时产生结果. 
与Hadoop相比, Hadoop MapReduce是个数据批处理框架, 实时性不如Storm高
通过此书阅读, 可以了解:
    (1) Storm组成部分: Topology, Tuple, Stream, Spout, Bolt
    (2) Stream分组,包括 Shuffle Group, FieldGroup, GlobalGroup等区别
    (3) Storm Topology设计原则及可靠性保证
    (4) Storm 集群组成: 包括ZK, Nimbus(master node), Supervisor(slave node), 以及节点内 work process, executor, task等概念及相互关系
    (5) Storm调优和内部结构
    ......

源码

https://github.com/18965050/storm-applied.git

读书笔记

https://github.com/18965050/storm-applied/wiki

参考资料

网上有一些storm的学习资料很值得学习下, 尤其是介绍storm 消息可靠性的保证

Storm入门教程:前言

Storm入门教程:构建Topology

Storm入门教程:安装部署步骤详解

Storm入门教程:消息的可靠处理

Storm入门教程:一致性事务

Storm应用系列

Published: March 03 2016