封面
版权页
前言
作者简介
目录
第一篇 基础篇 流式数据处理概论
第1章 大数据环境下的云计算与物联网
1.1 云计算与物联网
1.1.1 云计算
1.1.2 物联网
1.2 大数据下的新挑战
1.2.1 大数据及其特征
1.2.2 大数据...
封面
版权页
前言
作者简介
目录
第一篇 基础篇 流式数据处理概论
第1章 大数据环境下的云计算与物联网
1.1 云计算与物联网
1.1.1 云计算
1.1.2 物联网
1.2 大数据下的新挑战
1.2.1 大数据及其特征
1.2.2 大数据处理的技术挑战
1.3 本章小结
第2章 流式计算的理论与技术
2.1 流式数据与流式实时计算
2.1.1 流式数据
2.1.2 流式实时计算
2.2 流式数据处理的系统与应用
2.2.1 发展与挑战
2.2.2 Hadoop 2.0生态圈
2.3 Storm
2.3.1 起源与发展:Twitter的开源与影响
2.3.2 功能
2.3.3 特色:可扩展、可靠的分布式流式数据处理
2.4 其他开源流式数据处理系统
2.4.1 Yahoo S4
2.4.2 Spark Streaming
2.4.3 Facebook Puma
2.5 本章小结
第3章 实际案例:城市道路车辆数据的实时监控分析系统
3.1 背景与需求分析
3.1.1 背景
3.1.2 数据处理的业务需求
3.2 数据处理系统的架构设计与技术选型
3.2.1 架构设计
3.2.2 技术选型
3.3 本章小结
第二篇 系统篇 流式数据处理系统Storm的基础原理
第4章 Storm的系统架构
4.1 系统架构与部署模式
4.1.1 系统架构
4.1.2 单机/分布式部署
4.1.3 本地模式
4.2 系统节点
4.2.1 Zookeeper:协调节点
4.2.2 nimbus:主控节点
4.2.3 supervisor:工作节点
4.2.4 UI:控制台节点
4.3 本章小结
第5章 Storm的通信模型
5.1 Thrift:可扩展、跨语言的通信软件框架
5.1.1 Thrift的基础概念
5.1.2 基于Thrift的数据通信
5.2 Thrift在Storm中的应用:系统节点间的通信
5.2.1 接口的定义与实现
5.2.2 客户端与Storm系统的通信
5.3 ZeroMQ在Storm中的应用:作业任务间的通信
5.3.1 ZeroMQ:面向分布式并发应用的高性能异步消息处理库
5.3.2 Tuple与declareOutputFields():数据项结构及声明
5.4 Storm 可配置的通信机制
5.5 本章小结
第6章 Storm的作业单元:Topol