封面
版权
作者
目录
序1
序2
前言
第1篇 基础篇
第1章 大数据的三把利剑
1.1 豌豆杂交实验
1.2 曹冲称象启示
1.3 谷歌的三把利剑
1.4 智慧改变世界
第2章 企业的大数据观
2.1 企业面临的挑战
2.1.1 数据能力是核...
封面
版权
作者
目录
序1
序2
前言
第1篇 基础篇
第1章 大数据的三把利剑
1.1 豌豆杂交实验
1.2 曹冲称象启示
1.3 谷歌的三把利剑
1.4 智慧改变世界
第2章 企业的大数据观
2.1 企业面临的挑战
2.1.1 数据能力是核心竞争力
2.1.2 从粗放经营到智慧经营
2.1.3 技术与商业的双重挑战
2.2 企业大数据从哪来
2.2.1 来自于主体的产生
2.2.2 来自于客体的产生
2.2.3 来自于社会的产生
2.3 企业大数据如何存储
2.3.1 非结构化数据存储
2.3.2 结构化数据存储
2.3.3 半结构化数据存储
2.3.4 大数据存储的问题
2.4 企业大数据如何加工
2.4.1 分析或挖掘模型设计
2.4.2 并行处理程序编码
2.4.3 结果在全局中呈现
2.5 企业的大数据到哪里去
2.5.1 大数据对企业影响深远
2.5.2 大数据是一种新商品
2.5.3 精准营销需要大数据
2.6 企业大数据观总结
第3章 大数据和大数据系统
3.1 大数据
3.1.1 大数据概念
3.1.2 大数据的特征
3.1.3 数据计量单位
3.1.4 大数据来源
3.1.5 大数据类型
3.2 大数据系统
3.2.1 设计目标和原则
3.2.2 系统的设计思想
3.2.3 系统的逻辑架构
3.2.4 与现有系统的关系
3.2.5 当前的大数据系统
第2篇 技术篇
第4章 分布、键值对与族
4.1 分布与MapReduce
4.2 键值对的奥妙所在
4.3 动态数据库表原理
第5章 HDFS(分布式文件系统)
5.1 设计目标
5.2 基本概念
5.2.1 块
5.2.2 名称节点与数据节点
5.3 系统架构
5.3.1 逻辑架构
5.3.2 物理架构
5.4 运行机制
5.4.1 文件读取
5.4.2 文件写入
5.4.3 特别关注
5.5 系统功能
5.5.1 多文件系统
5.5.2 目录管理
5.5.3 文件管理
5.5.4 文件归档
5.5.5 并行复制
5.6 系统I/O特性
5.6.1 完整性校验
5.6.2 压缩与编码解码
5.6.3 序列化
5.6.4 特殊文件结构
5.7 非Java访问接口
5.8 系统性能
5.8.1 可靠性措施
5.8.2 性能优化
第6章 MapReduce分布式编程模式
6.1 不同于传统
6.2