




这是一本站在一线 开发 人员的视角,从SQL的本质出发,采用理论与实践相结合、 案例 与分析相结合、作者经验与一线需求相结合的方式,深度解读大 数据 SQL优化核心 技术 和解决方案的 工具书 。本书主要面向 大数据 初中级技术人员,期望帮大家深度理解大数据SQL优化原理,掌握SQL优化的落地实践 方法 ,从而真正“玩转”大数据SQL优化技术,根据实际问题和需求 设计 出有针对性的 提升 SQL性能的解决方案。
本书共分为4篇,包括10章。
认知 篇(第1章)主要面向初学者阐述为什么大数据计算或存储引擎发展至今最终选择SQL作为统一查询 语言 的原因及利弊,大数据SQL从业者目前面临的主要问题,以及调优的两个根本目标。
原理篇(第2章)以 深入浅出 的方式解读SQL的本质。为了降低读者理解的门槛,本篇还以Hive、Spark和Flink这三个主流的引擎为例,从源码的角度探索SQL执行背后的 秘密 。
实践篇(第3~9章)首先深入解读引擎查询优化器的两大优化 策略 ——基于规则的优化和基于代价的优化的实现原理、示例和局限性,然后以Hive、Spark、Flink等主流引擎为蓝本,探索SQL优化(包括结构与参数调优、子查询优化、连接优化、聚合优化)的解决思路和 方法论 ,并给出作者多年总结的一些“坑”。
案例篇(第10章)以实践篇的各种真实需求调优历程为基础,以点带面,以小明大,分享 电商 、 金融 、 银行 这三个典型行业的典型公司大数据SQL调优案例,还给出了内容平台数仓、查询高可用、实时性数仓等业务场景的解决方案。 夸克网盘下载(文件解压密码 12345 6 )
百度网盘下载 提取码: 7904
迅雷网盘下载 夸克资源精选合集
评论列表
发表评论