

《Spark 大数据 处理:技术、应用与性能优化》根据最新技术版本,系统、全面、详细讲解Spark的各项功能使用、原理机制、技术细节、应用 方法 、性能优化,以及BDAS生态系统的相关技术。
作为一个基于内存计算的大数据并行计算框架,Spark不仅很好地解决了数据的实时处理问题,而且保证了高容错性和高可伸缩性。具体来讲,它有如下优势:
打造全栈多计算范式的高效数据流水线
轻量级快速处理
易于使用,支持多 语言
与HDFS等存储层兼容
社区活跃度高
……
Spark已经在 全球 范围内广泛使用,无论是Intel、Yahoo!、Twitter、 阿里巴巴 、百度、腾讯等国际 互联网 巨头,还是一些尚处于 成长 期的小公司,都在使用Spark。本书作者结合自己在 微软 和IBM实践Spark的经历和经验,编写了这本书。站着初学者的角度,不仅系统、全面地讲解了Spark的各项功能及其使用方法,而且较深入地探讨了Spark的 工作 机制、运行原理以及BDAS生态系统中的其他技术,同时还有一些可供操作的 案例 ,能让没有经验的读者迅速掌握Spark。更为重要的是,本书还对Spark的性能优化进行了探讨。
第1章 Spark简介 1

评论列表
发表评论