《Python大数据处理库PySpark实战》汪明 pdf电子书[49MB]

编程开发 龙森 2026-05-13 112 0 // 自建的夸克api
《Python大数据处理库PySpark实战》汪明 pdf电子书[49MB]下载

书籍 信息

《Python大数据处理库PySpark实战》pdf电子书下载
《Python大数据处理库PySpark实战》pdf百度网盘
《Python大数据处理库PySpark实战》pdf百度网盘
《Python大数据处理库PySpark实战》pdf百度网盘
《Python大数据处理库PySpark实战》pdf百度网盘


 

我国提出新基建概念,要加快大 数据 中心、 人工智能 等新型基础设施的建设进度,这无疑需要 更多大数据 人才 。PySpark可以对大数据进行 分布式 处理,降低大数据 学习 门槛,本书正是一本PySpark 入门 教材 ,适合有一定Python基础的读者学习使用。

本书分为7章,第1章介绍大数据的基本概念、常用的大 数据分析 工具;第2章介绍Spark作为大数据处理的特点和 算法 ;第3章介绍Spark实战 环境 的搭建,涉及Windows和Linux 操作系统 ;第4章介绍如何灵活应用PySpark对数据进行操作;第5章介绍PySpark ETL处理,涉及PySpark读取数据、对数据进行 统计 分析等数据处理相关内容;第6章介绍PySpark如何利用MLlib库进行分布式 机器学习 (Titanic幸存者预测);第7章介绍一个PySpark和Kafka结合的实时 项目

本书内容全面、示例丰富,可作为广大PySpark入门读者必备的参考书,同时能作为大中专院校师生的教学参考书,也可作为高等院校 计算机 及相关专业的大数据 技术 教材使用。


作者简介:
汪明,硕士,毕业于 中国 矿业 大学 ,徐州 软件 协会副理事长,某 创业 公司合伙人。从事软件行业十余年,发表论文数十篇。著有 图书 《TypeScript实战》《Go并发 编程 实战》。

目录:
第1章 大数据时代 1
第2章 大数据的 瑞士 军刀——Spark 15
第3章 Spark实战环境设定 43
第4章 活用PySpark 119
第5章 PySpark ETL 实战 249
第6章 PySpark分布式机器学习 276
第7章 实战:PySpark Kafka实时项目 301

书籍 下载

夸克网盘下载(文件解压密码 123456 )


百度网盘下载   提取码: 2781


迅雷网盘下载
网盘资源链接限时分享

夸克资源精选合集