

《Hadoop生态系统》本书每一章都介绍了不同的主题(例如核 心 技术 或 数据 传 输),并且解释了为什么特定组件适用或不适用特定的需求。对于数据处理来说,使用Hadoop是一个全新的挑战,但如果有了这本便利的参考书,你将很容易领会使用Hadoop的精妙所在。
主要包括如下主题:核心技术,Hadoop 分布式 文件系统(HDFS)、MapRedu c e、YARN和Spark。 数据库 和数据 管理 ,Cassandra、HBase、MongoDB和Hive。序列化,Avro、JSON和Parquet。管理和监视,Puppet、Chef、Zookeeper和Oozie。分析辅助,Pig、Mahout和MLLib。数据传输,Scoop、Flume、distcp和Storm。安全、访问控制和审计,Sentry、Kerberos和Knox。云计算和虚拟化,Seren get i、Docker和Whirr。
作者简介:
评论列表
发表评论