Spark快速大数据分析

发布时间：2024-10-16浏览次数：294文章来源：图书馆

Spark快速大数据分析

（美）朱尔斯·S. 达米吉、布鲁克·韦尼希、（印）泰瑟加塔·达斯等著，王道远译
索书号：TP274/602

本书的主角是在大数据时代应运而生的数据处理与分析利器 —— Spark。你将通过丰富的示例学习如何使用Spark的结构化数据API，利用Spark SQL进行交互式查询，掌握Spark应用的优化之道，用Spark和Delta Lake等开源工具构建可靠的数据湖，并用MLlib库实现机器学习流水线。随着Spark从2.x版本升级到3.0版本，本书第2版做了全面的更新，以体现Spark生态系统在机器学习、流处理技术等方面的发展，另新增一章详解Spark 3.0引入的新特性。

2023年

Spark快速大数据分析