本书的主角是在大数据时代应运而生的数据处理与分析利器 —— Spark。你将通过丰富的示例学习如何使用Spark的结构化数据API,利用Spark SQL进行交互式查询,掌握Spark应用的优化之道,用Spark和Delta Lake等开源工具构建可靠的数据湖,并用MLlib库实现机器学习流水线。随着Spark从2.x版本升级到3.0版本,本书第2版做了全面的更新,以体现Spark生态系统在机器学习、流处理技术等方面的发展,另新增一章详解Spark 3.0引入的新特性。
发布时间:2024-10-16浏览次数:0文章来源:图书馆
本书的主角是在大数据时代应运而生的数据处理与分析利器 —— Spark。你将通过丰富的示例学习如何使用Spark的结构化数据API,利用Spark SQL进行交互式查询,掌握Spark应用的优化之道,用Spark和Delta Lake等开源工具构建可靠的数据湖,并用MLlib库实现机器学习流水线。随着Spark从2.x版本升级到3.0版本,本书第2版做了全面的更新,以体现Spark生态系统在机器学习、流处理技术等方面的发展,另新增一章详解Spark 3.0引入的新特性。
仙林校区:南京市仙林大学城文苑路3号
邮编:210023
福建路校区:南京市鼓楼区铁路北街128号
邮编:210003
桥头校区:江苏省镇江市桥头
邮编:212413
Copyright 2024 南京财经大学图书馆 All rights reserved