欢迎访问安徽瀚文图书有限责任公司官网!

推购系统

Python和PySpark数据分析

ISBN:9787302645368
价格:118
副题名:
分辑号:
分辑名:
主要著作者:(加)乔纳森·里乌(JonathanRioux)著
发行地:北京
出版社:清华大学出版社
出版日期:2023.1
页码:268页
开本:26cm
丛书项:数据科学与大数据技术
一般性附注:
读者对象:软件工程技术人员
主题词:软件工具
中图法分类:TP311.561
装帧:
版次:
图表:
语种:chi
《Python和PySpark数据分析》是一本精心设计的教程,可帮助读者使用PySpark交付任何规模的数据驱动应用程序。这本清晰的实践指南展示了如何使用来自任何来源的数据(从基于Hadoop的集群到Excel工作表)扩大多台机器的处理能力。通过阅读本书,读者将学习如何将大型分析任务分解为可管理的块,以及如何为您的独特需求选择和使用最佳PySpark数据抽象。完成后,您将能够编写和运行速度极快的PySpark程序,这些程序可扩展、操作高效且易于调试。本书中将介绍如何打包你的PySpark代码,管理跨多台机