英语 共有1条记录
页码:1/1    每页显示:10 记录 跳转:
作者:"(加) 乔纳森·里乌, Jonathan Rioux, 殷海英" 出版年:"20230101"
  • 正在加载图片,请稍后......

    Python和PySpark数据分析:(加) 乔纳森·里乌, Jonathan Rioux, 殷海英

    作者:(加) 乔纳森·里乌, Jonathan Rioux, 殷海英 出版社:清华大学出版社 出版时间:20230101 ISBN:978-7-302-64536-8
    索书号:TP312PY/145 分类号:TP312PY 页数:XIII, 402页 价格:CNY118.00
    丛书:数据科学与大数据技术
    复本数: 在馆数:
    累借天数: 累借次数:
    本书是一本精心设计的教程, 可帮助读者使用PySpark交付任何规模的数据驱动应用程序。这本清晰的实践指南展示了如何使用来自任何来源的数据 (从基于Hadoop的集群到Excel工作表) 扩大多台机器的处理能力。通过阅读本书, 读者将学习如何将大型分析任务分解为可管理的块, 以及如何为您的独特需求选择和使用最佳PySpark数据抽象。完成后, 您将能够编写和运行速度极快的PySpark程序, 这些程序可扩展、操作高效且易于调试。本书中将介绍如何打包你的PySpark代码, 管理跨多台机器扩展的数据, 在PySpark中重写Pandas、RSAS作业, 排查常见数据流水线问题, 并创建可靠的长期工作。
    详细信息
    索书号 展开
缩小检索范围
英语 共有1条记录
页码:1/1    每页显示:10 记录 跳转: