书目查询

返回检索首页

每页显示　排序选项排序方式

T. 共有1条记录共耗时[0.000]秒

页码：1/1 每页显示：10 记录跳转：

作者:"(美) John T. Wolohan, 张若飞"

深入大型数据集: 并行与分布化Python代码:(美) John T. Wolohan, 张若飞

作者：(美) John T. Wolohan, 张若飞 出版社：电子工业出版社 出版时间：20210101 ISBN：978-7-121-40368-2
索书号：TP311.561/709 分类号：TP311.561 页数：xx, 300页 价格：CNY99.00

复本数：在馆数：
累借天数：累借次数：

本书共分3部分, 主要介绍如何使用Python语言来处理大型数据集。第1部分介绍map和reduce编程风格, 以及Python中基础的map和reduce函数, 并介绍如何将对象持久化, 通过惰性函数和并行函数来加快大型数据集的处理速度。第2部分介绍Hadoop和Spark框架, 以及如何使用mrjob库来编写Hadoop作业, 如何实现PageRank算法, 如何使用Spark来实现决策树和随机森林的机器学习模型。第3部分重点介绍云计算和云存储的基础知识, 包括如何通过boto3的Python库将文件上传到AWS S3服务, 以及如何在AWS的EMR集群中运行分布式的Hadoop和Spark作业。

详细信息
索书号展开

缩小检索范围

文献类型
- 中文图书(1)
出版社
作者
出版年

T. 共有1条记录共耗时[0.000]秒

页码：1/1 每页显示：10 记录跳转：