【电子书分享】Learning PySpark下载,包含pdf、epub格式

iteblog 过往记忆大数据

图书简介


本书将向您展示如何利用Python的强大功能并将其用于Spark生态系统中。您将首先了解Spark 2.0的架构以及如何为Spark设置Python环境。通过本书,你将会使用Python操作RDD、DataFrames、MLlib以及GraphFrames等;在本书结束时,您将对Spark Python API有了全局的了解,并且学习到如何使用它来构建数据密集型应用程序。通过本书你将学习到以下的知识:

  • Learn about Apache Spark and the Spark 2.0 architecture
  • Build and interact with Spark DataFrames using Spark SQL
  • Learn how to solve graph and deep learning problems using GraphFrames and TensorFrames respectively
  • Read, transform, and understand data and use it to train machine learning models
  • Build machine learning models with MLlib and ML
  • Learn how to submit your applications programmatically using spark-submit
  • Deploy locally built applications to a cluster
    本书由Tomasz Drabas所著,全书共380页;Packt Publishing出版社于2017年02月出版。

本书章节


1 UNDERSTANDING SPARK
2 RESILIENT DISTRIBUTED DATASETS
3 DATAFRAMES
4 PREPARE DATA FOR MODELING
5 INTRODUCING MLLIB
6 INTRODUCING THE ML PACKAGE
7 GRAPHFRAMES
8 TENSORFRAMES
9 POLYGLOT PERSISTENCE WITH BLAZE
10 STRUCTURED STREAMING
11 PACKAGING SPARK APPLICATIONS

获取下载地址


关注本微信公众号 iteblog_hadoop 并回复 Learning_PySpark 获取本书的下载地址。

©著作权归作者所有:来自51CTO博客作者mob604756f47778的原创作品,如需转载,请注明出处,否则将追究法律责任

更多相关文章

  1. 全面的区域科学研究数据获取途径汇总
  2. python中四种获取文件后缀名的方法
  3. php get_class_methods('myclass') 获取类里面的方法
  4. Gateway网关过滤之后获取不到 HttpServletRequest
  5. Python爬取小说
  6. 「公众号吸粉神级插件」实现网站下载文件需要公众号获取验证码
  7. 万能cmp程序, 有了他, 建议把其他程序全删掉!
  8. 专栏 | 使用zabbix-agent2自定义插件获取https证书过期时间
  9. web前端怎么获取cookie?新手前端开发者需了解

随机推荐

  1. 解决FCKEditor编辑器在浏览器返回时显示h
  2. 关于struts漏洞之---/struts/webconsole.
  3. 图像未加载到HTML页面的jQuery load()中
  4. 如何在HTML标记上打印/显示动态值?
  5. css+html实现自适应宽度的菜单学习
  6. 用HTML做的简单的个人简历
  7. 具有不间断空格的呈现字符串
  8. 经常使用的20个css高级技巧(下)
  9. 创建mailto超链接,该超链接将在Outlook中
  10. 如何根据容器更改元素的宽度?