大数据分析与内存计算-第一章 Spark简介与运行原理


大数据分析与内存计算-第一章 Spark简介与运行原理

Spark是什么?

image-20220505232356261

Spark的特点

迅速

image-20220505232533845

通用

image-20220505232947360

易用

image-20220505233113800

支持多种资源管理器

image-20220505233206159

Spark与Hadoop的区别与联系

image-20220505233554318 image-20220505233634896

Spark相对于Hadoop MapReduce的优势

image-20220505233848845 image-20220505234056258

误区

image-20220505234331876
1
2
3
1.计算都是基于内存,spark只是计算的中间结果缓存在内存
2.任务量的不同也可能出现相反的速度
3.Hadoop从设计之初就是基于可拓展的,他也可以采用别的计算引擎

Spark的用途

image-20220505234653714

image-20220505234821298

Spark的生态系统

Spark的架构与原理

Spark 2.x新特性


本文标题:大数据分析与内存计算-第一章 Spark简介与运行原理

文章作者:TTYONG

发布时间:2022年05月04日 - 17:05

最后更新:2022年05月05日 - 23:05

原始链接:http://tianyong.fun/%E5%A4%A7%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90%E4%B8%8E%E5%86%85%E5%AD%98%E8%AE%A1%E7%AE%97-%E7%AC%AC%E4%B8%80%E7%AB%A0-Spark%E7%AE%80%E4%BB%8B%E4%B8%8E%E8%BF%90%E8%A1%8C%E5%8E%9F%E7%90%86.html

许可协议: 转载请保留原文链接及作者。

多少都是爱
0%