简单说一下hadoop和spark的shuffle过程-滴滴篇-面试篇-json在线工具-json在线解析-sjson.cn

admin 2021-07-07 12:10 0次 0 加入收藏

摘要： 简单说一下hadoop和spark的shuffle过程

问题：**简单说一下hadoop和spark的shuffle过程**

出题人：京东出题专家：阿昀/京东数据中台

参考答案：

Hadoop：map端保存分片数据，通过网络收集到reduce端。

Spark：spark的shuffle实在DAGSchedular划分Stage的时候产生的，TaskSchedular要分发Stage到各个worker的executor。减少shuffle可以提高性能。

滴滴面试题京东面试题

上一篇：没有了

下一篇：没有了

0条评论

图文资讯