为什么Hadoop集群中机器台数多反而执行速度慢？为什么Hadoop集群中机器台数多反而执行速度慢？ | 学步园

返回顶部
查看留言
转到底部

现在的位置: 首页 > 综合 > 正文

为什么Hadoop集群中机器台数多反而执行速度慢？为什么Hadoop集群中机器台数多反而执行速度慢？

2019年04月30日 ⁄ 综合 ⁄ 共 601字 ⁄ 字号小中大 ⁄ 评论关闭

为什么Hadoop集群中机器台数多反而执行速度慢？

分类： hadoop2012-12-16
23:24 119人阅读评论(0) 收藏举报

这里我对这个现象给出解释。由于水平有限，发现错误，请及时留言，或站内和我联系。

这里假设集群中有slave1，slave2，slave3三个节点，其中slave3工作效率低。

一共有6个任务，需要去做，slave1和slave2执行一个任务是1分钟，slave3执行一个任务是2分钟。有一个前提是每个slave完成自身的任务才回去推测执行。

如果让slave1和slave2去做，则需要3分钟，分析如下：

slave1 slave2

3 3

3*1 3*1

并行执行总时间就是单个slave的执行时间3；

那么三台同时去做需要4分钟。

slave1 slave2 slave3

2 2 2

这里slave1和slave2都完成了自身的任务，已经花费了2分钟，剩下最后一个任务考虑到数据的本地性也分给了slave3，slave3执行时间超过一分钟时，jobtracker会觉得slave3可能没有能力完成分配给他的任务，假设在slave1上推测执行，结果slave3结束了，就将运行在slave1上的推测执行任务kill掉，最后执行时间是4秒。

因为在推测执行的时候会两个推测执行的任务会同时完成。

返回

【上篇】hadoop 性能调优重要参数设置技巧 hadoop 性能调优重要参数设置技巧
【下篇】spark 并行计算模型

作者: carpinteyroakm

该日志由 carpinteyroakm 于5年前发表在综合分类下，最后更新于 2019年04月30日.
转载请注明: 为什么Hadoop集群中机器台数多反而执行速度慢？为什么Hadoop集群中机器台数多反而执行速度慢？ | 学步园 +复制链接

抱歉!评论已关闭.

返回首页

Copyright © 2013-2018 学步园保留所有权利.
软文销售 QQ客服：2265327166

点击这里给我发消息

（其他合作也可洽谈）