DominantResourceCalculator

DominantResourceCalculator

我正在使用Hadoop-2.4.0,我的系统配置是24核,96 GB RAM。

我正在使用以下配置

mapreduce.map.cpu.vcores=1
yarn.nodemanager.resource.cpu-vcores=10
yarn.scheduler.minimum-allocation-vcores=1
yarn.scheduler.maximum-allocation-vcores=4
yarn.app.mapreduce.am.resource.cpu-vcores=1

yarn.nodemanager.resource.memory-mb=88064
mapreduce.map.memory.mb=3072
mapreduce.map.java.opts=-Xmx2048m

容量调度程序配置
queue.default.capacity=50
queue.default.maximum_capacity=100
yarn.scheduler.capacity.root.default.user-limit-factor=2

通过上述配置,我希望yarn每个节点启动的映射器不会超过10个,但是它正在每个节点启动28个映射器。
难道我做错了什么??

最佳答案

YARN运行的容器多于分配的内核,因为默认情况下使用DefaultResourceCalculator。它仅考虑内存。

public int computeAvailableContainers(Resource available, Resource required) {
// Only consider memory
return available.getMemory() / required.getMemory();
  }

使用DominantResourceCalculator,它同时使用cpu和内存。

在Capacity-scheduler.xml中的config下面设置
yarn.scheduler.capacity.resource-calculator=org.apache.hadoop.yarn.util.resource.DominantResourceCalculator

有关DominantResourceCalculator的更多信息

10-06 15:03