我最近尝试在 Google Cloud Platform (GCP) 上创建一个实例组,在 n1-standard-1 区域中有 50 个 us-east1-b 实例,每个实例都有 P100 GPU。我在该区域申请并获得了 200 P100 GPU 的批准。我用于该区域和全局的 CPUIP addressesRoutes 都符合此页面上列出的配额。

然而,现在,我只创建了这 50 个实例中的 21 个,其余的带有黄色危险标志和伴随的警告消息:Instance 'instance-group-1-<name>' creation failed: The zone 'projects/<project>/zones/us-east1-b' does not have enough resources available to fulfill the request. '(resource type:compute)'.
在配额页面上是否有任何地方可以获取有关我忘记询问更多 compute 配额的确切信息?不幸的是,错误消息不是很具有描述性。

注意:我怀疑这可能是对超过 Compute Engine API 查询限制访问每 2000 秒最多 100 查询的引用。 7 day peak usage 列确实显示我在高峰时间超过了它。但是,我的 Current Usage70 秒少于 1000 查询。当我查看随时间绘制的计算引擎查询使用情况时,看起来我没有超过 2000 速率限制几个小时。但是,实例组仍然无法完全填充到所有 50 实例。

最佳答案

这是一个典型的错误,这意味着在某个时间点,即使您有足够的配额,“us-east1-b”中的资源也不足以扩展您的实例组。您有两种选择:

1- 稍后再试
2- 在另一个区域/区域请求 GPU 并在那里部署您的 IG。

Google 还建议将您的工作负载分布在多个区域和专区。

有关更多信息,请参阅 thisthis

关于google-cloud-platform - GCP : Instance creation failed,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/55378731/

10-16 17:56