我最近尝试在 Google Cloud Platform (GCP) 上创建一个实例组,在 n1-standard-1
区域中有 50 个 us-east1-b
实例,每个实例都有 P100
GPU。我在该区域申请并获得了 200
P100 GPU 的批准。我用于该区域和全局的 CPU
、 IP addresses
和 Routes
都符合此页面上列出的配额。
然而,现在,我只创建了这 50 个实例中的 21 个,其余的带有黄色危险标志和伴随的警告消息:Instance 'instance-group-1-<name>' creation failed: The zone 'projects/<project>/zones/us-east1-b' does not have enough resources available to fulfill the request. '(resource type:compute)'.
在配额页面上是否有任何地方可以获取有关我忘记询问更多 compute
配额的确切信息?不幸的是,错误消息不是很具有描述性。
注意:我怀疑这可能是对超过 Compute Engine API 查询限制访问每 2000
秒最多 100
查询的引用。 7 day peak usage
列确实显示我在高峰时间超过了它。但是,我的 Current Usage
每 70
秒少于 1000
查询。当我查看随时间绘制的计算引擎查询使用情况时,看起来我没有超过 2000
速率限制几个小时。但是,实例组仍然无法完全填充到所有 50
实例。
最佳答案
这是一个典型的错误,这意味着在某个时间点,即使您有足够的配额,“us-east1-b”中的资源也不足以扩展您的实例组。您有两种选择:
1- 稍后再试
2- 在另一个区域/区域请求 GPU 并在那里部署您的 IG。
Google 还建议将您的工作负载分布在多个区域和专区。
有关更多信息,请参阅 this 和 this 。
关于google-cloud-platform - GCP : Instance creation failed,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/55378731/