Mac MPS介绍
使用 Apple 的 Metal Performance Shaders (MPS) 作为 PyTorch 的后端来启用加速 GPU 训练。 MPS 后端扩展了 PyTorch 框架,提供了在 Mac 上设置和运行操作的脚本和功能。 MPS 使用针对每个 Metal GPU 系列的独特特性进行微调的内核来优化计算性能。 新设备将机器学习计算图和基元映射到 MPS 提供的 MPS Graph 框架和优化内核上。
随着PyTorch v1.12版本的发布,开发人员和研究人员可以利用 Apple 的GPU进行明显更快的模型训练,在部分模型的训练上往往比Mac 的 CPU有着数倍的提升。
- (Mac M1芯片为了追求高性能和节能,在底层设计上使用的是一种叫做arm架构的精简指令集,不同于Intel等常用CPU芯片采用的x86架构完整指令集。所以有些基于x86指令集开发的软件不能直接在Mac M1芯片电脑上使用。)
- 需要注意的是,使用Mac M1芯片加速 pytorch 不需要安装 cuda后端,因为cuda是适配nvidia的GPU的,Mac M1芯片中的GPU适配的加速后端是mps,在Mac对应操作系统中已经具备,无需单独安装。只需要安装适配的pytorch即可。
判断 Mac mps 是否可以正常运行
python -c "import torch;print(torch.backends.mps.is_built())"
import torch
import math
print(torch.backends.mps.is_available())
# True
print(torch.backends.mps.is_built())
# True
Mac 指定 mps 进行推理示例
import torch
model = torch.nn.Linear(5,1).to('mps')
x = torch.randn(5).to('mps')
y = model(x)
print(y.shape)
- 如上代码所示,该代码首先定义了一个最简单5x1的线性模形,并告诉Pytorch它在Mac M1的GPU上运行;
- 然后给该模形创建一个输入,该输入也是在GPU上,是一个5x5的tensor,最后输出运算结果的维度。
- 如果上面的代码可以正常运行,说明你Mac上的GPU确实可以正常工作。
- 本章节参考博文: https://avdancedu.com/eaff035c/
Mac M1 GPU 训练 相比 CPU 速度提升对比
Apple M1 Ultra, 20-core CPU, 64-core GPU 128GB of RAM, and 2TB SSD. Tested with macOS Monterey 12.3, prerelease PyTorch 1.12, ResNet50 (batch size=128), HuggingFace BERT (batch size=64), and VGG16 (batch size=64).
📙 开心搬砖每一天
- 🍊 深度学习模型训练推理——基础环境搭建推荐博文查阅顺序【基础安装—认真帮大家整理了】
- 🍊 计算机视觉:硕博士,交流、敬请查阅
- 🍊 点赞 👍 收藏 ⭐留言 📝 都是博主坚持写作、更新高质量博文的最大动力!