弄清Pytorch显存的分配机制

脚本专栏 2025/9/24 佚名

3 2 1

　　对于显存不充足的炼丹研究者来说，弄清楚Pytorch显存的分配机制是很有必要的。下面直接通过实验来推出Pytorch显存的分配过程。

　　实验实验代码如下：

import torch 
from torch import cuda 

x = torch.zeros([3,1024,1024,256],requires_grad=True,device='cuda') 
print("1", cuda.memory_allocated()/1024**2) 
y = 5 * x 
print("2", cuda.memory_allocated()/1024**2) 
torch.mean(y).backward()   
print("3", cuda.memory_allocated()/1024**2)  
print(cuda.memory_summary())

输出如下：

　　代码首先分配3GB的显存创建变量x，然后计算y，再用y进行反向传播。可以看到，创建x后与计算y后分别占显存3GB与6GB，这是合理的。另外，后面通过backward()，计算出x.grad，占存与x一致，所以最终一共占有显存9GB，这也是合理的。但是，输出显示了显存的峰值为12GB，这多出的3GB是怎么来的呢？首先画出计算图：

下面通过列表的形式来模拟Pytorch在运算时分配显存的过程：

　　如上所示，由于需要保存反向传播以前所有前向传播的中间变量，所以有了12GB的峰值占存。

　　我们可以不存储计算图中的非叶子结点，达到节省显存的目的，即可以把上面的代码中的y=5*x与mean(y)写成一步：

import torch 
from torch import cuda 

x = torch.zeros([3,1024,1024,256],requires_grad=True,device='cuda') 
print("1", cuda.memory_allocated()/1024**2)  
torch.mean(5*x).backward()   
print("2", cuda.memory_allocated()/1024**2)  
print(cuda.memory_summary())

　占显存量减少了3GB：

以上就是弄清Pytorch显存的分配机制的详细内容，更多关于Pytorch 显存分配的资料请关注其它相关文章！

Pytorch,显存分配,Pytorch,显存

标签：

Pytorch,显存分配,Pytorch,显存

免责声明：本站文章均来自网站采集或用户投稿，网站不提供任何软件下载或自行开发的软件！如有用户或公司发现本站内容信息存在侵权行为，请邮件告知！ 858582#qq.com

内蒙古资源网 Copyright www.nmgbbs.com

评论“弄清Pytorch显存的分配机制”

弄清Pytorch显存的分配机制

暂无“弄清Pytorch显存的分配机制”评论...

www.nmgbbs.com 内蒙古资源网

129,905影音资源

244,626技术资源

111,817软件资源

578,645站长资源

弄清Pytorch显存的分配机制

Pytorch,显存分配,Pytorch,显存

python opencv图像处理(素描、怀旧、光照、流年、滤镜原理及实现)

python 实现的IP 存活扫描脚本

评论“弄清Pytorch显存的分配机制”

友情链接

弄清Pytorch显存的分配机制

Pytorch,显存分配,Pytorch,显存

python opencv图像处理(素描、怀旧、光照、流年、滤镜 原理及实现)

python 实现的IP 存活扫描脚本

评论“弄清Pytorch显存的分配机制”

友情链接

python opencv图像处理(素描、怀旧、光照、流年、滤镜原理及实现)