假设在PyTorch中,我的model1
和model2
具有相同的体系结构。他们接受了相同数据的进一步培训,或者一个模型是其他模型的早期版本,但在技术上与该问题无关。现在,我想将model
的权重设置为model1
和model2
的权重的平均值。我将如何在PyTorch中做到这一点?
最佳答案
beta = 0.5 #The interpolation parameter
params1 = model1.named_parameters()
params2 = model2.named_parameters()
dict_params2 = dict(params2)
for name1, param1 in params1:
if name1 in dict_params2:
dict_params2[name1].data.copy_(beta*param1.data + (1-beta)*dict_params2[name1].data)
model.load_state_dict(dict_params2)
取自pytorch forums。您可以获取参数,进行转换并将其加载回去,但要确保尺寸匹配。
另外,我真的很想知道您对这些发现的了解。
关于python - 如何取两个网络权重的平均值?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/48560227/