我尝试的一种选择是腌制vocab,并使用Extrafiles arg保存

import torch
import pickle

class Vocab(object):
    pass

vocab = Vocab()
pickle.dump(open('path/to/vocab.pkl','w'))

m = torch.jit.ScriptModule()

## I am not sure about the usage of this arg, the docs didn't help me
extra_files = torch._C.ExtraFilesMap()
extra_files['vocab.pkl'] = 'path/to/vocab.pkl'
# I also tried  pickle.dumps(vocab), and directly vocab

torch.jit.save(m, 'scriptmodule.pt', _extra_files=extra_files)

## Load with extra files.
files = {'vocab.pkl': ''}
torch.jit.load('scriptmodule.pt', _extra_files = files)


这给

TypeError: import_ir_module(): incompatible function arguments. The following argument types are supported:
    1. (arg0: Callable[[List[str]], torch._C.ScriptModule], arg1: str, arg2: object, arg3: torch._C.ExtraFilesMap) -> None


另一个选择显然是单独加载泡菜,但我一直在寻找单个文件的选择。

如果可以仅将vocab添加到火炬脚本中,那将是一件很不错的事情……也很高兴知道是否有某些我不知道的不这样做的原因。

最佳答案

我认为torch.jit.load的文档不正确。您需要创建一个ExtraFilesmap()对象来加载保存的文件。

以下是我如何工作的示例:
步骤1:保存模型

extra_files = torch._C.ExtraFilesMap()
extra_files['foo.txt'] = 'bar'
traced_script_module.save(serialized_model_path, _extra_files=extra_files)


步骤2:载入模型

files = torch._C.ExtraFilesMap()
files['foo.txt'] = ''
loaded_model = torch.jit.load(serialized_model_path, _extra_files=files)
print(files)

10-05 22:58