我对TensorFlow不熟悉。我正在使用通用句子编码器进行文本相似性。我想用我自己的语料库来微调使用。
我现在有:

module_url = "https://tfhub.dev/google/universal-sentence-encoder/2"
embed = hub.Module(module_url, trainable=True)

根据here,设置trainable=True将“将变量公开为可训练的”。然而,我不知道这些可训练的变量是什么,也不知道如何使用它们来微调我自己的语料库。
请,任何指导或指示将不胜感激。

最佳答案

对一个预先训练的模型进行微调,就是让它的权重在下游的训练任务中得到更新。
所以你有两个选择:
trainable=False
此选项将更快地训练,但预训练的模型权重将永远不会更新。一个句子嵌入在你自己的训练前后看起来是一样的。只有您自己的模型层才会通过训练更改其权重。
trainable=True
这会增加训练循环的计算负担,但会允许根据任务和训练数据更新embedder的权重。这可能会得到更精确的最终模型

关于python - 微调通用句子编码器,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/56923147/

10-12 18:03