Transformer 模型推理 作者 Stefania Cristina 于 2023年1月6日 发布在 注意力 17 我们已经了解了如何在英语和德语句子对的数据集上训练 Transformer 模型,以及如何绘制训练和验证损失曲线来诊断模型的学习性能,并决定在哪个 epoch 上对训练好的模型进行推理。现在我们可以开始对[…]进行推理。 继续阅读