为 Transformer 模型绘制训练和验证损失曲线 作者 Stefania Cristina 于 2023年1月6日 在 Attention 7 我们之前已经了解了如何训练用于神经机器翻译的 Transformer 模型。在继续推断训练模型之前,让我们先探讨一下如何稍微修改训练代码,以便能够绘制在学习过程中生成的训练和验证损失曲线。训练和 [...] 继续阅读