2023年9月20日

混合精度训练（AMP）

9月 20, 2023

Uncategorized

论文链接简介先说结论，使用精度低于32位浮点的数字格式有很多好处：1. 它们需要更少的内存，所以可以训练和…
防止深度神经网络过度拟合

9月 20, 2023

Uncategorized

作者 Piotr Skalski 原文链接 Preventing Deep Neural Network fr…
SGD 和 Adam 的比较

9月 20, 2023

Uncategorized

SGD SGD，即随机梯度下降（Stochastic Gradient Descent），是深度学习中最常用的…

通过 WordPress.com 设计一个这样的站点

从这里开始