检查神经网络学习过程?

CS231n课程笔记翻译:神经网络笔记3(上) - 知乎 (zhihu.com)

奇怪的东西增加了?

梯度检查

把解析梯度和数值计算梯度进行比较,需要注意:

使用中心化公式: 使用 df(x)dx=f(x+h)f(xh)2h 而不是 df(x)dx=f(x+h)f(x)h

使用相对误差来比较”:

使用双精度

保持在浮点数的有效范围:例如,不要让绝对值小于1e-10。比较理想的是让绝对值在 1.0 的数量级上