登录    |    注册

Adadelta Adadelta

2020-09-09 16:43:21

是基于梯度下降的学习算法,可以随时间调整每个参数的学习率,它比超参数(hyperparameter)更敏感而且可能会降低学习率。Adadelta 类似于 rmsprop,而且可被用来替代 vanilla SGD。