4.6.4 自适应实时评估算法(Adam [Adaptive Moment Estimation])
自适应实时评估算法(Adam [Adaptive Moment Estimation]),相当于RMSprop 和 Momentum 结合的一种算法,标准Adam 可以认为是 一阶AdaDelta 的动量改进版。
迭代公式:
gt,imt,ivt,iΔθt,iθt+1,i=∇θJ(θi)=β1mt−1,i+(1−β1)gt,i=β2 vt−1,i+(1−β2)gt,i2=−√v^t,i+ϵηm^t,i=θt,i+Δθt,i=θt,i−√v^t,i+ϵηm^t,i
其中 m^t 、 v^t 是我们为了防止 m 、 v 被初始化时为 0 导致向 0 偏移而做的 偏差校正值,有:
m^tv^t=1−β1mt=1−β2vt
取 经验系数 β1 、 β1 ,Hinton建议 β1=0.9 ,β2=0.999
取 η 防爆因子,建议 ϵ=10e-8 避免干扰运算
Adam 很好的结合了前辈们的各种优化处理手段,成为了集大成之优化函数。因此,Adam是被经常使用的,现代主流优化函数之一。