本文探討了一種非傳統(tǒng)的訓(xùn)練方法,利用交替方向方法(alternating direction methods)和Bergman 迭代方法無梯度下降步驟的訓(xùn)練網(wǎng)絡(luò)。該方法減少了網(wǎng)絡(luò)訓(xùn)練問題,將其簡化成了一系列最小限度的子步驟,每個子步驟都能閉式全局解決。該方法之所以有益,是因為它繞過了很多注意事項,這些注意事項會造成梯度方法在高度非凸問題上進展緩慢。該方法在分布式環(huán)境中展示了強大的擴展能力,即便在分散成千萬個核的狀況下也能產(chǎn)生線性加速度。