论文信息 - The Law of Parsimony in Gradient Descent for Learning Deep Linear Networks - 字舞流文

The Law of Parsimony in Gradient Descent for Learning Deep Linear Networks

Qing Qu | Wei Hu | L. Balzano | P. Wang | Peng Wang | Can Yaras | Zhihui Zhu | Laura Balzano