一直疑惑一个问题:对于最小二塖法为什么不直接求导让导数求极值步骤为“0”,直接求极值呢
因为实际情况有些是不可行的,比如有时候求解这样的方程非常复杂。
这里举个例子:Y=X^2 使用通过梯度最小二乘法计算极值:
死循环所以α 需要尝试从0.0001 到 1 去试验学习率