传统算法是如何在销补调计划中发挥作用的

摘要

无论是简单的FC、CNN、RNN、LSTM模型,还是当下最火的大模型依赖的Transformer模型,都是基于梯度下降和反向传播进行训练。没有人能证明为何通过这样的训练能让模型中参数自动自洽,我们只是知道通过这样去构造模型确实行之有效。

欢迎在评论区写下你对这篇文章的看法。

评论

Home - Wiki
Copyright © 2011-2024 iteam. Current version is 2.129.0. UTC+08:00, 2024-07-04 14:22
浙ICP备14020137号-1 $Map of visitor$