强化学习在之家图像理解中的应用

摘要

本文首先介绍了强化学习的基本概念,并着重梳理了一类模型无关的强化学习,即策略梯度算法。随后本文对其中的两种算法,进行了重点地分析和比较。最后,本文展示了基本策略梯度在之家业务中的一些应用,并讨论了该方法这些场景下的鲁棒性。

欢迎在评论区写下你对这篇文章的看法。

评论

Home - Wiki
Copyright © 2011-2024 iteam. Current version is 2.139.0. UTC+08:00, 2024-12-23 00:44
浙ICP备14020137号-1 $Map of visitor$