正则二维码归属地
高德推出STAgent智能体,专注复杂时空推理任务。该模型在多重约束下优化行程规划,集成10种专业工具,结合SFT-Guided RL训练策略提升性能。实验显示,STAgent在TravelBench上表现优异,30B参数规模媲美235B级模型,兼具专业性与通用能力,为智能体规划领域提供了高效解决方案。
欢迎在评论区写下你对这篇文章的看法。
Главная - Вики-сайт Copyright © 2011-2026 iteam. Current version is 2.148.3. UTC+08:00, 2026-01-12 20:25 浙ICP备14020137号-1 $Гость$