大模型长文本扩长技术实践探索:低成本且自适应不同长度

摘要

我们提出一种用于LLM高效扩长的方法(E^2-LLM),该方法仅需要一个训练阶段,而且无需收集长文本数据,支持短文本训练,任意长度推理。

欢迎在评论区写下你对这篇文章的看法。

评论

Accueil - Wiki
Copyright © 2011-2024 iteam. Current version is 2.137.1. UTC+08:00, 2024-11-15 10:22
浙ICP备14020137号-1 $Carte des visiteurs$