Hikari 论文精读:让 AI 同传自己决定何时"开口"

摘要

Sony AI与Nara Institute联手推出Hikari同传系统,创新性引入WAIT token机制,让翻译模型自主决定输出时机。通过升级音频帧对齐算法、优化Decoder采样率及延迟追赶策略,Hikari在英译德/日/俄任务中刷新SOTA,单卡H100实现实时翻译。但需注意ASR辅助不可删、30秒窗口限制等硬约束,小模型效果欠佳。

欢迎在评论区写下你对这篇文章的看法。

评论

Accueil - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.1. UTC+08:00, 2026-04-18 00:36
浙ICP备14020137号-1 $Carte des visiteurs$