Whisper-WebUI 提供了⼀个基于 Gradio 的 UI,使得语⾳识别⽣成字幕轻⽽易举。⽤户可以选择不同的 Whisper 版本,并从⽂件、YouTube、⻨克⻛等来源⽣成字幕,⽀持 SRT、WebVTT、txt 等格式。此外,Whisper-WebUI 还⽀持语⾳到英⽂的⾃动翻译,结合 NLLB (No Language Left Behind)模型或 DeepL API 进⾏⽂本翻译,并通过多种前后处理功能增强字幕⽣成效果。通过 Docker 即可在本地快速部署体验。Koala 认为:Whisper-WebUI ⼤⼤简化了字幕⽣成的流程,是内容创作者和字幕⼯作者的利器,特别适合为视频内容提供多语⾔字幕的场景。