Whisper-WebUI | Whisper UI 界面

Whisper-WebUI 提供了⼀个基于 Gradio 的 UI，使得语⾳识别⽣成字幕轻⽽易举。⽤户可以选择不同的 Whisper 版本，并从⽂件、YouTube、⻨克⻛等来源⽣成字幕，⽀持 SRT、WebVTT、txt 等格式。此外，Whisper-WebUI 还⽀持语⾳到英⽂的⾃动翻译，结合 NLLB （No Language Left Behind）模型或 DeepL API 进⾏⽂本翻译，并通过多种前后处理功能增强字幕⽣成效果。通过 Docker 即可在本地快速部署体验。Koala 认为：Whisper-WebUI ⼤⼤简化了字幕⽣成的流程，是内容创作者和字幕⼯作者的利器，特别适合为视频内容提供多语⾔字幕的场景。