这是一个离线运行的本地语音识别转文字工具,基于 fast-whipser 开源模型,可将视频/音频中的人类声音识别并转为文字,可输出json格式、srt字幕带时间戳格式、纯文字格式。
fast-whisper 开源模型有 tiny/base/small/medium/large-v3, 内置 tiny 模型,tiny->large-v3识别效果越来越好,但所需计算机资源也更多,根据需要可自行下载后解压到 models 目录下即可。
![图片[1]-离线运行的本地音视频转字幕工具,一键音视频提取文字,支持导出为多种格式,完全免费! STT - 软满仓-财源精品库-软满仓-财源精品库](https://www.wlcy.cc/wp-content/uploads/2026/04/20260419203205619-1776601934986.png)
软件特点
- 离线运行的本地音视频转字幕工具,纯本地运行
- 支持cpu运行和GPU加速
- 完全免费,无需部署,一键运行
- 字幕支持输出json、srt字幕、纯文字txt格式
使用教程
- 下载后解压到某处,比如 E:/stt
- 双击 start.exe ,等待自动打开浏览器窗口即可
- 点击页面中的上传区域,在弹窗中找到想识别的音频或视频文件,或直接拖拽音频视频文件到上传区域,然后选择发生语言、文本输出格式、所用模型,点击“立即开始识别”,稍等片刻,底部文本框中会以所选格式显示识别结果
- 如果机器拥有英伟达GPU,并正确配置了CUDA环境,将自动使用CUDA加速注意:默认使用 cpu 运算,如果确定使用英伟达显卡,并且配置好了cuda环境,请修改 set.ini 中 `devtype=cpu`为`devtype=cuda`,并重新启动,可使用cuda加速
© 版权声明
1、本网站名称:软满仓-蔚来精品库
2、本站永久网址:https://www.wlcy.cc
3、本网站的文章部分内容可能来源于网络,仅供大家学习与参考,如有侵权,请联系站长进行删除处理;
4、本站一切资源不代表本站立场,并不代表本站赞同其观点和对其真实性负责;
5、本站一律禁止以任何方式发布或转载任何违法的相关信息,访客发现请向站长举报;
6、本站资源大多存储在云盘,如发现链接失效,请联系我们我们会第一时间更新;
7、本站仅分享,如需付费,请自行斟酌考量,由此产生的金钱损失,与本站无关,本站概不负责。
THE END

























暂无评论内容