使用 OpenAI 的 Whisper 语音转文字模型在本地转录音频文件——无需 API 密钥,支持多种语言和输出格式。
npx clawhub@latest install openai-whisperWhisper (CLI) 将 OpenAI 强大的语音转文字模型直接带到您的本地机器上。它可以转录多种格式的音频文件,还能将语音翻译成英文——所有这些都无需将数据发送到外部 API。模型只需下载一次并缓存在本地,使后续运行更快速且完全离线。
npx clawhub@latest install openai-whisper点击本页顶部的 安装 按钮即可一键设置
.srt)。Openai Whisper 完全在您自己的硬件上运行。无需 OpenAI 账户、无需 API 密钥,也不会将任何数据发送至外部服务器——只需一次性下载模型权重,即可离线进行转录。
通过 --output_format 标志支持 txt、srt、vtt、tsv 和 json 输出格式,只需一条命令即可轻松生成字幕、副标题或纯文本转录内容。
传入 --task translate 参数,可自动将非英语语音翻译为英语文本,该功能由与转录相同的模型权重驱动,基于 Openai Whisper 实现。
从多种模型中进行选择(tiny、base、small、medium、large、turbo),以在转录速度与准确性之间取得平衡。此安装的默认模型为 turbo。模型在首次下载后会缓存至 ~/.cache/whisper。
将录制好的 .mp3 或 .m4a 文件导入 Openai Whisper,并使用 --model medium --output_format txt 参数,即可获得干净的文字转录稿,无需将敏感对话上传至第三方服务。
使用 --output_format srt 生成字幕文件,可直接导入视频编辑器或媒体播放器,非常适合内容创作者在本地为其录像添加字幕。
在外语音频上运行 --task translate,一步获得英文转录文本,适合处理多语言原始素材的研究人员或记者使用。
npx clawhub@latest install openai-whisper登录后撰写评价
暂无评价。来分享你的使用体验吧!