Openai Whisper

Name: Openai Whisper
Author: Peter Steinberger

使用 OpenAI 的 Whisper 语音转文字模型在本地转录音频文件——无需 API 密钥，支持多种语言和输出格式。

Peter Steinbergerv1.0.0

正在连接智能体...

npx clawhub@latest install openai-whisper

161Star 数

31.4k下载次数

84当前安装数

832累计安装数

v1.0.0版本

Feb 26, 2026更新时间

查看源码(ClawHub)

Openai Whisper 技能概述

Whisper (CLI) 将 OpenAI 强大的语音转文字模型直接带到您的本地机器上。它可以转录多种格式的音频文件，还能将语音翻译成英文——所有这些都无需将数据发送到外部 API。模型只需下载一次并缓存在本地，使后续运行更快速且完全离线。

如何使用

Step 1: 在终端运行或在 AgentCellar 上安装此技能

npx clawhub@latest install openai-whisper

或

点击本页顶部的安装按钮即可一键设置

Openai Whisper 适用场景

适合使用

您需要在本地转录音频或视频文件，无需 API 密钥或使用费用。
您希望进行隐私保护转录，音频数据始终不离开您的设备。
您需要直接从音频生成字幕/说明文件（.srt）。
您正在批量处理录音文件，并希望完全掌控模型大小与速度之间的权衡。

不适合使用

您需要实时或流式转录——Whisper CLI 处理的是文件，而非实时音频流。
您需要具有正常运行时间保证和 SLA 的托管云转录服务。
您的机器磁盘空间或内存非常有限，无法容纳模型权重（即使是最小的模型也需要数百 MB）。

核心功能

完全本地运行，无需 API 密钥

Openai Whisper 完全在您自己的硬件上运行。无需 OpenAI 账户、无需 API 密钥，也不会将任何数据发送至外部服务器——只需一次性下载模型权重，即可离线进行转录。

多种输出格式

通过 --output_format 标志支持 txt、srt、vtt、tsv 和 json 输出格式，只需一条命令即可轻松生成字幕、副标题或纯文本转录内容。

翻译为英语

传入 --task translate 参数，可自动将非英语语音翻译为英语文本，该功能由与转录相同的模型权重驱动，基于 Openai Whisper 实现。

灵活的模型选择

从多种模型中进行选择（tiny、base、small、medium、large、turbo），以在转录速度与准确性之间取得平衡。此安装的默认模型为 turbo。模型在首次下载后会缓存至 ~/.cache/whisper。

使用场景

会议或采访录音转录

将录制好的 .mp3 或 .m4a 文件导入 Openai Whisper，并使用 --model medium --output_format txt 参数，即可获得干净的文字转录稿，无需将敏感对话上传至第三方服务。

视频字幕生成

使用 --output_format srt 生成字幕文件，可直接导入视频编辑器或媒体播放器，非常适合内容创作者在本地为其录像添加字幕。

多语言音频翻译

在外语音频上运行 --task translate，一步获得英文转录文本，适合处理多语言原始素材的研究人员或记者使用。

正在连接智能体...

npx clawhub@latest install openai-whisper

161Star 数

31.4k下载次数

84当前安装数

832累计安装数

v1.0.0版本

Feb 26, 2026更新时间

查看源码(ClawHub)

常见问题

评价

0 条评价

登录后撰写评价

暂无评价。来分享你的使用体验吧！