
按住 CapsLock 或 鼠标 X2 说话,松开就上屏。就这么简单。
CapsWriter-Offline 是一个专为 Windows 打造的完全离线语音输入工具。
✨ 核心特性
- 语音输入:按住
CapsLock 键或鼠标侧键 X2说话,松开即输入,超低延迟,默认去除末尾逗句号。支持对讲机模式和单击录音模式。 - 文件转录:音视频文件往客户端 exe 一丢,字幕 (
.srt)、文本 (.txt)、时间戳 (.json) 统统都有。 - 数字 ITN:自动将「十五六个」转为「 15~16 个」,支持各种复杂数字格式。
- 热词替换:在
hot.txt记下偏僻词,通过音素模糊匹配,相似度大于阈值则强制替换。 - 正则替换:在
hot-rule.txt用正则或简单等号规则,精准强制替换。 - LLM 角色:预置了润色、小助理等角色,当识别结果的开头匹配任一角色名字时,将交由该角色处理。
- 托盘菜单:右键托盘图标即可添加热词、复制结果、清除 LLM 记忆。
- C/S 架构:服务端与客户端分离,虽然 Win7 老电脑跑不了服务端模型,但最少能用客户端输入。
- 日记归档:按日期保存你的每一句语音及其识别结果。
- 录音保存:所有语音均保存为本地音频文件,隐私安全,永不丢失。
CapsWriter-Offline 的精髓在于:完全离线(不受网络限制)、响应极快、高准确率 且 高度自定义。我追求的是一种「如臂使指」的流畅感,让它成为一个专属的一体化输入利器。无需安装,一个 U 盘就能带走,随插随用,保密电脑也能用。
以下为支持的模型:
| 引擎名 | 准确性 | 速度 | 格式 | 显卡加速 |
|---|---|---|---|---|
| Paraformer | ★★★☆☆ | ★★★★★ | ONNX | ❌ |
| SenseVoice-Small | ★★★☆☆ | ★★★★★ | ONNX | ✅ |
| Fun-ASR-Nano | ★★★★☆ | ★★★★☆ | ONNX + GGUF | ✅ |
| Qwen3-ASR | ★★★★★ | ★★★☆☆ | ONNX + GGUF | ✅ |
性能参考( 20s 音频转录延迟):
| 模型 | CPU U9-285H | GPU RTX5050 |
|---|---|---|
| Paraformer | 0.6s | - |
| SenseVoice-Small | 0.6s | 0.15s |
| Fun-ASR-Nano | 2.0s | 0.5s |
| Qwen3-ASR-1.7B | 4.0s | 1.0s |
功能文档:
- 环境依赖安装说明 — VC++ 运行库、FFmpeg 安装
- 热词功能如何使用 — 热词替换、规则替换、自定义短语
- 角色功能如何使用 — LLM 角色配置、输出模式、创建新角色
- 识别语言如何配置 — 各引擎语言支持范围与配置方法
- 文件转录功能如何使用 — 拖拽转字幕、时间戳对齐
- 显卡加速的若干问题 — DirectML 、Vulkan 加速配置
- 模型下载的若干问题 — 引擎选择、模型下载、目录结构
- 更新日志
下载地址:
- 百度盘: https://pan.baidu.com/s/1GsrHynsRg3bAvNFoj8GuJQ 提取码: ngjo
- GitHub Release: HaujetZhao/CapsWriter-Offline