Type4All 粤语语音输入

免费离线粤语语音转文字 Windows 应用程序。用粤语自然地说话,即时转换成文字 — 无需连接互联网,实现私密的本地语音识别。

视频教程

YouTube 观看

常见问题

Type4All 是什么?

Type4All 是一款免费的粤语语音输入软件,专为 Windows 设计。按住一个 hotkey,直接用粤语(或粤语夹杂英文)说话,你说的内容就会即时输入到当前的应用程序 — Word、Chrome、WhatsApp Web、Notepad、评论框,任何可以打字的地方都能用。

它专为香港语境而设计:能识别香港日常口语、code-switch 的英文词汇,以及本地常用的专有名词。第一次安装时下载一次 AI 模型之后,所有运算都在你的电脑本机进行,不需要云端,也没有月费。

Type4All 是 AI4All 计划的一部分 — 这个计划的目标,是让普通香港人都能用到实用的 AI 工具,即使不熟悉英文或技术术语,也能享受 AI 带来的好处。

Type4All 在技术上是如何运作的?

Type4All 内置一个支持粤语的语音识别(ASR)模型,使用 ONNX Runtime 在你的电脑本机运行。整个流程大致如下:

1. 你按住设定的全局 hotkey(默认是右 Ctrl)。
2. 按住期间,麦克风会录音。
3. 松手后,录音会交给本地 ASR 模型进行转文字。
4. 识别出来的文字,会以模拟键盘输入的方式输入到当前的文字框 — 与你自己打字完全一样。

几个关键的设计选择:
• Local-first:首次运行下载大约 3GB 的模型,之后所有转录都使用你的 CPU 完成,任何音频都不会传到任何服务器。
• 可离线使用:模型下载完成后,程序无需联网即可使用。
• 通用兼容:输出是纯键盘输入,所以 Type4All 在任何接受键盘输入的应用程序中都能使用 — 不需要为单个 app 做特别整合。
• Footprint 小:键盘 hook 只会检查你设定的 hotkey,不会记录其他按键。

由于运算在本机进行,实际响应速度会取决于你的硬件。SSD + 16GB RAM 的组合会接近即时识别;较旧的 HDD 机器会明显较慢。

为什么 Type4All 是免费的?

两个原因。

第一,初心。Type4All 的出现,是因为 Windows 一直以来对粤语语音输入的支持都不够好,而市面上的第三方方案大多都是云端(隐私顾虑)或收费。对于只是想用粤语打字、又不想把自己的声音传到国外云端、也不想付月费的香港用户来说,选择极为有限。如果 Type4All 也收费,就违反了最初想解决这个 gap 的初衷。

第二,可持续性来自其他地方。AI4All YouTube 频道(https://www.youtube.com/@AI4All-edu)免费分享粤语 AI 教学,也正在考虑推出选择性付费内容 — 例如给想深入学习的人的进阶课程、或社群导向的频道会员。这些选择性的收入,正是让 Type4All 等免费工具和免费教学内容能够持续做下去的基础。

简单来说:免费就是产品本身,不是 teaser。Type4All 本身没有计划推出付费版,没有升级弹窗,也不会收集 telemetry 用于其他变现用途。

Windows 上有没有免费的粤语语音输入方法?

有,Type4All 是一款免费的粤语语音输入软件,专为 Windows 而设。按一下热键,以粤语自然说话,识别出来的文字便会直接输入到你当前使用的应用程式内。首次下载 AI 模型后,全程离线运作 — 无需订阅、没有使用限制。

有没有 Windows 上完全离线运作的粤语语音输入软件?

有,就是 Type4All。它将 AI 语音模型完全于你的电脑本地运行,你的声音绝不会离开你的设备。首次安装时下载 AI 模型后,往后使用语音输入便无需连接网络。没有云端上传、没有 telemetry。

可以在 WhatsApp、Word 或 Notion 内用粤语语音输入吗?

可以。Type4All 适用于任何接受文字输入的 Windows 应用程式 — 包括 WhatsApp Desktop、Microsoft Word、Notion、Outlook、浏览器,以及大部分通讯或笔记软件。按下全局热键开始说话,识别出来的粤语文字会自动粘贴到你的光标所在位置。无需为每个应用程式设定整合,也无需安装任何插件。

第一次打开 Type4All 会看到一个「开始之前」的同意画面,那是什么?

那是从 v0.8.6 开始新增的首次启动使用条款/隐私声明确认画面。

因为 Type4All 会用到你电脑的麦克风和全局键盘 hotkey,我们希望用户在开始前清楚知道:
• 麦克风仅在你按下 hotkey 期间才会录音
• 键盘 hook 仅检查你设定的 hotkey,不会记录其他任何按键
• 首次下载 AI 模型后完全离线运行,不会传送任何数据
• 软件以「按现状」提供,不附带任何保证

点击「同意并继续」之后,程序会记住你的选择,以后启动都不会再出现这个画面。

详情可以查看:
• Privacy Notice Section 5A — https://4all.dev/zh-Hans/privacy
• Terms of Service「Downloadable Software Applications」部分 — https://4all.dev/zh-Hans/terms
• DISCLAIMER.txt — 随软件安装,在解压后的 Type4All 文件夹内

启动 Type4All 时弹出红色警告「Type4All 需要麦克风权限才能运作」,该怎么办?

这个警告表示 Windows 的麦克风权限尚未开启。可以尝试按以下步骤开启。

最快方法:
按 Win + R,输入 ms-settings:privacy-microphone 然后按 Enter —— 直接跳转到麦克风权限页面。

或者手动:开始 → 设置 → 隐私和安全性 → 麦克风

确认以下三个开关全部打开:
1. 麦克风访问 (Microphone access)
2. 允许应用访问你的麦克风 (Let apps access your microphone)
3. 允许桌面应用访问你的麦克风 (Let desktop apps access your microphone) ← 最容易被遗漏

第三个开关要特别留意 —— 因为 Type4All 是桌面程序,与 Microsoft Store 下载的应用分开管理。

之后:关闭程序,再重新打开。

首次启动 Type4All 等了很久(超过 2 分钟)仍未准备好,是不是卡住了?

首次启动需要加载一个接近 3GB 的 AI 语音模型,正常情况下的时间参考:

• SSD + 16 GB RAM(推荐):首次 10–30 秒 / 后续 5–15 秒
• SSD + 8 GB RAM:首次 30 秒–1 分钟 / 后续 10–30 秒
• HDD(传统硬盘):首次 3–15 分钟 / 后续 1–5 分钟

如果等待超过 2 分钟仍然没有准备好,最有可能是:
• 你的电脑正在使用传统 HDD 硬盘(不是 SSD)
• 或者可用 RAM 不足(模型加载时需要约 3GB 连续内存空间)

抱歉,AI 模型对硬件有一定要求,例如需要 SSD 才能流畅运行。

启动时弹「语音引擎无法启动,请重新启动 Type4All」

原因:Type4All 会在你电脑 local 运行一个 AI 语言模型,对内存和 CPU 要求较高。

解决步骤(顺序尝试):
1. 关闭 Type4All → 重新开机 → 只开 Type4All,等 1–2 分钟冷启动
2. 打开任务管理器查看「可用内存」,建议保持 4GB 以上空闲
3. 确认已下载最新版本(v0.9.1 或以上)

如果以上都无法解决,参考下面 Q6 导出调试记录发给我们分析。

说完后显示「识别中」然后停止,无文字输出

同 Q4 同源 —— 多数是 AI 模型运行期间 RAM 不足,模型运行程序被系统关闭。

建议:关闭其他大型应用(Chrome 多 tab、游戏、视频剪辑软件等)再试。

如果仍然重现,参考下面 Q6 导出调试记录发给我们。

怎样查看调试记录 / 报告问题?

v0.7.8 新增了「调试记录」功能,方便你自己查看或交给我们 debug。

怎么打开?
1. 右键点击悬浮麦克风面板 → 选择【显示调试记录】
2. 弹出的小窗口会实时显示:系统信息(CPU、RAM、Python / ONNX 版本)、每次说话的识别时间、错误信息

重要:绝对不会记录你说的内容,只记录 metadata(时间、长度、错误信息),可以放心分享。

遇到问题?
点击【保存】导出 .log 文件 → 发送邮件到 [email protected],我们帮你看看。

系统需求

━━━━━━━━━━━━━━━━━━━━━━━━━━
💡 温馨提示
Type4All 的 AI 模型在你电脑本地运行(真正离线、保障隐私),
所以实际表现会取决于你的硬件和 Windows 系统设置。
部分机型可能会出现兼容性问题,
某些 hybrid architecture CPU(尤其是 P-core + E-core 三层 hybrid 架构设计),
未必每一部电脑都能顺畅运行,敬请见谅 🙏
━━━━━━━━━━━━━━━━━━━━━━━━━━

• OS: Windows 10 / 11(64 位)
• RAM: 最少 16GB,建议 32GB(闲置时需有 8GB 以上空闲)
• CPU: 近 5 年内任何 Intel / AMD 主流 CPU(太旧的 Atom / Celeron 不推荐)
• 硬盘: 5.5 GB 以上可用空间
• 网络: 仅需初次下载模型,之后完全离线使用

下载 Type4All 后,Windows 弹出「Windows 已保护你的电脑」,或 Defender / 杀毒软件提示此程序有问题,是不是有病毒?

不是病毒,请放心 — 这是 Windows SmartScreen 和部分杀毒软件针对「未签名」程序的标准警告。

为什么会出现:
• Type4All 是一款独立开发者的免费小型软件,以 Apache License 2.0 授权发布,目前尚未购买 code signing 证书(约 £100–300/年),所以 Windows 暂时「不认识」这个程序。
• Type4All 使用全局键盘 hook 来检测你设定的 hotkey,这项技术与部分恶意软件相似,因此少数杀毒软件会误报。

如何继续安装:
1. 在 SmartScreen 警告窗口,点击「更多信息 (More info)」 → 「仍要运行 (Run anyway)」
2. 如果 Defender 已将文件隔离,可以在「病毒和威胁防护 → 威胁记录 → 允许 (Allow)」将 Type4All.exe 加入白名单

为什么可以信任:
• 首次下载 AI 模型之后,程序完全离线运行,不会传送任何数据、crash report、analytics 或 telemetry
• 全局键盘 hook 仅检查你设定的 hotkey,不会记录其他任何按键
• 详情请参考 Privacy Notice Section 5A(https://4all.dev/zh-Hans/privacy)以及随软件安装的 DISCLAIMER.txt 文件

按下 Right Ctrl 没有反应,无法启动录音,应该怎么办?

最常见原因是 Right Ctrl 已被其他程序抢先占用,导致 Type4All 无法成功注册为全局热键。常见的占用来源包括:

• 中文输入法:搜狗、微软新注音、百度输入法等可能将 Right Ctrl 设为输入法切换键。
• 热键管理软件:AutoHotkey、PowerToys、Logitech Options、Razer Synapse 等工具可能会将 Right Ctrl 注册为全局热键。

此外,Windows 对于「纯修饰键」作为全局热键的支持本身有其限制——修饰键(Ctrl、Alt、Shift)原本的设计用途是与其他按键组合使用,单独注册时容易与系统、输入法或其他软件产生冲突。

如快捷键暂时无法使用,可以用鼠标点击 Type4All 窗口上的录音按钮启动录音作为替代方式。

我们正考虑在下一版本加入组合键支持(例如 Ctrl + Alt),从而降低冲突机率。