你刚拍了一张会议白板的照片,或者扫描了一页手写笔记,想快速把文字提取出来。你打开 Mac 上的 OCR 工具,选中区域,然后——什么也没发生,或者吐出一堆乱码。

这不是你的问题。Mac 上的手写文字识别,尤其是非英文的手写,远没有印刷体那么可靠。Apple Vision 框架主要针对印刷文本训练,对手写的支持因语言和书写风格差异巨大。这篇文章会告诉你哪些能识别、哪些不能,以及什么时候该换工具。

底层原理:为什么 Apple Vision 对手写这么挑剔

Apple Vision 的 OCR 模型在训练时,数据主体是印刷体文字——书籍、文档、屏幕截图、路牌。这些文字有固定的字形、均匀的笔画宽度和清晰的字符间距。手写文字则完全不同:笔画粗细不一、字符倾斜、连笔、重叠,而且每个人的字迹都是独特的。

对于英文,Apple Vision 在 macOS 14 Sonoma 及更新版本上能识别一部分印刷风格的手写体——比如你工整地写“Hello World”,每个字母分开、没有连笔,它有可能识别出来。但一旦进入草书(cursive),识别率会急剧下降。

对于中文,情况更严峻。中文手写有楷书、行书、草书等多种风格,Apple Vision 对行书和草书的识别率接近零。原因很简单:训练数据里几乎没有这些风格。日文手写(手書き)和韩文手写(손글씨)同样如此——印刷风格的部分识别,自由书写和连笔基本无效。

实操注意事项:拍照质量比换工具更重要

很多人遇到手写识别失败时,第一反应是换一个 OCR 工具。但在此之前,你应该先检查照片质量。光线充足、对焦清晰、纸张与文字对比度高——这些因素对识别率的影响,往往比工具本身更大。

具体来说:避免阴影覆盖文字,确保照片不模糊,尽量让纸张平整(不要有褶皱或弯曲)。如果你拍的是白板,注意反光。如果你扫描的是笔记本,尽量压平页面。

另一个容易被忽略的点:Apple 备忘录的“扫描文稿”功能,在扫描后生成的 PDF 中内置了手写搜索能力。这个功能使用一个专门针对手写优化的模型,效果比 Live Text 好得多。如果你只是想在笔记里搜索手写内容,直接用备忘录扫描即可,不需要额外工具。

什么时候系统自带就够用,什么时候需要换工具

如果你的需求是:偶尔识别几张工整的英文手写笔记,或者搜索自己写在 Apple 备忘录里的手写内容——macOS 自带的 Live Text 和备忘录搜索功能完全够用。你不需要下载任何第三方应用。

但如果你需要:识别中文行书或草书、处理大量手写文档(如课堂笔记、会议记录)、或者需要将手写内容导出为可编辑文本——系统自带工具就不够了。这时候你需要考虑 GoodNotes、Notability 或 Transkribus。

GoodNotes 和 Notability 使用自己的手写识别引擎,对英文草书的准确率明显高于 Apple Vision。对于中文,它们的优势没那么大,但依然比 Live Text 可靠。Transkribus 则是学术级的选择,专门用于历史档案和古籍手稿的 OCR,支持多种语言和字体,甚至可以针对特定手写风格训练模型。

Cheese! OCR 继承 Apple Vision 的能力,所以手写识别同样受限。它擅长的是印刷体文字——截图、PDF、视频帧、非中文文档——在这些场景下它非常高效。但如果你主要处理手写内容,Cheese! OCR 不是最佳选择。

简短清单:下一步该做什么

  1. 先改善照片质量——光线、对焦、对比度,这三样比任何工具都重要。
  2. 如果只是搜索手写笔记,用 Apple 备忘录的“扫描文稿”功能,不要用 Live Text。
  3. 如果需要识别英文草书,考虑 GoodNotes 或 Notability,它们的专用模型更准确。
  4. 如果需要识别中文行书或草书,目前没有可靠的 Mac 端 OCR 工具——考虑手动转录或使用 Transkribus 进行学术级处理。
  5. 如果主要处理印刷体文字,Cheese! OCR 是高效的选择,但不要指望它处理手写。