2026 年的 Mac OCR 工具地图

五年前在 Mac 上想做 OCR,多半要把 PDF 上传到某个网页服务,然后祈祷不要识别成乱码。今天这已经是一个真正成形的品类。Apple 自 2019 年起把 Vision 框架内置到 macOS,每年都在迭代识别质量,相当于免费向第三方开发者发了一颗本地 OCR 引擎。围绕这颗引擎,长出了一小批菜单栏工具,要解决的都是同一个问题:怎么从「本来不能选」的地方把文字弄出来?被锁死的 PDF、Zoom 共享屏幕里飘过的代码、同事在飞书里贴过来的截图、B 站教程暂停时画面里的命令行。

这一类工具里最常被提及的两个名字,是 Text Sniper 和 Cheese! OCR。Cheese! OCR 是我们做的,所以这篇不是中立评测——但我们尽量公正。除了这两款,Mac 上还有系统自带的 macOS 实况文本(免费、对部分人来说足够),有 PDFPen Pro、Adobe Acrobat 这类全文档 PDF 编辑器(解决的是另一个问题),还有像嗨格式 OCR、福昕 PDF 阅读器这样在国内市场较常见的产品(多数走云端、定位偏文档处理)。下文都会顺带提到。

结论先放上:如果你的工作流就是「按下快捷键、框选、粘贴」,Cheese! OCR 和 Text Sniper 对 90% 的用户来说基本可以互换。值得讨论的是剩下 10%——以及价格、历史搜索,和「你愿意每天在菜单栏看到哪个图标」这种问题。

Cheese! OCR 与 Text Sniper:相同的部分

从相同点开始更容易讲。两款应用都:

最后这点很重要:因为底层都是同一颗引擎,原始识别准确率基本相当。如果 Apple Vision 把一段花体英文的「rn」看成「m」,那两个 App 都会同样翻车。说 Cheese! OCR 准确率「显著高于」Text Sniper、或者反过来的,多半是在比较两张不同的图。

Text Sniper 在哪些方面仍然领先

Text Sniper 比 Cheese! OCR 更早进入这个市场。这并不是一件小事——既然底层引擎是 Apple 的,那么一切区别都来自引擎之外:UI 细节、键盘交互的打磨、那些被早期用户撞出来又一个个修掉的边角 bug。

具体说,Text Sniper 当下确实在以下几方面更稳:

如果你已经用 Text Sniper 用得很顺手了,下面我们要讲的 Cheese! OCR 优点都不构成换工具的理由。习惯是会复利的,最适合你的 OCR 工具往往就是那个快捷键已经长在手指上的工具。

Cheese! OCR 在哪些方面拉开差距

当然我们不是无缘无故做了一款新应用。下面这几点是我们认为今天 Cheese! OCR 真正具有优势的地方。

1. 可搜索的 OCR 历史

Cheese! OCR 会把每次识别结果连同时间戳和小缩略图存在本地。你可以往回翻、按文字搜索、把任意一条历史记录重新复制一遍。听起来不大,但用上之后会发现「半小时前 OCR 过的那段文字」出现的频率有多高——你正在读外刊学术 PDF,框了一段引文复制到 Notion,继续往下读,第二天开会时领导问「来源是哪一篇」,搜一下历史就能找到原文。这把 OCR 从「一次性工具」变成了你的个人文字小档案。

这是 Cheese! OCR 有、Text Sniper 没有的功能。如果你一天 OCR 不止几次,光是历史搜索就大概率值回那点价格差。

2. 把中文与韩文当作一等公民

Apple Vision 本身支持中文和韩文,但识别效果好不好,要看应用怎么排语言优先级、怎么处理混排。我们在中文上做了具体的回归测试:繁简转换、中英混排、扫描版古籍的竖排识别、外刊 PDF 里的脚注、公众号文章截图。在韩文上同样做了专门投入——韩文是默认开启的语言之一,UI 也提供了完整的韩文翻译。如果你日常 OCR 的内容里中文或者韩文是主力,Cheese! OCR 在产品决策上把你算进了房间里。

3. 价格

Cheese! OCR 是 5.99 美元一次性买断。Text Sniper 更贵一些(具体数字以 Mac App Store 当前显示为准,我们就不报一个会过期的价格)。两者都不离谱。但如果你是那种对「付费工具要不要买」会犹豫一下的人,5.99 美元的心理门槛低得多,再加上 Mac App Store 7 天退款的兜底——基本零成本试错。

这里要谨慎一点:便宜不等于更好。我们便宜是因为我们刻意定了一个低门槛的价格,不是因为产品「比较次」。请把这条理解成「如果你还在犹豫,价格友好」,而不是「Text Sniper 卖贵了」。

4. 友好的视觉与吉祥物

这是审美问题。Cheese! OCR 有一个奶酪主题的吉祥物,可以切换不同造型,整体调性偏温暖——截图音效、轻动画、菜单栏图标本身做得让人愿意天天看。有人喜欢这种风格,也有人更想要一款「冷静、看不见、不打扰」的工具,那么 Text Sniper 在调性上更接近后者。挑那个让你顺眼的就好——这不会改变效率,但你每天确实要看一眼。

系统自带的实况文本——先试免费的

付费之前,先试试 macOS 实况文本(系统自带、免费、在 Apple 自家应用里相当能打)。在「照片」「预览」「快速查看」里打开图片,鼠标移到文字上指针会变成 I-beam,可以直接选中复制;Safari 里网页上的图片同理。在 Apple 自己的地盘上,实况文本很难被超过。

它不擅长的是 Apple 地盘之外:多数第三方应用不会暴露实况文本入口,QuickTime 里的视频帧识别也不稳定,「跨任意屏幕区域框选」这件事不在它的设计范围里,更没有历史。我们专门写了一篇拆解:见 Cheese! OCR vs macOS 实况文本。简单说:偶尔用、且都在 Apple 应用里,实况文本就够;否则才轮到付费快捷键工具上场。

其它值得知道的 Mac OCR 工具

Mac 上号称「能 OCR」的应用不少,但大多数和 Cheese! OCR / Text Sniper 不是一类产品。下面给每类一段,方便你直接判断要不要排除。

PDFPen Pro

偏向全文档 PDF 编辑器,价格大约在 100 美元以上(具体看版本)。OCR 只是它众多功能之一,还要做注释、表单、PDF 内文字编辑。如果你每天泡在 PDF 里(法律、学术、合同),PDFPen Pro 解决的是另一类问题。不要直接和快捷键 OCR 横评,应该问自己:「我需要的是带 OCR 的 PDF 编辑器,还是偶尔会处理 PDF 的 OCR 工具?」

ocrmypdf(开源命令行工具)

免费、命令行(github.com/ocrmypdf/OCRmyPDF),输入一份扫描 PDF,输出一份带隐藏文字层的可搜索 PDF。底层是 Tesseract。批量处理扫描古籍、档案、整堆扫描资料的最佳工具,但完全不是交互式的——没有快捷键、没有菜单栏、没有实时截屏。如果你的「OCR 需求」实际上是「我手上有 200 份扫描 PDF 要补上文字层」,那任何菜单栏工具都不是答案,ocrmypdf 才是。

Adobe Acrobat Pro

企业默认。OCR 实力强、嵌在重型 PDF 工作流里、订阅大约 20 美元/月起步(Adobe 价格变动较多,我们做了对冲)。两个真实顾虑:成本(订阅、且不便宜),以及 Acrobat 的部分流程会经过 Adobe 云——具体看版本和设置。处理敏感文档前请仔细读它的数据处理说明。仅仅为了截图 OCR 而上 Acrobat,相当于用电锯切面包。

Abbyy TextGrabber / FineReader

Abbyy 的 OCR 引擎在历史上一直处于第一梯队,对非拉丁文字尤其强。但他们的部分消费级产品是云端 OCR——图像会被上传识别。这是真实存在的隐私 trade-off,把它指向机密合同或病例之前请先想清楚。商业流程能接受云端的话,Abbyy 在准确率上很有竞争力;涉及敏感材料,本地工具(Cheese! OCR、Text Sniper、实况文本、ocrmypdf)更稳妥。

嗨格式 OCR、福昕 PDF 等国内常见产品

嗨格式 OCR 在中文用户中知名度较高,主打「文档转换 + OCR」的组合,定位更接近一款一站式办公文件处理工具,而不是快捷键 OCR 利器。它的部分识别能力依赖云端,对本地隐私敏感的工作流要慎用,但作为「偶尔批量转换扫描合同」的工具是合理的。福昕 PDF 阅读器同样属于 PDF 编辑器范畴,OCR 是附加功能。简单说:要 PDF 全流程编辑,看这些;要每天高频「截图取字」,还是回到快捷键 OCR。

一份实用的选择清单

如果今天有人问我们怎么选,我们的建议是:

诚实的结论

Cheese! OCR 和 Text Sniper 都是认真维护、值得信赖的 Mac OCR 工具。没有谁在「全局意义上」更强。两者下了不同的赌注——Text Sniper 押在成熟度和已建立的用户群,Cheese! OCR 押在历史搜索、中韩文优化和更友好的价格——哪边跟你的工作流更契合,答案就在那里。

如果你读到这里希望我们直接判个胜负,最接近的回答是:先把免费的(实况文本)用上一段时间,发现不够再来试 Cheese! OCR。我们做了这款应用,自己觉得它好。但如果 Text Sniper 已经把你拿下了——那就留在那里。最糟的情况是每半年换一次工具,工作反而停滞了。

说完这些,下面是我们经常被问到的几个问题。