経費精算や確定申告の時期になると、机の上に溜まったレシートの山を前にため息をついた経験はありませんか。一枚一枚手で入力するのは時間がかかりますし、入力ミスも心配です。Mac を使っているなら、レシートからテキストを自動で抽出する方法がいくつかあります。

この記事では、3 つの方法を紹介します。まずは macOS に標準搭載されているライブテキストを使う方法、次にメールやスキャナーで受け取った PDF を扱う方法、そして最後に、より柔軟なホットキー駆動の OCR ツールを使う方法です。それぞれに得意な場面と苦手な場面がありますので、ご自身の作業に合ったものを選んでください。

写真アプリのライブテキストを使う方法

macOS 12 Monterey 以降、写真アプリとプレビューにはライブテキスト機能が搭載されています。これは、画像内の文字を認識して選択・コピーできる機能です。レシートの写真を撮って Mac に取り込めば、すぐにテキスト化できます。

具体的な手順は次の通りです。まず、iPhone でレシートを撮影します。明るい場所で、文字がはっきり写るように撮ってください。その写真を AirDrop で Mac に送り、写真アプリで開きます。すると、画像内のテキスト部分にカーソルを合わせると自動的に選択可能になります。あとはコピーして、経費精算のスプレッドシートや会計ソフトに貼り付けるだけです。

ライブテキストは、電話番号や住所、日付、金額などをタップ可能なデータとして認識します。レシートからこれらの情報を素早く取り出したい場合に便利です。

ライブテキストが効かないケース

ライブテキストは便利ですが、すべてのレシートで完璧に動作するわけではありません。特に、経年で印字が薄くなった感熱紙のレシートは認識率が低下します。これはライブテキストに限らず、どの OCR エンジンでも同様です。

また、ライブテキストは Apple Vision フレームワークを使用しており、対応言語が限られています。英語、中国語(簡体字・繁体字)、日本語、韓国語、フランス語、ドイツ語、イタリア語、スペイン語、ポルトガル語には対応していますが、ロシア語やアラビア語、ヘブライ語、タイ語などは認識できません。これらの言語のレシートを扱う場合は、Tesseract やクラウド OCR サービスを検討する必要があります。

さらに、ライブテキストは写真アプリとプレビューでのみ動作します。サードパーティ製の画像ビューアで開いたレシート画像には適用できません。

メールやスキャン PDF のテキストを抽出する方法

Uber Eats や Amazon、航空会社などから届くレシート PDF は、多くの場合、最初からテキストが選択可能なネイティブ PDF です。この場合は OCR は不要で、そのままテキストを選択してコピーできます。まずは PDF 内でテキストが選択できるかどうかを確認してください。

一方、スキャナーで取り込んだ PDF は画像として保存されているため、OCR 処理が必要です。プレビューで開けばライブテキストが機能しますが、認識精度が不十分な場合もあります。そのような場合は、Adobe Acrobat Pro の OCR 機能や、オープンソースのコマンドラインツール ocrmypdf を使うと良いでしょう。

iPhone のメモアプリやファイルアプリには「書類をスキャン」機能があり、スキャンした書類は自動的に検索可能な PDF になります。この機能を使えば、スキャンしたレシートを Mac に転送して、すぐにテキストを抽出できます。

この方法が向かないケース

メールで届いた PDF が画像ベースの場合、プレビューのライブテキストが認識できないことがあります。また、スキャンした PDF の解像度が低い場合や、文字がかすれている場合も認識率が低下します。大量のレシートを一括処理する場合、一枚ずつ PDF を開いてコピーするのは手間がかかります。

Cheese! OCR を使う方法

ライブテキストが対応していないアプリでレシート画像を開いている場合や、より素早くテキストを抽出したい場合には、Cheese! OCR が便利です。このアプリは、デフォルトのホットキー Shift+Command+E を押すと、画面上の任意の領域をドラッグ選択して OCR を実行します。認識されたテキストは自動的にクリップボードにコピーされるので、そのまま貼り付けるだけです。

Cheese! OCR は Apple Vision フレームワークを使用しており、すべての処理がオンデバイスで行われます。そのため、レシートに含まれる個人情報がネットワークに送信されることはありません。経費精算や確定申告で扱うレシートには、住所や電話番号などの個人情報が含まれていることが多いので、セキュリティ面でも安心です。

また、Cheese! OCR は写真アプリやプレビュー以外のアプリでも動作します。例えば、ブラウザで開いたレシート画像や、サードパーティ製の画像ビューアで開いた画像でも OCR が可能です。複数のレシートを連続して処理する場合も、ホットキー一つで素早くテキストを抽出できます。

3 つの方法を比較する

方法 最適な場面 制限
ライブテキスト(写真アプリ) 撮影したレシート写真を一枚ずつ処理する場合 写真アプリとプレビュー限定、対応言語に制限あり
PDF の OCR(プレビュー・Acrobat) スキャン PDF やメール添付の PDF を処理する場合 バッチ処理には不向き、画像 PDF は認識率が低下
Cheese! OCR あらゆるアプリの画像から素早くテキストを抽出したい場合 専用アプリのインストールが必要

よくあるトラブルと対処法

OCR を実行しようとしても、テキストが認識されないことがあります。まず確認してほしいのは、画像の明るさと解像度です。暗い場所で撮影したレシートや、ピントが合っていない写真は認識率が下がります。可能であれば、明るい場所で撮り直してください。

また、ライブテキストが機能しない場合、macOS のバージョンが 12 以上であることを確認してください。それ以前のバージョンではライブテキストは利用できません。さらに、システム環境設定で写真アプリとプレビューに画像へのアクセス許可が与えられているかも確認しましょう。

Cheese! OCR を使用する場合、初回起動時に画面収録の許可を求められます。これは OCR のために画面の一部をキャプチャするために必要な権限です。許可しないと OCR が実行できませんので、指示に従って設定してください。