Extxt｜エクステキスト｜使い方ガイド

Extxt（エクステキスト）について

Extxt（エクステキスト）は画像の中に含まれるテキストをOCR（光学文字認識）で自動的に読み取り、キーワードで横断検索できるツールです。
Extxtは、Extract（抽出）とText（テキスト）を組み合わせた造語で、画像からテキストを「抽出」して活用することをコンセプトにしています。
すべての処理はブラウザ内で完結するため、画像やテキストが外部のサーバーに送信されることはありません。インターネット接続は、初回の言語モデル読み込み時のみ必要です。

アプリを開く

基本的な使い方

Step 1

画像をアップロード

ページ上部のアップロードエリアに、テキストが含まれる画像をドラッグ&ドロップするか、「ファイルを選択」ボタンから選んでください。PNG・JPG・WEBP・GIF 形式に対応しており、複数ファイルを一度にまとめて追加できます。

アップロード済みの画像はサムネイル一覧で確認できます。不要な画像は、サムネイル右上の × ボタンで個別に削除できます。

Step 2

設定 & 読み取り

認識したい言語（日本語・英語）をバッジで選択し、「テキストを読み取る」ボタンをクリックしてください。複数枚の画像がある場合は、順番に自動で処理されます。進行状況はプログレスバーで確認できます。

読み取りが完了すると、各サムネイルの枠がグリーンに変わります。

初回実行時は、言語モデルのダウンロードが発生します（日本語約20MB・英語約4MB）。2回目以降はキャッシュされるため、すばやく処理が始まります。

Step 3

テキストを検索

読み取りが完了したら、検索バーにキーワードを入力してください。アップロードしたすべての画像のOCR結果を横断して検索し、一致した箇所を黄色くハイライト表示します。

検索結果のカードをクリックすると、画像とテキストの詳細を展開して確認できます。

便利な機能

タグで管理する

各画像に任意のタグを付けることができます。検索バーの下に表示されるタグフィルターをクリックすると、そのタグが付いた画像だけに絞り込んで検索できます。プロジェクト名やカテゴリなど、自由に分類にお使いください。

OCRテキストを手動で修正する

OCRの読み取り結果が正確でない場合、テキストを直接編集できます。検索結果カードを展開し、テキストエリアを修正して「編集を保存」ボタンをクリックしてください。編集したテキストは次回から検索対象になります。

確認済みマークをつける

画像ごとに「確認済み / 未確認」のステータスを管理できます。大量の画像を処理する際、レビューの進捗管理にご活用ください。

テキストをエクスポートする

OCR結果をCSVファイルまたはテキストファイルとして書き出せます。他のツールへのデータ連携や、記録の保存にご利用ください。

データの保存について

IndexedDB（デフォルト）

フォルダを接続しない場合、OCR結果・タグ・編集内容はブラウザの IndexedDB に自動保存されます。次回ページを開いたとき、同じ画像が自動的に復元され、再読み取りなしにすぐ検索できます。

ただし、ブラウザのデータを削除すると消えるためご注意ください。

フォルダ接続（推奨）

「フォルダ接続」ボタンからローカルフォルダを指定すると、OCR結果・タグ・編集テキストを JSON ファイルとして保存します。

IndexedDB より安全に永続保存でき、フォルダを共有すれば複数の端末でのデータ引き継ぎも可能です。

注意事項

すべての処理はブラウザ内で完結します。画像・テキストが外部に送信されることはありません。
推奨ブラウザは Chrome / Edge です。Safari では一部機能（フォルダ接続など）が動作しない場合があります。
丸数字（①②③など）を含む画像は、OCRが誤認識する場合があります。「丸数字 → アラビア数字に変換」トグルをオフにすると、元の文字で認識します。
画像の解像度が低い場合や、手書き文字・装飾フォントは、OCRの精度が下がる場合があります。テキスト編集機能で手動補正してご利用ください。