Extxt(エクステキスト)の機能と操作方法を説明します

アプリを開く
Extxt(エクステキスト)について

Extxt(エクステキスト)は画像の中に含まれるテキストをOCR(光学文字認識)で自動的に読み取り、キーワードで横断検索できるツールです。
Extxtは、Extract(抽出)とText(テキスト)を組み合わせた造語で、画像からテキストを「抽出」して活用することをコンセプトにしています。
すべての処理はブラウザ内で完結するため、画像やテキストが外部のサーバーに送信されることはありません。インターネット接続は、初回の言語モデル読み込み時のみ必要です。

アプリを開く
基本的な使い方
Step 1
画像をアップロード
ページ上部のアップロードエリアに、テキストが含まれる画像をドラッグ&ドロップするか、「ファイルを選択」ボタンから選んでください。PNG・JPG・WEBP・GIF 形式に対応しており、複数ファイルを一度にまとめて追加できます。

アップロード済みの画像はサムネイル一覧で確認できます。不要な画像は、サムネイル右上の × ボタンで個別に削除できます。
Step 2
設定 & 読み取り
認識したい言語(日本語・英語)をバッジで選択し、「テキストを読み取る」ボタンをクリックしてください。複数枚の画像がある場合は、順番に自動で処理されます。進行状況はプログレスバーで確認できます。

読み取りが完了すると、各サムネイルの枠がグリーンに変わります。
初回実行時は、言語モデルのダウンロードが発生します(日本語 約20MB・英語 約4MB)。2回目以降はキャッシュされるため、すばやく処理が始まります。
Step 3
テキストを検索
読み取りが完了したら、検索バーにキーワードを入力してください。アップロードしたすべての画像のOCR結果を横断して検索し、一致した箇所を黄色くハイライト表示します。

検索結果のカードをクリックすると、画像とテキストの詳細を展開して確認できます。
便利な機能
タグで管理する
各画像に任意のタグを付けることができます。検索バーの下に表示されるタグフィルターをクリックすると、そのタグが付いた画像だけに絞り込んで検索できます。プロジェクト名やカテゴリなど、自由に分類にお使いください。
OCRテキストを手動で修正する
OCRの読み取り結果が正確でない場合、テキストを直接編集できます。検索結果カードを展開し、テキストエリアを修正して「編集を保存」ボタンをクリックしてください。編集したテキストは次回から検索対象になります。
確認済みマークをつける
画像ごとに「確認済み / 未確認」のステータスを管理できます。大量の画像を処理する際、レビューの進捗管理にご活用ください。
テキストをエクスポートする
OCR結果をCSVファイルまたはテキストファイルとして書き出せます。他のツールへのデータ連携や、記録の保存にご利用ください。
データの保存について
IndexedDB(デフォルト)
フォルダを接続しない場合、OCR結果・タグ・編集内容はブラウザの IndexedDB に自動保存されます。次回ページを開いたとき、同じ画像が自動的に復元され、再読み取りなしにすぐ検索できます。

ただし、ブラウザのデータを削除すると消えるためご注意ください。
フォルダ接続(推奨)
「フォルダ接続」ボタンからローカルフォルダを指定すると、OCR結果・タグ・編集テキストを JSON ファイルとして保存します。

IndexedDB より安全に永続保存でき、フォルダを共有すれば複数の端末でのデータ引き継ぎも可能です。
注意事項