MUTools

画像

画像テキスト抽出 (β)

画像テキスト抽出ツールは、画像内の文字を認識してテキストとして取り出す OCR(光学文字認識)ツールです。写真・スクリーンショット・スキャンした書類などをアップロードすると、文字を検出して、編集やコピーができるテキストに変換します。会員登録は不要で、オンラインで無料で使えます。

ここに画像をドラッグ&ドロップ

または

JPG・PNG・WebP・BMP 対応。1 回につき 1 枚(最大 25 MB)。

画像はすべてブラウザ内で処理され、サーバーには送信されません。ブラウザだけで完結します。

文字認識に必要なデータのみ、初回にインターネット経由で読み込みます(以降はブラウザに保存され、再ダウンロードは不要です)。画像が外部に送信されることはありません。

クリップボードから Cmd / Ctrl + V でも貼り付けできます。

画像テキスト抽出 (β)ツールとは?

画像テキスト抽出ツールは、画像内の文字を認識してテキストとして取り出す OCR(光学文字認識)ツールです。写真・スクリーンショット・スキャンした書類などをアップロードすると、文字を検出して、編集やコピーができるテキストに変換します。会員登録は不要で、オンラインで無料で使えます。

本ツールは現在ベータ版です。背景が白く文字がくっきりした書類の写真・スキャンやスクリーンショットでは高い精度が出やすい一方、背景が複雑な写真・装飾的なフォント・ゆがみやかすれのある画像では、認識精度が十分に出ないことがあります。

日本語・英語をはじめ、簡体中国語・繁体中国語・韓国語・インドネシア語などの多言語に対応し、複数言語を同時に選んで認識することもできます。認識結果はその場で編集できるので、誤認識を直してからコピーしたり、.txt ファイルとしてダウンロードしたりできます。看板・表・レシートなどレイアウトが特殊な画像向けに、解析モードの切り替えも用意しています。

アップロードした画像はすべて利用者のブラウザ内で処理され、外部サーバーへ送信されることはありません(文字認識に必要なデータのみ、初回にインターネット経由で読み込みます)。社外秘の資料や個人情報を含む画像でも安心して文字起こしできます。ブラウザだけで完結します。

使い方

  1. ドロップ領域に画像をドラッグ&ドロップするか、クリックしてファイルを選択します(クリップボードからの貼り付けにも対応)。
  2. 右側で認識したい言語を選びます(初期値は日本語+英語。複数選択できます)。
  3. 必要に応じてレイアウト解析モードや「改行をそのまま維持する」を切り替えます。
  4. 「テキストを抽出」を押すと文字認識が始まり、右側に抽出テキストが表示されます。
  5. 結果を必要に応じて編集し、「コピー」または「.txt ダウンロード」で取り出します。

利用シーン

  • 紙の資料やホワイトボードを撮影した写真から、文字を読み取ってテキスト化したいビジネスユーザー。
  • スクショ内の文章を選択・コピーできないとき、画像から文字を抽出して引用・転記したい場合。
  • 名刺・レシート・伝票などの情報を手入力せずに、画像からテキストに変換したい場合。
  • 外国語の看板・メニュー・書類を、多言語 OCR で文字起こししてから翻訳に回したい場合。
  • 古い書籍やパンフレットのページを撮影し、写真の文字を読み取って再利用したい編集者・ライター。

注意点

  • 本ツールは現在ベータ版です。書類の写真・スキャンやスクリーンショットのように、背景がすっきりして文字がくっきりした画像で最も精度が出ます。背景が複雑な写真・装飾的なフォント・ゆがんだ文字などでは、認識精度が十分に出ないことがあります。
  • 1 回につき 1 枚、1 ファイルあたり最大 25 MB まで処理できます(JPG・PNG・WebP・BMP 対応)。
  • 手書き文字や、ぼやけた・傾いた・低解像度の画像では認識精度が下がります。なるべく鮮明で水平な画像を使うと精度が上がります。
  • 認識する言語を絞り込むほど精度・速度が安定します。多言語を一度に選びすぎると誤認識が増えることがあります。
  • 文字認識に必要なデータは初回のみインターネット経由で読み込まれ、以降はブラウザに保存されて再利用されます。初回は読み込みに少し時間がかかります。
  • OCR は完全ではありません。抽出後にテキストを見直し、誤認識を修正してからご利用ください。

よくある質問

画像はサーバーにアップロードされますか?
アップロードされません。文字認識はすべてお使いのブラウザ内で完結します。文字認識に必要なデータのみ初回にインターネット経由で読み込みますが、画像そのものが外部へ送信されることはありません。社外秘の資料や個人情報を含む画像でも安心して利用できます。
手書きの文字も読み取れますか?
印刷された活字に比べると、手書き文字の認識精度は大きく下がります。読み取れる場合もありますが、崩し字や続け書きは苦手です。なるべく丁寧に書かれた文字や活字の画像をご利用ください。
認識精度を上げるにはどうすればよいですか?
ピントが合った鮮明な画像を、文字が水平になるように撮影・トリミングすると精度が上がります。また、認識する言語を実際に写っている言語だけに絞ると、誤認識が減ります。看板や表など特殊なレイアウトでは、レイアウト解析モードの切り替えもお試しください。
対応している言語と画像形式を教えてください。
日本語・英語・簡体中国語・繁体中国語・韓国語・インドネシア語・フランス語・ドイツ語・スペイン語・ポルトガル語に対応し、複数言語を同時に選べます。画像形式は JPG・PNG・WebP・BMP に対応しています。
抽出したテキストはそのまま使えますか?
抽出結果は画面上でそのまま編集できます。OCR は誤認識が起こり得るため、コピーや .txt ダウンロードの前に内容を確認し、必要に応じて修正してからご利用ください。