MUTools

Gambar

Ekstraksi Teks Gambar (OCR) (β)

Alat Ekstraksi Teks Gambar adalah alat OCR (pengenalan karakter optik) yang mengenali teks di dalam gambar dan mengambilnya sebagai teks. Setelah Anda mengunggah foto, tangkapan layar, atau dokumen hasil pindai, alat ini mendeteksi karakter dan mengubahnya menjadi teks yang dapat diedit dan disalin. Tanpa perlu registrasi, gratis digunakan secara online.

Seret & lepas gambar ke sini

atau

Mendukung JPG, PNG, WebP, BMP. Satu gambar per proses (maks. 25 MB).

Semua gambar diproses di dalam browser dan tidak dikirim ke server. Berjalan sepenuhnya di browser Anda.

Hanya data yang diperlukan untuk pengenalan teks yang dimuat melalui internet saat pertama kali digunakan (lalu disimpan di browser dan dipakai ulang). Gambar Anda tidak pernah dikirim ke pihak luar.

Anda juga bisa menempel dari clipboard dengan Cmd / Ctrl + V.

Apa itu alat Ekstraksi Teks Gambar (OCR) (β)?

Alat Ekstraksi Teks Gambar adalah alat OCR (pengenalan karakter optik) yang mengenali teks di dalam gambar dan mengambilnya sebagai teks. Setelah Anda mengunggah foto, tangkapan layar, atau dokumen hasil pindai, alat ini mendeteksi karakter dan mengubahnya menjadi teks yang dapat diedit dan disalin. Tanpa perlu registrasi, gratis digunakan secara online.

Alat ini saat ini berstatus versi beta. Akurasi cenderung tinggi pada foto atau pindaian dokumen berlatar bersih dengan teks yang tajam serta pada tangkapan layar, tetapi pada foto berlatar rumit, font dekoratif, atau gambar yang miring dan buram, akurasi pengenalan mungkin kurang memadai.

Selain bahasa Jepang dan Inggris, alat ini mendukung banyak bahasa seperti Mandarin Sederhana, Mandarin Tradisional, Korea, dan Indonesia, serta dapat mengenali beberapa bahasa sekaligus. Hasil pengenalan bisa langsung diedit di tempat, sehingga Anda dapat memperbaiki kesalahan pengenalan sebelum menyalinnya atau mengunduhnya sebagai berkas .txt. Tersedia juga mode analisis tata letak untuk gambar dengan susunan khusus seperti papan tanda, tabel, dan struk.

Semua gambar yang Anda unggah diproses di dalam browser Anda dan tidak pernah dikirim ke server eksternal (hanya data yang diperlukan untuk pengenalan teks yang dimuat melalui internet saat pertama kali digunakan, lalu disimpan di browser dan dipakai ulang). Dengan begitu, Anda dapat dengan tenang mengekstrak teks dari gambar dokumen rahasia perusahaan maupun yang memuat data pribadi. Berjalan sepenuhnya di browser Anda.

Cara penggunaan

  1. Seret & lepas gambar ke area unggah, atau klik untuk memilih berkas (menempel dari clipboard juga didukung).
  2. Pilih bahasa yang ingin dikenali di sebelah kanan (default-nya Jepang + Inggris; bisa memilih lebih dari satu).
  3. Bila perlu, ubah mode analisis tata letak atau aktifkan "Pertahankan baris baru apa adanya".
  4. Tekan "Ekstrak teks" untuk memulai pengenalan, dan teks hasil ekstraksi akan muncul di sebelah kanan.
  5. Edit hasil bila perlu, lalu ambil dengan "Salin" atau "Unduh .txt".

Skenario penggunaan

  • Pengguna bisnis yang ingin membaca dan mengubah teks dari foto dokumen kertas atau papan tulis menjadi teks.
  • Saat teks di dalam tangkapan layar tidak bisa diseleksi atau disalin, dan Anda ingin mengekstrak teks dari gambar untuk dikutip atau disalin ulang.
  • Saat Anda ingin mengonversi informasi dari kartu nama, struk, atau nota menjadi teks tanpa mengetiknya manual.
  • Saat Anda ingin mengekstrak teks dari papan tanda, menu, atau dokumen berbahasa asing dengan OCR multibahasa sebelum menerjemahkannya.
  • Editor atau penulis yang memotret halaman buku atau brosur lama dan ingin membaca teks pada foto untuk digunakan kembali.

Hal yang perlu diperhatikan

  • Alat ini saat ini berstatus versi beta. Akurasi paling baik pada gambar berlatar bersih dengan teks yang tajam, seperti foto atau pindaian dokumen dan tangkapan layar. Pada foto berlatar rumit, font dekoratif, atau teks yang miring, akurasi pengenalan mungkin kurang memadai.
  • Dapat memproses satu gambar per proses, hingga maksimum 25 MB per berkas (mendukung JPG, PNG, WebP, BMP).
  • Akurasi pengenalan menurun pada teks tulisan tangan serta gambar yang buram, miring, atau beresolusi rendah. Gunakan gambar yang sejelas dan selurus mungkin untuk meningkatkan akurasi.
  • Semakin sedikit bahasa yang dikenali, semakin stabil akurasi dan kecepatannya. Memilih terlalu banyak bahasa sekaligus dapat memperbanyak kesalahan pengenalan.
  • Data yang diperlukan untuk pengenalan teks hanya dimuat melalui internet saat pertama kali digunakan, lalu disimpan di browser dan dipakai ulang. Pemuatan pertama mungkin memerlukan sedikit waktu.
  • OCR tidak sempurna. Tinjau kembali teks setelah ekstraksi dan perbaiki kesalahan pengenalan sebelum digunakan.

Pertanyaan yang sering diajukan

Apakah gambar diunggah ke server?
Tidak. Seluruh pengenalan teks berlangsung sepenuhnya di dalam browser Anda. Hanya data yang diperlukan untuk pengenalan teks yang dimuat melalui internet saat pertama kali digunakan, lalu disimpan di browser dan dipakai ulang, tetapi gambar itu sendiri tidak pernah dikirim ke pihak luar. Anda dapat menggunakannya dengan tenang bahkan untuk gambar dokumen rahasia perusahaan maupun yang memuat data pribadi.
Apakah teks tulisan tangan juga bisa dibaca?
Dibandingkan huruf cetak, akurasi pengenalan tulisan tangan jauh lebih rendah. Kadang masih bisa terbaca, tetapi tulisan sambung atau gaya bebas sulit dikenali. Sebaiknya gunakan gambar tulisan yang rapi atau huruf cetak.
Bagaimana cara meningkatkan akurasi pengenalan?
Akurasi meningkat bila Anda memotret atau memangkas gambar yang tajam dan fokus dengan teks dalam posisi mendatar. Selain itu, batasi bahasa yang dikenali hanya pada bahasa yang benar-benar muncul pada gambar untuk mengurangi kesalahan. Untuk tata letak khusus seperti papan tanda atau tabel, coba juga ganti mode analisis tata letak.
Bahasa dan format gambar apa saja yang didukung?
Mendukung bahasa Jepang, Inggris, Mandarin Sederhana, Mandarin Tradisional, Korea, Indonesia, Prancis, Jerman, Spanyol, dan Portugis, serta beberapa bahasa dapat dipilih sekaligus. Format gambar yang didukung adalah JPG, PNG, WebP, dan BMP.
Apakah teks hasil ekstraksi bisa langsung dipakai?
Hasil ekstraksi dapat langsung diedit di layar. Karena OCR bisa salah mengenali, periksa isinya dan perbaiki bila perlu sebelum menyalin atau mengunduh sebagai .txt.