MUTools

Analisis Web

Ekstraksi Metadata Situs

Alat Ekstraksi Metadata Situs adalah alat untuk mengambil metadata utama yang berkaitan dengan SEO dari beberapa halaman sekaligus. Anda dapat menentukan hingga 10 URL dengan format satu URL per baris, dan hasilnya dapat ditampilkan dalam bentuk tabel maupun diunduh sebagai berkas CSV.

Dimasukkan 0 / 10
Tekan tombol "Ekstrak" untuk menampilkan tabel hasil di sini.

URL yang dimasukkan dimuat untuk menganalisis HTML-nya. Koneksi ke IP privat atau localhost akan ditolak.

Pemuatan setiap URL akan timeout dalam 8 detik dan hanya membaca 2MB pertama dari isi HTML.

Apa itu alat Ekstraksi Metadata Situs?

Alat Ekstraksi Metadata Situs adalah alat untuk mengambil metadata utama yang berkaitan dengan SEO dari beberapa halaman sekaligus. Anda dapat menentukan hingga 10 URL dengan format satu URL per baris, dan hasilnya dapat ditampilkan dalam bentuk tabel maupun diunduh sebagai berkas CSV.

Item yang diekstrak berjumlah 10, yaitu: title, description, robots, canonical URL, status HTTP, URL akhir (setelah pengalihan), lang, charset, viewport, dan theme-color. Alat ini berguna untuk inventarisasi menyeluruh checklist SEO maupun untuk membandingkan kondisi saat pembaruan situs.

Karena halaman dari URL yang ditentukan dimuat untuk menganalisis HTML-nya, alat ini tidak terpengaruh oleh pembatasan CORS pada browser. Selama situs tidak menerapkan pemblokiran bot seperti terhadap crawler, hampir semua halaman dapat diekstrak.

Cara penggunaan

  1. Pada kolom input URL, tempel URL halaman yang ingin diekstrak metadatanya, satu URL per baris (maksimal 10).
  2. Tekan tombol "Ekstrak", maka HTML dari setiap URL akan dimuat dan dianalisis, lalu hasilnya ditampilkan dalam tabel.
  3. Pada tabel, Anda dapat memeriksa nilai title / description / robots / canonical dan lainnya baris per baris.
  4. Dengan menggunakan "Beralih nama header ke bahasa Jepang", Anda dapat mengubah header tabel dan CSV ke bahasa Jepang.
  5. Tekan "Unduh CSV" untuk menyimpan hasil ekstraksi dalam format yang dapat dibuka di spreadsheet (UTF-8 + BOM).

Skenario penggunaan

  • Penanggung jawab SEO yang ingin memeriksa title dan description halaman-halaman utama situs perusahaan (beranda / produk / karier / berita) sekaligus.
  • Agensi pembuatan web yang ingin membandingkan bagaimana metadata berubah sebelum dan sesudah pembaruan situs.
  • Marketer yang ingin melihat dalam satu daftar bagaimana desain judul halaman teratas situs kompetitor.
  • Penanggung jawab operasional yang ingin memeriksa URL akhir setelah pengalihan dan status HTTP-nya.
  • Konsultan SEO yang ingin mengaudit beberapa halaman sekaligus untuk memastikan tidak ada pengaturan noindex / nofollow yang terlewat.

Hal yang perlu diperhatikan

  • URL yang dapat diproses dalam satu permintaan maksimal 10.
  • Koneksi ke alamat IP privat atau localhost akan ditolak demi keamanan.
  • Batas waktu pemuatan per URL adalah 8 detik. Situs yang lambat merespons dapat menghasilkan error.
  • Hanya 2MB pertama dari HTML yang dibaca. Pada halaman yang sangat besar, meta tag terkadang tidak dapat diambil.
  • Untuk situs yang mengubah meta tag secara dinamis dengan JavaScript (seperti SPA), nilai dari HTML awal yang akan diekstrak. Hasilnya mungkin berbeda dari perilaku crawler sebenarnya.
  • Situs dengan autentikasi Basic, pemblokiran bot, atau pembatasan wilayah terkadang tidak dapat dimuat.

Pertanyaan yang sering diajukan

Berapa banyak URL yang dapat diproses sekaligus?
Maksimal 10. Jumlah ini ditetapkan 10 demi keseimbangan antara beban pemuatan bersamaan dan pengalaman pengguna. Jika ingin memproses lebih banyak halaman, jalankan dalam beberapa kali.
Dengan aplikasi apa CSV dapat dibuka?
Karena dihasilkan dalam format UTF-8 (dengan BOM), berkas dapat dibuka tanpa karakter rusak di Microsoft Excel, Google Spreadsheet, LibreOffice Calc, Numbers, dan lainnya. Pemisahnya adalah koma dan baris barunya CRLF.
Apakah metadata halaman yang memerlukan login juga dapat diambil?
Tidak dapat. Karena alat ini memuat HTML sebagai halaman publik tanpa membawa informasi autentikasi, metadata halaman yang memerlukan login atau sesi tertentu tidak dapat diambil.
Apakah meta tag yang diubah dengan JavaScript juga diambil?
Hanya meta tag yang ada dalam HTML awal yang diambil. Untuk situs seperti SPA yang mengganti meta tag setelah JavaScript dijalankan di browser, nilainya mungkin berbeda dari nilai akhir. Perlu diperhatikan bahwa crawler Google menjalankan JavaScript, sehingga hasil alat ini terkadang tidak sesuai dengan apa yang dikenali mesin pencari.
Apakah halaman noindex juga dapat dideteksi?
Nilai meta robots tag ditampilkan pada kolom robots. Karena penentuan seperti noindex / nofollow / max-snippet juga diambil apa adanya, alat ini dapat dimanfaatkan untuk mendeteksi pengaturan yang terlewat atau noindex yang tidak terduga.