MUTools

サイトメタ情報抽出

サイトメタ情報抽出ツールは、複数のページから SEO に関わる主要なメタ情報をまとめて取り出すツールです。 1 行に 1 URL の形式で最大 10 件まで指定でき、結果は表形式で表示できるほか、 CSV ファイルとしてダウンロードできます。

入力中 0 / 10 件
「抽出する」ボタンを押すと、ここに結果テーブルが表示されます。

入力 URL はサーバーから取得して HTML を解析します。プライベート IP・localhost への接続は拒否されます。

各 URL の取得は 8 秒でタイムアウトし、HTML 本文の先頭 2MB のみ読み込みます。

サイトメタ情報抽出ツールとは?

サイトメタ情報抽出ツールは、複数のページから SEO に関わる主要なメタ情報をまとめて取り出すツールです。 1 行に 1 URL の形式で最大 10 件まで指定でき、結果は表形式で表示できるほか、 CSV ファイルとしてダウンロードできます。

抽出される項目は、title・description・robots・canonical URL・HTTP ステータス・最終 URL(リダイレクト後)・lang・charset・viewport・theme-color の 10 項目。SEO チェックリストの一括棚卸しや、サイトリニューアル時の状態比較に役立ちます。

指定された URL のページをサーバー経由で取得して HTML を解析するため、ブラウザの CORS 制限の影響を受けません。クローラなどの Bot ブロックを設定していないサイトであれば、ほぼすべてのページから抽出できます。

使い方

  1. URL 入力欄に、メタ情報を抽出したいページの URL を 1 行に 1 URL ずつ貼り付けます(最大 10 件)。
  2. 「抽出する」ボタンを押すと、各 URL から HTML を取得して解析し、結果が表に表示されます。
  3. テーブルでは title / description / robots / canonical などの値を 1 行ずつ確認できます。
  4. 「ヘッダー名を日本語表記に切り替え」を使うと、テーブルと CSV のヘッダーを日本語に変更できます。
  5. 「CSV ダウンロード」を押すと、抽出結果をスプレッドシートで開ける形式(UTF-8 + BOM)で保存できます。

利用シーン

  • コーポレートサイトの主要ページ(トップ / 製品 / 採用 / お知らせ)の title・description をまとめてチェックしたい SEO 担当者。
  • サイトリニューアル前後でメタ情報がどう変わったかを比較したい Web 制作会社。
  • 競合サイトの上位ページのタイトル設計を一覧で確認したいマーケター。
  • リダイレクト後の最終 URL と HTTP ステータスを確認したい運用担当者。
  • noindex / nofollow の設定漏れがないか、複数ページを一括で監査したい SEO コンサルタント。

注意点

  • 1 リクエストで処理できる URL は最大 10 件です。
  • プライベート IP アドレスや localhost への接続は安全のため拒否されます。
  • 1 URL あたりの取得タイムアウトは 8 秒です。応答が遅いサイトはエラーになる場合があります。
  • HTML の先頭 2MB のみ読み込みます。極端に大きなページではメタタグが取得できないことがあります。
  • JavaScript で動的にメタタグを書き換えるサイト(SPA など)の場合、初期 HTML の値が抽出されます。実際のクローラの挙動と異なる可能性があります。
  • ベーシック認証・Bot ブロック・地域制限のあるサイトは取得できないことがあります。

よくある質問

1 度に処理できる URL は何件までですか?
最大 10 件までです。同時取得の負荷とユーザー体験のバランスから 10 件に固定されています。それ以上のページを処理したい場合は、複数回に分けて実行してください。
CSV はどのアプリで開けますか?
UTF-8(BOM 付き)形式で出力されるため、Microsoft Excel・Google スプレッドシート・LibreOffice Calc・Numbers などで文字化けせず開けます。区切り文字はカンマ、改行は CRLF です。
ログインが必要なページのメタ情報も取得できますか?
取得できません。本ツールは認証情報を持たずに公開ページとして HTML を取得するため、ログインや特定のセッションが必要なページのメタ情報は取得できません。
JavaScript で書き換えるメタタグも取得されますか?
初期 HTML に含まれるメタタグのみ取得します。SPA など、ブラウザ上の JavaScript 実行後にメタタグを差し替えるサイトの場合、最終的な値とは異なる場合があります。Google のクローラは JavaScript を実行するため、本ツールの結果と検索エンジンの認識が一致しないことがある点にご注意ください。
noindex のページも検出できますか?
robots カラムに meta robots タグの値が表示されます。noindex / nofollow / max-snippet などの指定もそのまま取得されるため、設定漏れや想定外の noindex の検出に活用できます。