網站元資訊擷取

網站元資訊擷取工具是一款從多頁中一併取出 SEO 相關主要元資訊的工具。可依每行 1 個 URL 的形式指定最多 10 個,結果可以表格形式顯示,也可下載為 CSV 檔案。

URL(每行 1 個,最多 10 個)

已輸入 0 / 10 個

按下「開始擷取」按鈕後,結果表格將顯示在這裡。

輸入的 URL 會透過伺服器取得並解析 HTML。對私有 IP 或 localhost 的連線會被拒絕。

每個 URL 的取得會在 8 秒後逾時,僅讀取 HTML 主體的前 2 MB。

從 URL 擷取 OGP / Twitter Card,並預覽在 X 與 Facebook 中分享卡片的呈現。

從 URL 批次擷取 title / description / h1~h6,並提供 SEO 診斷與 CSV 下載。

彙總顯示您的全球 IP、來源國家 / 地區、主機名稱以及裝置 / 瀏覽器資訊。

對網域 / URL / IP(最多 10 個)批次取得註冊日期、到期日期、剩餘天數、名稱伺服器、註冊商、DNSSEC 等 Whois 資訊,並可下載為 CSV。

網站元資訊擷取是什麼?

擷取項目共 10 項: title、description、robots、canonical URL、HTTP 狀態、最終 URL(重新導向後)、lang、charset、viewport、theme-color。可用於一次性盤點 SEO 檢查表,或網站改版時的狀態比較。

由於指定的 URL 頁面會透過伺服器取得並解析 HTML,因此不會受到瀏覽器 CORS 限制的影響。只要目標站未對爬蟲等 Bot 進行封鎖,幾乎所有頁面皆可被擷取。

1 次最多可處理多少個 URL?

最多 10 個。出於並行負載與使用者體驗的平衡固定為 10 個。如需處理更多頁面,請分多次執行。

CSV 可用什麼應用程式開啟?

以 UTF-8(附 BOM)格式輸出,可在 Microsoft Excel、Google 試算表、LibreOffice Calc、Numbers 等中不亂碼開啟。分隔符為逗號,換行為 CRLF。

需要登入的頁面也能取得元資訊嗎?

無法取得。本工具不持有任何驗證資訊,以公開頁面方式取得 HTML,因此無法取得需要登入或特定工作階段的頁面的元資訊。

透過 JavaScript 改寫的 meta 標籤也會被取得嗎?

僅取得初始 HTML 中的 meta 標籤。SPA 等在瀏覽器 JavaScript 執行後再替換 meta 標籤的站點,結果可能與最終值不同。Google 爬蟲會執行 JavaScript,因此本工具的結果與搜尋引擎所識別的可能不一致,請特別留意。

也能偵測 noindex 頁面嗎?

robots 欄會顯示 meta robots 標籤的值。noindex / nofollow / max-snippet 等指定也會原樣取得,可用於發現設定漏失或意外的 noindex。