MUTools

웹 분석

사이트 메타 정보 추출

사이트 메타 정보 추출 도구는 여러 페이지에서 SEO와 관련된 주요 메타 정보를 한꺼번에 추출하는 도구입니다. 1줄에 1 URL 형식으로 최대 10건까지 지정할 수 있으며, 결과는 표 형식으로 표시할 수 있을 뿐만 아니라 CSV 파일로 다운로드할 수 있습니다.

입력 중 0 / 10 건
"추출" 버튼을 누르면 여기에 결과 테이블이 표시됩니다.

입력한 URL 은 서버에서 가져와 HTML 을 분석합니다. 프라이빗 IP 와 localhost 로의 접속은 거부됩니다.

각 URL 의 가져오기는 8 초에 타임아웃되며 HTML 본문의 선두 2MB 만 읽어들입니다.

사이트 메타 정보 추출 도구란?

사이트 메타 정보 추출 도구는 여러 페이지에서 SEO와 관련된 주요 메타 정보를 한꺼번에 추출하는 도구입니다. 1줄에 1 URL 형식으로 최대 10건까지 지정할 수 있으며, 결과는 표 형식으로 표시할 수 있을 뿐만 아니라 CSV 파일로 다운로드할 수 있습니다.

추출되는 항목은 title, description, robots, canonical URL, HTTP 상태, 최종 URL(리디렉션 후), lang, charset, viewport, theme-color의 10개 항목입니다. SEO 체크리스트의 일괄 점검이나 사이트 리뉴얼 시의 상태 비교에 도움이 됩니다.

지정된 URL의 페이지를 서버 경유로 가져와 HTML을 분석하므로 브라우저의 CORS 제한 영향을 받지 않습니다. 크롤러 등 봇 차단을 설정하지 않은 사이트라면 거의 모든 페이지에서 추출할 수 있습니다.

사용 방법

  1. URL 입력란에 메타 정보를 추출할 페이지의 URL을 한 줄에 1개씩 붙여넣습니다(최대 10건).
  2. "추출" 버튼을 누르면 각 URL에서 HTML을 가져와 분석하고, 결과가 표에 표시됩니다.
  3. 테이블에서는 title / description / robots / canonical 등의 값을 1줄씩 확인할 수 있습니다.
  4. "헤더명을 한국어 표기로 전환"을 사용하면 테이블과 CSV의 헤더를 한국어로 변경할 수 있습니다.
  5. "CSV 다운로드"를 누르면 추출 결과를 스프레드시트에서 열 수 있는 형식(UTF-8 + BOM)으로 저장할 수 있습니다.

활용 사례

  • 기업 사이트의 주요 페이지(메인 / 제품 / 채용 / 공지)의 title과 description을 한꺼번에 점검하고 싶은 SEO 담당자.
  • 사이트 리뉴얼 전후로 메타 정보가 어떻게 바뀌었는지 비교하고 싶은 웹 제작 회사.
  • 경쟁사 사이트 상위 페이지의 제목 설계를 일람으로 확인하고 싶은 마케터.
  • 리디렉션 후의 최종 URL과 HTTP 상태를 확인하고 싶은 운영 담당자.
  • noindex / nofollow 설정 누락이 없는지 여러 페이지를 일괄 감사하고 싶은 SEO 컨설턴트.

주의사항

  • 1회 요청으로 처리할 수 있는 URL은 최대 10건입니다.
  • 프라이빗 IP 주소나 localhost로의 접속은 안전을 위해 거부됩니다.
  • 1 URL당 가져오기 타임아웃은 8초입니다. 응답이 느린 사이트는 오류가 발생할 수 있습니다.
  • HTML의 앞 2MB만 읽어들입니다. 극단적으로 큰 페이지에서는 메타 태그를 가져오지 못할 수 있습니다.
  • JavaScript로 동적으로 메타 태그를 다시 쓰는 사이트(SPA 등)의 경우 초기 HTML의 값이 추출됩니다. 실제 크롤러의 동작과 다를 수 있습니다.
  • Basic 인증, 봇 차단, 지역 제한이 있는 사이트는 가져오지 못할 수 있습니다.

자주 묻는 질문

한 번에 처리할 수 있는 URL은 몇 건까지인가요?
최대 10건까지입니다. 동시 가져오기 부하와 사용자 경험의 균형에서 10건으로 고정되어 있습니다. 그 이상의 페이지를 처리하려면 여러 번에 걸쳐 실행해 주세요.
CSV는 어떤 앱에서 열 수 있나요?
UTF-8(BOM 포함) 형식으로 출력되므로 Microsoft Excel, Google 스프레드시트, LibreOffice Calc, Numbers 등에서 문자 깨짐 없이 열 수 있습니다. 구분자는 쉼표, 줄바꿈은 CRLF입니다.
로그인이 필요한 페이지의 메타 정보도 가져올 수 있나요?
가져올 수 없습니다. 이 도구는 인증 정보를 가지지 않고 공개 페이지로서 HTML을 가져오므로, 로그인이나 특정 세션이 필요한 페이지의 메타 정보는 가져올 수 없습니다.
JavaScript로 다시 쓰는 메타 태그도 가져올 수 있나요?
초기 HTML에 포함되는 메타 태그만 가져옵니다. SPA 등 브라우저에서 JavaScript 실행 후 메타 태그를 교체하는 사이트의 경우 최종 값과 다를 수 있습니다. Google 크롤러는 JavaScript를 실행하므로 이 도구의 결과와 검색 엔진의 인식이 일치하지 않을 수 있다는 점에 주의해 주세요.
noindex 페이지도 감지할 수 있나요?
robots 컬럼에 meta robots 태그의 값이 표시됩니다. noindex / nofollow / max-snippet 등의 지정도 그대로 가져오므로 설정 누락이나 예상치 못한 noindex의 감지에 활용할 수 있습니다.