티스토리 블로그에서 구글 PageSpeed Insight의 크롤링 오류 발생

category > IT/티스토리

무찌마 / 2022. 11. 8. / 댓글

2022년 11월 8일 발생

링크를 크롤링할 수 없음

검색엔진에서 링크에 대해 `href` 속성을 사용하여 웹사이트를 크롤링할 수 있습니다. 앵커 요소의 `href` 속성이 적절한 대상에 연결되어 사이트에서 더 많은 페이지가 검색되도록 하세요. 자세히 알아보기
크롤링할 수 없는 링크
div.lb-outerContainer > div.lb-container > div.lb-nav > a.lb-prev
<a class="lb-prev" href="">
div.lb-outerContainer > div.lb-container > div.lb-nav > a.lb-next
<a class="lb-next" href="">
div.lb-outerContainer > div.lb-container > div.lb-loader > a.lb-cancel
<a class="lb-cancel">
div.lb-dataContainer > div.lb-data > div.lb-closeContainer > a.lb-close
<a class="lb-close">

 

 

2022년 11월 8일

 

티스토리 블로그에 대한 Google PageSpeed Insights 테스트에서 발견한 오류입니다.

위의 코드들은 개별 블로그 페이지에 티스토리 서버가 삽입하는 각종 링크 버튼으로 추정합니다. 티스토리 관리팀이 해결해야 하는 문제입니다.

 

  이 글을 올리고 갑자기 문제의 원인이 서버에만 국한되지 않을 수 있다는 생각이 떠올랐습니다. 페이지에 해당 코드를 삽입할 수 있는 것으로 애드핏과 애드센스의 광고 출력용 스크립트, 그리고 개인이 스킨에 추가한 각종 스크립트, 또한 구글 PageSpeed Insights에서 사용하는 Lighthouse 사이트 분석 도구도 추가되기 때문입니다.

그래서 구글 검색하니까 lb-prev, lb-next, lb-cancel, lb-close 링크용 코드를 Lightbox에 관련된 파일에서 사용한다는 것을 발견하였습니다.
※ Lightbox는 현재 페이지에 이미지를 오버레이 배치하는 플러그인이며 CSS와 JS를 사용합니다.

Lightbox2 (lokeshdhakar.com)
GITHUB에 등록된 "The original lightbox script"라는 페이지입니다.

어쨌든 티스토리 서버는 오류를 발생시킬 수 있는 원인 중의 하나일 뿐이라는 것입니다. 좀 더 자세하게 분석해 보아야 합니다.

Google PageSpeed Insights의 도움말 링크에서 제공하는 가능성 있는 오류 발생 원인에 대한 설명입니다. 

 

① Google 크롤러(bot)이 추적 가능한 형식의 <a> 태그 링크 사용

 

Google 크롤러의 추적 코드 형식

 

② Google bot(크롤러)가 인식 가능한 실제 웹 주소 사용

 

Googlebot이 추적 불가능한 URL

댓글