Strona główna SEO Przewodnik po raporcie indeksowania w Google Search Console

Przewodnik po raporcie indeksowania w Google Search Console

Autor InClick

Google Search Console to skarbnica wiedzy na temat Twojej strony. W zasadzie w każdej zakładce uzyskasz cenne informacje, które możesz wykorzystać, planując kolejne działania zmierzające do optymalizacji witryny pod SEO, a także przy eliminowaniu błędów. Jak powinieneś interpretować te dane? Jak do nich podejść? Sprawdź nasz przewodnik po raporcie indeksowania w GSC.

Raport indeksowania w Google Search Console

Szczegóły dotyczące indeksowania witryny przez Google zaczęły się pojawiać w GSC w styczniu 2018 roku. Duże zmiany zgodne z oczekiwaniami użytkowników wprowadzano 3 lata później – w styczniu 2021 roku. Celem było zmniejszenie informacji ogólnych, a dodanie konkretnych, na podstawie których webmaster widział m.in., jaka jest przyczyna problemów z indeksowaniem.

Zanim strona trafi do Google, najpierw musi być odnaleziona przez robota wyszukiwarki, który następnie przeanalizuje możliwość jej indeksacji i jeśli wszystko będzie w porządku, to strona trafi do indeksu Google. Następnie może być wyświetlana w wynikach wyszukiwania na zapytania, dla których zostanie oceniona przez algorytm jako dobra odpowiedź.

Po zalogowaniu się do Google Search Console w menu Indeks znajdziesz opcje Stan, Mapy witryn i Usunięcia – zajmiemy się wyłącznie pierwszą z nich. Dostarcza ona mnóstwo danych, które możesz wykorzystać, analizując indeksowanie strony oraz pojawiające się błędy.

Źródło: Google Search Console

Po kliknięciu opcji Stan wyświetli Ci się wykres, nad którym są 4 różne opcje. Klikając je, powodujesz, że dotyczące ich dane również pojawiają się na tym wykresie. Co one oznaczają?

Źródło: Google Search Console

  1. Błąd – to strony, których z jakiegoś powodu nie udało się zindeksować. Koniecznie sprawdź, jakie są przyczyny w danym przypadku. Czy na pewno te materiały miały nie być zindeksowane?
  2. Prawidłowe z ostrzeżeniem – dotyczy stron, które udało się zindeksować, ale pojawiły się jakieś błędy i Google nie wie, czy były one zamierzone. Warto je sprawdzić, gdyż materiały te wyświetlają się w SERP-ach, a być może Twoje założenie było inne.
  3. Prawidłowe – indeksacja w tym przypadku przeszła bez problemów.
  4. Wykluczono – to strony, które celowo nie zostały zindeksowane.

Zerknij na opcję, która jest widoczna nad wykresem – Wszystkie znane strony. Możesz ją zmienić na Wszystkie przesłane strony i wtedy wyświetlone dane będą dotyczyć wyłącznie URL-ów, które znajdują się w mapach witryny. Następnie możesz wybrać poszczególne mapy oraz sprawdzić, jakie są dane dla konkretnych stron.

Źródło: Google Search Console

Błędy indeksowania – możliwe przyczyny

Przyczyn wykluczenia strony z indeksowania może być wiele. Warto, abyś wiedział, co oznaczają poszczególne błędy i czy powinieneś w ich przypadku reagować.

Źródło: Google Search Console

W przypadku poszczególnych błędów i adresów URL możesz zapoznać się ze szczegółami. Zobaczysz, kiedy robot po raz ostatni odwiedził stronę oraz dlaczego jej nie zindeksował. W przypadku gdy nie tak powinno być i usunąłeś przyczynę problemu, wprowadziłeś zmiany, kliknij Poproś o zindeksowanie.

Źródło: Google Search Console

Ogólnie, jeśli wprowadzasz zmiany, które mają na celu usunięcie błędów, to zwracaj uwagę na wykresy, które widzisz w kolumnie trend pod głównym wykresem z danymi. Na tej podstawie możesz wywnioskować, czy naniesione modyfikacje przynoszą oczekiwany skutek.

Źródło: Google Search Console

Dane możesz też sprawdzać dla konkretnego adresu URL na Twojej stronie. Dodaj ten adres w polu Sprawdź dowolny URL w…

Źródło: Google Search Console

Jeśli wykryto błąd, to od razu możesz sprawdzić, na czym on polega. Kiedy uda się go naprawić, poproś o zindeksowanie materiału.

Raport dotyczący stanu indeksowania powinieneś monitorować systematycznie – raz na kilka tygodni. Natomiast jeśli wprowadzałeś zmiany w adresach URL, w strukturze strony lub podejmowałeś inne kroki, które mogą mieć wpływ na indeksowanie zasobów witryny, to rób to częściej.

Co oznaczają poszczególne komunikaty w raporcie indeksowania?

Jak widzisz, Google Search Console może Ci wyświetlić wiele różnych problemów związanych z indeksowaniem witryny. Powinieneś wiedzieć, jak na nie reagować i co one oznaczają. Zacznijmy od możliwych przyczyn błędów:

  • Błędy 5xx – w razie ich występowania robot Google będzie mieć problem z indeksacją treści. Najczęściej przyczyna leży po Twojej stronie. Na przykład błąd może pojawić się po aktualizacji pluginów lub innych zmianach w witrynie. Analizę przyczyn rozpocznij od tego, co zmieniło się w ostatnim czasie na stronie.
  • Błąd 404 – występuje, gdy dany adres URL został usunięty. Jeśli to przypadek, to powinieneś go przywrócić. Natomiast jeśli to nie jest błąd, np. usunąłeś w sklepie jakiś produkt, lepiej skorzystaj z przekierowania 301, aby internaucie wyświetlał się inny, podobny artykuł z Twojej oferty.
  • Strona zawiera przekierowanie – przekierowania mają zastosowanie głównie wtedy, gdy chcesz przenieść użytkownika z jednej podstrony na inną, np. ze względu na usunięcie niedostępnego już w sklepie produktu albo połączenia kilku podobnych artykułów w jeden. Wiązać się mogą z tym przeróżne błędy, które można popełnić. Zalicza się do nich łańcuch przekierowań, czyli sytuacja, w której A przekierowuje B, a B na C, zamiast A i B na C. Innym możliwym błędem jest pętla przekierowań, kiedy adresy URL przekierowują na siebie, np. A na B, a B na A. Rozwiązanie tego błędu polega oczywiście na usunięciu zbędnych przekierowań.
  • Blokada w pliku robots.txt – w tym pliku dodajesz wytyczne dla botów wyszukiwarek. Wskazujesz im, które adresy URL mają indeksować, a których nie. To nie oznacza, że robot Google ich nie zindeksuje, ale wtedy URL zostanie zindeksowany bez opisu. Żeby naprawić ten błąd, dodaj lub usuń odpowiednie dyrektywy w robots.txt.

Źródło: https://developers.google.com/search/docs/advanced/robots/intro?hl=pl

  • Strona wykluczona za pomocą tagu noindex – te podstrony nie trafią do indeksu Google z tego powodu, że dodałeś w sekcji <head> lub w nagłówku odpowiedzi HTTP tag noindex. Sposobem na rozwiązanie problemu, o ile te materiały mają trafić do indeksu, jest oczywiście usunięcie tego tagu.
  • Pozorny błąd 404 – w przypadku tego błędu serwer zwraca kod 200, co oznacza, że wszystko jest w porządku. Natomiast w praktyce użytkownik jest kierowany na stronę, która nie istnieje, zawiera niewielką ilość treści lub jest pusta. W takim przypadku serwer nie powinien zwracać kodu 200, tylko 404, 410 lub powinno być tam ustawione przekierowanie 301. To niekorzystna sytuacja – jeśli na Twojej witrynie są wykrywane takie przypadki, to wprowadź takie zmiany, aby strona zwracała jeden ze wspomnianych kodów. W przypadku gdy problem nie znika, skorzystaj z opcji sprawdzania adresów URL w GSC i sprawdź renderowane treści. Jeśli strona jest pusta, to być może odwołuje się do innych zasobów i z tego wynika błąd 404.
  • Nieautoryzowane żądanie – strona może zwracać błąd 401, który wynika z wymogu podania loginu i hasła, aby zapoznać się z danym materiałem. W takim przypadku rozwiązaniem jest usunięcie tego wymogu lub zapewnienie dostępu robotowi Google bez konieczności wprowadzania danych.
  • Błąd 403 – może wynikać z wielu błędów, które najczęściej mają źródło na samej stronie. 403 może być efektem aktualizacji pluginów, błędu w pliku .htaccess, infekcji w witrynie i wielu innych. Efektem jest wyświetlenie, zamiast oczekiwanego materiału, strony błędu 403. W takim przypadku robot Google nie uzyskuje dostępu do tego zasobu i nie może go zindeksować.
  • Strona zindeksowana bez treści – ten problem występuje wówczas, gdy Google zindeksowało dany materiał, ale nie może odczytać jego zawartości. Przyczyną kłopotu może być np. cloaking, czyli prezentowanie innej wersji strony robotowi wyszukiwarki, a innej użytkownikowi. Może również chodzić o taki format strony, którego bot nie zindeksuje.
  • Zablokowane przez narzędzia do usuwania stron – oznacza to, że skorzystałeś z funkcji Usunięcia, którą w GSC możesz znaleźć w tym samym menu, w którym znajduje się opcja Stan. Pamiętaj, że to nie jest skuteczna metoda wykluczania contentu z wyników Google. Najczęściej po 90 dniach bot może ją ponownie zindeksować. Jeśli chcesz, aby dany materiał trwale zniknął z Google, to usuń go ze strony albo skorzystaj z tagu noindex.
  • Strona zeskanowana, ale jeszcze niezindeksowana – oznacza to, że robot odwiedził daną stronę, ale jeszcze nie zdecydował, czy ją zindeksuje. Być może wszystko jest w porządku, ale indeksacja została odłożona na później, a może dany URL został oceniony jako niskiej jakości i robot zajął się analizowaniem innych materiałów.
  • Strona wykryta, ale obecnie niezindeksowana – tutaj podobnie jak powyżej, wszystko może być w porządku, ale indeksacja została odłożona na później. Robot mógł również zainteresować się innymi materiałami na stronie, które są lepiej podlinkowane, i ocenił, że to te zasoby powinny być zindeksowane jako pierwsze.
  • Alternatywna strona zawierająca prawidłowy tag strony kanonicznej – dana strona jest duplikatem innej i prawidłowo wskazuje za pomocą linku kanonicznego na oryginalną treść. Brak indeksacji w tym przypadku jest uzasadniony. To nie wymaga żadnej reakcji z Twojej strony, chyba że dany materiał powinien być indeksowany, a link kanoniczny wskazuje na inną stronę przez błąd.
  • Duplikat, przesłany URL nie został oznaczony jako strona kanoniczna – oznacza to, że w serwisie znajdują się duplikaty danego materiału i nie określono, która wersja jest kanoniczna, tzn. oryginalna. W takim przypadku powinieneś za pomocą tagu rel=”canonical” ustalić, która podstrona jest tą kanoniczną.
  • Zablokowany z powodu innego błędu 4xx – sprawdź, jaki występuje w poszczególnych przypadkach i spróbuj sobie z nim poradzić.

Raport stanu indeksowania w GSC – podsumowanie

Dane, które są zgromadzone w opisywanej zakładce, mogą Ci pomóc w rozwiązaniu przeróżnych problemów z działaniem Twojej witryny, a przede wszystkim z ich odnalezieniem. Warto w miarę systematycznie zaglądać do tych danych, szczególnie po wprowadzonych zmianach w strukturze strony czy też po modyfikacjach ważnych plików, m.in. .htaccess.

Skomentuj

Inne ciekawe tematy

Call Now Button 606 628 628