Strona główna Darmowe porady SEO Przewodnik po raporcie indeksowania w Google Search Console

Przewodnik po raporcie indeksowania w Google Search Console

Autor InClick

Google Search Console to skarbnica wiedzy na temat Twojej strony. W zasadzie w każdej zakładce uzyskasz cenne informacje, które możesz wykorzystać, planując kolejne działania zmierzające do optymalizacji witryny pod SEO, a także przy eliminowaniu błędów. Jak powinieneś interpretować te dane? Jak do nich podejść? Sprawdź nasz przewodnik po raporcie indeksowania w GSC.

Raport indeksowania w Google Search Console

Szczegóły dotyczące indeksowania witryny przez Google zaczęły się pojawiać w GSC w styczniu 2018 roku. Duże zmiany zgodne z oczekiwaniami użytkowników wprowadzano 3 lata później – w styczniu 2021 roku. Celem było zmniejszenie informacji ogólnych, a dodanie konkretnych, na podstawie których webmaster widział m.in., jaka jest przyczyna problemów z indeksowaniem.

Zanim strona trafi do Google, najpierw musi być odnaleziona przez robota wyszukiwarki, który następnie przeanalizuje możliwość jej indeksacji i jeśli wszystko będzie w porządku, to strona trafi do indeksu Google. Następnie może być wyświetlana w wynikach wyszukiwania na zapytania, dla których zostanie oceniona przez algorytm jako dobra odpowiedź.

Po zalogowaniu się do Google Search Console w menu Indeks znajdziesz opcje Stan, Mapy witryn i Usunięcia – zajmiemy się wyłącznie pierwszą z nich. Dostarcza ona mnóstwo danych, które możesz wykorzystać, analizując indeksowanie strony oraz pojawiające się błędy.

Źródło: Google Search Console

Po kliknięciu opcji Stan wyświetli Ci się wykres, nad którym są 4 różne opcje. Klikając je, powodujesz, że dotyczące ich dane również pojawiają się na tym wykresie. Co one oznaczają?

Źródło: Google Search Console

  1. Błąd – to strony, których z jakiegoś powodu nie udało się zindeksować. Koniecznie sprawdź, jakie są przyczyny w danym przypadku. Czy na pewno te materiały miały nie być zindeksowane?
  2. Prawidłowe z ostrzeżeniem – dotyczy stron, które udało się zindeksować, ale pojawiły się jakieś błędy i Google nie wie, czy były one zamierzone. Warto je sprawdzić, gdyż materiały te wyświetlają się w SERP-ach, a być może Twoje założenie było inne.
  3. Prawidłowe – indeksacja w tym przypadku przeszła bez problemów.
  4. Wykluczono – to strony, które celowo nie zostały zindeksowane.

Zerknij na opcję, która jest widoczna nad wykresem – Wszystkie znane strony. Możesz ją zmienić na Wszystkie przesłane strony i wtedy wyświetlone dane będą dotyczyć wyłącznie URL-ów, które znajdują się w mapach witryny. Następnie możesz wybrać poszczególne mapy oraz sprawdzić, jakie są dane dla konkretnych stron.

Źródło: Google Search Console

Błędy indeksowania – możliwe przyczyny

Przyczyn wykluczenia strony z indeksowania może być wiele. Warto, abyś wiedział, co oznaczają poszczególne błędy i czy powinieneś w ich przypadku reagować.

Źródło: Google Search Console

W przypadku poszczególnych błędów i adresów URL możesz zapoznać się ze szczegółami. Zobaczysz, kiedy robot po raz ostatni odwiedził stronę oraz dlaczego jej nie zindeksował. W przypadku gdy nie tak powinno być i usunąłeś przyczynę problemu, wprowadziłeś zmiany, kliknij Poproś o zindeksowanie.

Źródło: Google Search Console

Ogólnie, jeśli wprowadzasz zmiany, które mają na celu usunięcie błędów, to zwracaj uwagę na wykresy, które widzisz w kolumnie trend pod głównym wykresem z danymi. Na tej podstawie możesz wywnioskować, czy naniesione modyfikacje przynoszą oczekiwany skutek.

Źródło: Google Search Console

Dane możesz też sprawdzać dla konkretnego adresu URL na Twojej stronie. Dodaj ten adres w polu Sprawdź dowolny URL w…

Źródło: Google Search Console

Jeśli wykryto błąd, to od razu możesz sprawdzić, na czym on polega. Kiedy uda się go naprawić, poproś o zindeksowanie materiału.

Raport dotyczący stanu indeksowania powinieneś monitorować systematycznie – raz na kilka tygodni. Natomiast jeśli wprowadzałeś zmiany w adresach URL, w strukturze strony lub podejmowałeś inne kroki, które mogą mieć wpływ na indeksowanie zasobów witryny, to rób to częściej.

Co oznaczają poszczególne komunikaty w raporcie indeksowania?

Jak widzisz, Google Search Console może Ci wyświetlić wiele różnych problemów związanych z indeksowaniem witryny. Powinieneś wiedzieć, jak na nie reagować i co one oznaczają. Zacznijmy od możliwych przyczyn błędów:

  • Błędy 5xx – w razie ich występowania robot Google będzie mieć problem z indeksacją treści. Najczęściej przyczyna leży po Twojej stronie. Na przykład błąd może pojawić się po aktualizacji pluginów lub innych zmianach w witrynie. Analizę przyczyn rozpocznij od tego, co zmieniło się w ostatnim czasie na stronie.
  • Błąd 404 – występuje, gdy dany adres URL został usunięty. Jeśli to przypadek, to powinieneś go przywrócić. Natomiast jeśli to nie jest błąd, np. usunąłeś w sklepie jakiś produkt, lepiej skorzystaj z przekierowania 301, aby internaucie wyświetlał się inny, podobny artykuł z Twojej oferty.
  • Strona zawiera przekierowanie – przekierowania mają zastosowanie głównie wtedy, gdy chcesz przenieść użytkownika z jednej podstrony na inną, np. ze względu na usunięcie niedostępnego już w sklepie produktu albo połączenia kilku podobnych artykułów w jeden. Wiązać się mogą z tym przeróżne błędy, które można popełnić. Zalicza się do nich łańcuch przekierowań, czyli sytuacja, w której A przekierowuje B, a B na C, zamiast A i B na C. Innym możliwym błędem jest pętla przekierowań, kiedy adresy URL przekierowują na siebie, np. A na B, a B na A. Rozwiązanie tego błędu polega oczywiście na usunięciu zbędnych przekierowań.
  • Blokada w pliku robots.txt – w tym pliku dodajesz wytyczne dla botów wyszukiwarek. Wskazujesz im, które adresy URL mają indeksować, a których nie. To nie oznacza, że robot Google ich nie zindeksuje, ale wtedy URL zostanie zindeksowany bez opisu. Żeby naprawić ten błąd, dodaj lub usuń odpowiednie dyrektywy w robots.txt.

Źródło: https://developers.google.com/search/docs/advanced/robots/intro?hl=pl

  • Strona wykluczona za pomocą tagu noindex – te podstrony nie trafią do indeksu Google z tego powodu, że dodałeś w sekcji <head> lub w nagłówku odpowiedzi HTTP tag noindex. Sposobem na rozwiązanie problemu, o ile te materiały mają trafić do indeksu, jest oczywiście usunięcie tego tagu.
  • Pozorny błąd 404 – w przypadku tego błędu serwer zwraca kod 200, co oznacza, że wszystko jest w porządku. Natomiast w praktyce użytkownik jest kierowany na stronę, która nie istnieje, zawiera niewielką ilość treści lub jest pusta. W takim przypadku serwer nie powinien zwracać kodu 200, tylko 404, 410 lub powinno być tam ustawione przekierowanie 301. To niekorzystna sytuacja – jeśli na Twojej witrynie są wykrywane takie przypadki, to wprowadź takie zmiany, aby strona zwracała jeden ze wspomnianych kodów. W przypadku gdy problem nie znika, skorzystaj z opcji sprawdzania adresów URL w GSC i sprawdź renderowane treści. Jeśli strona jest pusta, to być może odwołuje się do innych zasobów i z tego wynika błąd 404.
  • Nieautoryzowane żądanie – strona może zwracać błąd 401, który wynika z wymogu podania loginu i hasła, aby zapoznać się z danym materiałem. W takim przypadku rozwiązaniem jest usunięcie tego wymogu lub zapewnienie dostępu robotowi Google bez konieczności wprowadzania danych.
  • Błąd 403 – może wynikać z wielu błędów, które najczęściej mają źródło na samej stronie. 403 może być efektem aktualizacji pluginów, błędu w pliku .htaccess, infekcji w witrynie i wielu innych. Efektem jest wyświetlenie, zamiast oczekiwanego materiału, strony błędu 403. W takim przypadku robot Google nie uzyskuje dostępu do tego zasobu i nie może go zindeksować.
  • Strona zindeksowana bez treści – ten problem występuje wówczas, gdy Google zindeksowało dany materiał, ale nie może odczytać jego zawartości. Przyczyną kłopotu może być np. cloaking, czyli prezentowanie innej wersji strony robotowi wyszukiwarki, a innej użytkownikowi. Może również chodzić o taki format strony, którego bot nie zindeksuje.
  • Zablokowane przez narzędzia do usuwania stron – oznacza to, że skorzystałeś z funkcji Usunięcia, którą w GSC możesz znaleźć w tym samym menu, w którym znajduje się opcja Stan. Pamiętaj, że to nie jest skuteczna metoda wykluczania contentu z wyników Google. Najczęściej po 90 dniach bot może ją ponownie zindeksować. Jeśli chcesz, aby dany materiał trwale zniknął z Google, to usuń go ze strony albo skorzystaj z tagu noindex.
  • Strona zeskanowana, ale jeszcze niezindeksowana – oznacza to, że robot odwiedził daną stronę, ale jeszcze nie zdecydował, czy ją zindeksuje. Być może wszystko jest w porządku, ale indeksacja została odłożona na później, a może dany URL został oceniony jako niskiej jakości i robot zajął się analizowaniem innych materiałów.
  • Strona wykryta, ale obecnie niezindeksowana – tutaj podobnie jak powyżej, wszystko może być w porządku, ale indeksacja została odłożona na później. Robot mógł również zainteresować się innymi materiałami na stronie, które są lepiej podlinkowane, i ocenił, że to te zasoby powinny być zindeksowane jako pierwsze.
  • Alternatywna strona zawierająca prawidłowy tag strony kanonicznej – dana strona jest duplikatem innej i prawidłowo wskazuje za pomocą linku kanonicznego na oryginalną treść. Brak indeksacji w tym przypadku jest uzasadniony. To nie wymaga żadnej reakcji z Twojej strony, chyba że dany materiał powinien być indeksowany, a link kanoniczny wskazuje na inną stronę przez błąd.
Alternatywna strona zawierająca prawidłowy tag strony kanonicznej
Alternatywna strona zawierająca prawidłowy tag strony kanonicznej

Wyindeksowanie takich podstron jest prawidłowym objawem ponieważ adresy URL z parametrami posiadają tag kanoniczny na adres bez parametrów. Więc takie rozwiązanie jest prawidłowe, celowe i Google podjęło decyzję o wyindeksowaniu adresów z parametrem aby nie tworzyły się duplikaty.

  • Duplikat, przesłany URL nie został oznaczony jako strona kanoniczna – oznacza to, że w serwisie znajdują się duplikaty danego materiału i nie określono, która wersja jest kanoniczna, tzn. oryginalna. W takim przypadku powinieneś za pomocą tagu rel=”canonical” ustalić, która podstrona jest tą kanoniczną.
  • Zablokowany z powodu innego błędu 4xx – sprawdź, jaki występuje w poszczególnych przypadkach i spróbuj sobie z nim poradzić.
  • Duplikat, użytkownik nie oznaczył strony kanonicznej – Ta strona ma duplikaty, z których żaden nie został oznaczony jako strona kanoniczna. Według naszej oceny to nie jest strona kanoniczna.
Duplikat, użytkownik nie oznaczył strony kanonicznej
Duplikat, użytkownik nie oznaczył strony kanonicznej

Tutaj sprawa jest bardzo prosta – nie został oznaczony tag kanoniczny i trzeba zaimplementować „canonical” wszędzie.

  • Duplikat, wyszukiwarka Google wybrała inną stronę kanoniczną niż użytkownik – Ta strona jest oznaczona jako kanoniczna dla zestawu stron, ale wyszukiwarka Google uznała, że inny URL lepiej sprawdzi się jako strona kanoniczna. Wyszukiwarka Google zindeksowała stronę, którą uznała za kanoniczną, zamiast tej strony.
Duplikat, wyszukiwarka Google wybrała inną stronę kanoniczną niż użytkownik
Duplikat, wyszukiwarka Google wybrała inną stronę kanoniczną niż użytkownik

I teraz ważne: taki alarm należy zweryfikować i podjąć odpowiednie działania. Może się zdarzyć, że tak wybrany adres URL przez Google jest dobry i Google prawidłowo, samodzielnie wybrało adres kanoniczny dla jakiegoś adresu URL bo stwierdziło ,że dochodzi do duplikacji treści. Ale moze być i tak, że takie działanie ze strony Google jest nieprawidłowe i należy zweryfikować dlaczego taki stan rzeczy wystąpił.

Raport stanu indeksowania w GSC – podsumowanie

Dane, które są zgromadzone w opisywanej zakładce, mogą Ci pomóc w rozwiązaniu przeróżnych problemów z działaniem Twojej witryny, a przede wszystkim z ich odnalezieniem. Warto w miarę systematycznie zaglądać do tych danych, szczególnie po wprowadzonych zmianach w strukturze strony czy też po modyfikacjach ważnych plików, m.in. .htaccess.

Skomentuj

Inne ciekawe tematy

Call Now Button 606 628 628