Przeglądając otchłań Internetu w poszukiwaniu odpowiedzi na swoje pytania, z pewnością zwróciłeś uwagę na to, że publikowane treści prezentują różną jakość. Część z nich jest merytoryczna, a po ich przeczytaniu czujesz, że wyniosłeś z tekstu coś wartościowego. Niestety w Internecie nadal krąży bardzo dużo treści… bez treści. Niby coś czytasz, ale właściwie nie rozumiesz, po co dany artykuł powstał. Między innymi to właśnie jest thin content. Jakie jeszcze przybiera postaci? Jak go rozpoznać? A przede wszystkim – jak z nim walczyć? Odpowiadamy!

Wszystko zaczęło się od Pandy

A dokładniej od algorytmu Panda, który został wdrożony przez Google w 2011 roku. U jego podstaw leżało dążenie do tego, aby wypromować małe serwisy, które nie miały wystarczającej siły przebicia, żeby wygrać z dużymi, komercyjnymi witrynami, ale jednocześnie zawierały wiele atrakcyjnych merytorycznie treści. Założenia algorytmu sprawiały, że spadła pozycja stron zawierających m.in. dużą ilość reklam.

Rozwiązanie w 2014 r. objęto patentem. Przez pierwsze dwa lata Panda była aktualizowana średnio raz w miesiącu. Obecnie zmiany są zawarte w update’ach całego silnika Google. Co ciekawe, nazwa algorytmu rankingowego nie pochodzi od powszechnie lubianego zwierzęcia, ale od nazwiska twórcy tej technologii – Navneeta Pandy.

Thin content to krótka treść o niskiej jakości!

Razem z algorytmem Panda pojawiło się pojęcie thin contentu, stanowiącego dokładne przeciwieństwo rich contentu. Czym właściwie jest ta „rozrzedzona treść” i jak ją rozpoznać? Projekt Panda obejmuje rozwijającą się nieustająco czarną listę praktyk, których stosowanie nie tylko nie poprawia widoczności strony, ale wręcz ją pogarsza!. Oto przykładowe działania, które prowadzą do spadku strony internetowej w rankingu wyszukiwania.

Witryny z automatycznie generowaną treścią

Maszynowo tworzona treść i wyeliminowanie kosztownego czynnika ludzkiego z procesu twórczego jest marzeniem wielu serwisów. I to marzeniem, które częściowo się spełniło. Chodzi o wszelkiego rodzaju treści tworzone z wykorzystaniem gotowych programów, teksty synonimizowane i pochodzące z tzw. mieszarek, składające względnie logiczne akapity z losowo dobranych słów.

Na równi z nimi traktowana jest treść udostępniona z innej strony lub np. kanału informacyjnego RSS. Google piętnuje nawet automatyczne tłumaczenia tekstów, które powstały bez udziału człowieka.

Zbyt mała różnorodność treści

Czasami brak lub bardzo mała ilość unikalnej treści na stronie jest równie szkodliwa co treść niskiej jakości. To częsta bolączka sklepów internetowych, które nie inwestują w unikalne opisy produktów lub opisy kategorii. Efektem tego jest zaprezentowanie odbiorcy wyłącznie tabelki z danymi lub poszczególnych podstron, które różnią się od siebie wyłącznie nazwą oferowanego przedmiotu i jego specyfikacją.

Nieważne, z ilu subwitryn składa się Twoja witryna – jeżeli są one mało zróżnicowane, istnieje spore ryzyko, że Google stwierdzi, że nie ma tam wystarczająco dużo ciekawych informacji, aby prezentować ją wysoko w wynikach wyszukiwania.

Nadmierne nasycenie treści słowami kluczowymi

Keyword stuffing to nieetyczna praktyka polegająca na nadmiernym zagęszczeniu słów kluczowych w tekście lub używanie ich w sposób, który nie koreluje z regułami języka naturalnego (np. wprowadzanie fraz wyłącznie w formie nieodmienionej). Ten problem może wystąpić, jeżeli tekst jest zbyt krótki, sztuczny lub pozbawiony informacji, które roboty indeksujące Google uznają za wartościowe. 

Ukryta treść

Ukrywanie treści, czyli tzw. cloaking, polega na próbie oszukania robotów indeksujących np. przez pokazywanie im innych treści niż użytkownikom lub zmianę stylów CSS (styl to zespół reguł, które mówią wyszukiwarce, jak ma wyświetlać daną treść, np. kolor tekstu, marginesy czy czcionka) poprzez dodanie akapitowi tekstu koloru tła. Okazuje się jednak, że strony analizują nie tylko web crawlery, ale także pracownicy Google’a, tzw. quality raters, którzy ręcznie oceniają treść i strukturę stron internetowych, weryfikując ją poprzez pryzmat aktualnych wytycznych.

Strony typu doorway

Zwane inaczej gateway pages albo portal pages służą do sztucznego zwiększenia ruchu. Często mają wysoki ranking w wyszukiwarkach dzięki wypozycjonowaniu na popularne frazy kluczowe. Po kliknięciu w link przenoszą jednak użytkownika do zupełnie innej witryny, wykorzystując do tego polecenie meta refresh.

Jak zlokalizować thin content?

Chcesz zlokalizować thin content na swojej stronie? Skorzystaj z narzędzi!

Skoro już wiesz, czym może być thin content, zapewne zastanawiasz się, czy istnieją łatwe sposoby na zlokalizowanie takiej treści w Twojej witrynie? Otóż tak, istnieją, ale musisz być świadom tego, że nawet najbardziej poprawna diagnoza nie jest równoznaczna z podjęciem leczenia. Ostatecznie to od Ciebie zależy, czy (i co) zrobisz z potencjalnie bezwartościowymi stronami. Oto kilka narzędzi, które mogą Ci pomóc.

ScreamingFrog SEO Spider

To jeden z najpopularniejszych programów do odnajdywania adresów zawierających treść, którą roboty Google mogą uznać za pozbawioną wartości merytorycznej. Usługa występuje w wersji darmowej i płatnej. Zasadnicza różnica polega na ograniczeniu maksymalnej ilości analizowanych podstron. Darmowa odsłona programu pozwala na prześledzenie 500 rekordów.

O ile w przypadku niewielkich serwisów to w zupełności wystarczająca liczba, w przypadku sklepów internetowych czy dużych serwisów informacyjnych najprawdopodobniej okaże się zbyt mała. Co jest w stanie wykryć ScreamingFrog SEO Spider?

  • puste adresy kategorii w sklepie internetowym;
  • podstrony kategorii lub produktów pozbawione opisu;
  • powielające się metatagi;
  • błędne przekierowania i podstrony;
  • strony osierocone (czyli takie, do których nie prowadzą już żadne linki);

To oczywiście jedynie najważniejsze możliwości SEO Spider, ale zdecydowanie nie wszystkie. Warto wspomnieć chociażby o analizie duplicate content. Zjawisko powielania treści polega na opublikowaniu tych samych tekstów w więcej niż jednym miejscu (niekoniecznie wskutek „pożyczenia” cudzej twórczości!). Zagadnienie jest na tyle ciekawe, że zasługuje na osobny wpis na blogu i nie powinno być traktowane po macoszemu.

Google Search Console

Search Console, bezpłatna usługa Google, pozwala na monitorowanie pozycji witryny w wyszukiwarce. Przy okazji informuje nas o stronach o niskiej wartości merytorycznej, np. tych z małą wartością wyświetleń czy niskim CTR (stosunku liczby kliknięć do liczby odsłon). W tym przypadku warto zastanowić się, dlaczego mało osób wchodzi na daną stronę i co możemy zrobić, aby podnieść ten wskaźnik.

Może się okazać, że przydatna będzie poprawa jakości treści na stronie przez dodanie artykułów blogowych albo przebudowa graficznej części witryny i usprawnienie UX. Dobrze przeprowadzona optymalizacja zawartości strony przyczyni się do poprawy jej widoczności.

Copyscape

Copyscape to przydatne narzędzie do wyszukiwania skopiowanej treści. Może chodzić o treść, którą konkurencja skopiowała od Ciebie lub na odwrót – coś, co Ty (oczywiście nieopatrznie) zapożyczyłeś z innej witryny. Wersja płatna daje możliwość wklejenia treści do programu, który sprawdzi pod kątem plagiatu zasoby sieciowe. Można także skorzystać z wyszukiwania zbiorowego, ignorować określone strony czy korzystać z zasobów offline. Copyscape pozwala skutecznie rozpoznawać i zwalczać duplicate content, ale także tworzyć bardziej unikalny content.

Operatory wyszukiwania Google

Choć nie wszyscy użytkownicy Internetu zdają sobie z tego sprawę, wstępną ocenę jakości treści (wprawdzie głównie z uwzględnieniem duplikacji treści, ale to zawsze coś) oferuje sama wyszukiwarka Google. Korzystanie z operatorów wyszukiwania, takich jak np. „site:domena.pl” czy „site:domena.pl intext „treść”” pozwala na wyszukanie rekordów zawierających tożsame treści, ich fragmenty, a nawet konkretne frazy.

Jak pozbyć się thin contentu ze strony?

Jak usunąć thin content
Jak usunąć thin content? Jak najszybciej!

Skoro masz już ogólne pojęcie o tym, czym jest thin content, a nawet potrafisz go zidentyfikować (czy to instynktownie, czy przy użyciu narzędzi), zapewne zastanawiasz się, co możesz z nim zrobić? Jaką treść powinny mieć strony, aby roboty indeksujące Google widziały teksty nie jako thin, ale jako rich, czyli bogate w wartość merytoryczną? Sposobów na to jest przynajmniej kilka, dlatego przyjrzyjmy się im po kolei.

„Content is a king”

Tytułową frazę, cytowaną jak marketing długi i szeroki, ukuł 25 lat temu sam Bill Gates, publikując esej pod tym samym tytułem. W świetle zawartości stron internetowych slogan pozostaje bardzo aktualny. O co chodzi?

Przede wszystkim treść na stronie musi odpowiadać aktualnym wytycznym SEO. Oznacza to, że nie może być za krótka (ani za długa), powinna zawierać słowa kluczowe, naturalnie odmienione i rozmieszczone zgodnie z zasadami naturalnego języka i w odpowiednim natężeniu.

Dobre treści powinny być także aktualne. Aby tego dopilnować, możesz skorzystać z profesjonalnych narzędzi albo… zlecić audyt i sporządzenie lub aktualizację contentu swojej strony profesjonalnej agencji copywriterskiej.

Content przyjazny dla wyszukiwarki powinien posiadać obrazki lub zdjęcia opisane atrybutem alt oraz zawierać wewnętrzne linkowanie, dzięki któremu osoba odwiedzająca Twoją stronę będzie mogła się po niej swobodnie poruszać i chętniej spędzi na niej więcej czasu.

Niezależnie od wszelkich technikaliów, audytów fraz i całej otoczki SEO pamiętaj, że wszystkie treści tworzone są dla ludzi. Nawet najlepiej zoptymalizowana od strony technicznej witryna nie sprawi, że ludzie będą ją chętnie odwiedzali, jeżeli będzie kulała pod względem treści.

Przekierowanie 301

Choć walka z thin contentem odbywa się głównie na polu treści, nie jest to jedyny aspekt strony, o który możesz zadbać. Przekierowanie 301 pozwala wyeliminować chaos, z którym stykają się roboty indeksujące Google, kiedy natykają się na kilka wersji tej samej strony internetowej.

Choć dla Ciebie ścieżka URL „witryna.pl” oraz „www.witryna.pl” to jedno i to samo, dla crawlerów to dwa zupełnie różne adresy, choć potencjalnie o tej samej zawartości. Dzięki przekierowaniu 301 możesz skierować uwagę robotów tylko na jeden adres informując je, że dany element zmienił swoje miejsce na stałe.

Linki kanoniczne

Kanoniczny adres URL to taki, który roboty Google’a uznają za najbardziej reprezentatywny dla danej treści – właśnie ten adres zaindeksują. Rozwiązanie jest szczególnie przydatne w sklepach internetowych, które odsyłają klientów do wielu różnych produktów (lub np. tego samego produktu, ale znajdującego się na kilku podstronach). Jeżeli nie korzystasz z „kanonikali”, Google może uznać różne adresy za równorzędne albo wybierze samodzielnie. W obu przypadkach ryzykujesz, że Twoje pozycje w wyszukiwarce spadną. 

Linki wewnętrzne

O linkowaniu wewnętrznym była już mowa w kontekście struktury serwisu, ale nawigacja nie jest jego jedyną rolą. Stworzenie sieci hiperłączy prowadzących do różnych miejsc w witrynie wpływa pozytywnie na przepływ mocy strony (tzw. Page Rank), zmniejsza współczynnik odrzuceń (tzw. Bounce Rate) oraz ułatwia robotom Google indeksowanie poszczególnych podstron.

Podsumowanie – nie płyń z prądem!

Content sam sie nie zrobi

Można się spierać, czy (i jak szybko) treść wpłynie na poprawę wyników Twojego biznesu i widoczność w wyszukiwarce. Pewne jest jednak to, że zły content niemal na pewno dużo zepsuje. Wartościowe treści pozwolą Ci przeprowadzić klienta za rękę przez cały lejek sprzedażowy. Dzięki dobrym tekstom przywiążesz konsumenta do marki, przekonasz go do siebie i sprawisz, że chętniej kupi Twój produkt lub usługę.

Thin content jest jak ścieżka ciemnej strony mocy znanej z sagi „Gwiezdnych Wojen”. Łatwo na nią wejść i bez reszty się pogrążyć. Treści niskiej jakości tworzy się przecież szybko i niskim kosztem. Wystarczy, jak to mawiają copywriterzy, „klepać precle”. Wydaje się kuszące?

Nie płyń z prądem! Bądź kontent ze swojego contentu i postaw na jakość, a nie na ilość! Tak naprawdę to ona dla wszystkich użytkowników Internetu jest najważniejsza. Dla Ciebie również powinna.