Duplicate content – co to jest?
Duplicate content, to identyczne treści, które pojawiają się wielokrotnie w ramach jednej domeny lub widnieją również na innych witrynach. Stąd też duplikaty można podzielić na wewnętrzne i zewnętrzne. Często generujemy je nieumyślnie – zawodzą tutaj ustawienia strony. Zdarza się też, że świadomie używamy cudzych tekstów lub wprowadzamy własne publikacje w różne miejsca, czego efektem jest duplikacja.
Warto się tego wystrzegać, ponieważ duplicate content ma wpływ na pozycjonowanie stron internetowych. Google musi ocenić, która podstrona lepiej odpowiada na zapytanie użytkownika. Wyżej w rankingu znajdzie się serwis z wysokim crawl budget, poprawną optymalizacją techniczną, porządnie skonstruowaną mapą witryny oraz dobrym linkowaniem wewnętrznym i zewnętrznym. Dzięki wdrożeniu skutecznych działań SEO są one częściej indeksowane. Roboty wyszukiwarki prawdopodobnie treść sprawdzą tam szybciej i uznają za „oryginalne” źródło.
Zewnętrzny duplicate content
Duplicate content zewnętrzny to taki, który widnieje na Twojej stronie oraz znajduje się na zupełnie innym serwisie. Kiedy mamy do czynienia z taką sytuacją? Zapoznaj się z najczęściej występującymi przypadkami.
- Kradzież tekstów
Bez aprobaty właściciela, nie możesz ot tak używać sobie treści znalezionych w internecie. Jeśli chcesz opublikować coś z sieci na swojej stronie możesz udostępnić content wyłącznie w ramach prawa cytatu. Musisz szczególnie uważać na to zagadnienie, jeżeli korzystasz ze zdjęć i opisów producenta. Te często powstają przy współpracy z podwykonawcą i najczęściej podlegają umowie o przekazaniu autorskich praw majątkowych. Firma ma więc utwory na wyłączność. Warto dla pewności uzyskać zgodę na ich rozpowszechnianie.
- Powielony opis od producenta
Ok, masz pozwolenie na użycie istniejącego już tekstu z karty produktowej. Wiesz, dlaczego nie warto wykorzystywać tej treści w niezmienionej formie?
https://wegestudio.pl/pl/p/Jadlonomia-po-polsku/638
https://marginesy.com.pl/sklep/produkt/133294/jadlonomia-po-polsku?idcat=0#
Z dużym prawdopodobieństwem nie jesteś jedyną osobą, która dostała na to zgodę. Potem okazuje się, że ¾ sklepów internetowych ma to samo na stronie. Magicznym sposobem pierwsze miejsca w Google zajmują najpopularniejsze platformy sprzedażowe i porównywarki lub witryny, które zmieniły opis towaru.
Druga sprawa: konkurujesz z nimi wszystkimi o pozycje. Roboty wyszukiwarki muszą jakoś ocenić podstrony z identycznym tekstem. Okazuje się, że walczysz z ogromnym e-commercem na inne czynniki rankingowe. Odpada Ci jeden z istotniejszych i nietrudnych do uzyskania – unikalna, wyczerpująca i pomocna dla użytkownika treść.
- Cytowanie
Gdy wykorzystujesz czyjeś słowa np. we własnych artykułach blogowych, musisz pamiętać, aby dobrze je oznaczyć. Cytowanie większych fragmentów tekstu bez odsyłacza semantycznego może spowodować, iż treść zostanie uznana za duplikat.
- Teksty od copywritera lub agencji
Bez pisemnej umowy o przekazaniu praw autorskich copywriter udziela niewyłącznej licencji, a więc w czystej teorii nadal może odsprzedać kolejnym osobom swój utwór. Koniecznie podpisz ze zleceniobiorcą stosowny dokument, w którego zapisie znajdzie się również punkt o dopuszczalnych polach eksploatacji tekstu. Tylko zatrudnienie na etat powoduje automatyczne przekazanie praw autorskich.
- Duplikacja własnych treści na zewnętrznych portalach
Owszem, sami możemy zrobić sobie krzywdę. Jak? To bardzo proste. Prowadzisz dodatkowo konto na platformie sprzedażowej i wklejasz tam swój odpicowany opis produktu? Twoja treść jest powielona na zewnętrznym portalu. Teraz zgadnij, co znajdziesz wyżej w wynikach wyszukiwania. Własną stronę czy ogromny serwis pracujący nad pozycjonowaniem witryny od wielu lat? Podobnie sprawa się ma z social media. Posty z Facebooka są coraz lepiej odczytywane przez crawlery i indeksowane na konkretne frazy.
Przykład duplicate content w postaci opisu produktu na stronie sklepu oraz na Allegro
https://allegro.pl/oferta/finish-quantum-tabletki-do-zmywarki-100szt-7056719427
https://niemchem.com/product-pol-3861-Finish-Quantum-Tabletki-do-Zmywarki-100szt-XL-PL.html
Co jeszcze może stać się contentem zduplikowanym na nasze własne życzenie? Artykuł sponsorowany, notatka prasowa... w sumie wszystko co mamy u siebie na stronie, a wyślemy w ramach współpracy do publikacji.
Wewnętrzny duplicate content
Tak jak wspomniałam, wewnętrzna duplikacja treści jest najczęściej nieświadomym działaniem. Wynika np. z braku przekierowań i pozostawienia identycznego tekstu na różnych podstronach serwisu. Wiesz, kiedy masz do czynienia z duplikatem? Niektóre formy mogą Cię zaskoczyć.
- Warianty produktu na oddzielnych kartach lub w różnych kategoriach
Opisy produktów są szczególną formą treści, którą możemy powielić zarówno zewnętrznie, jak i wewnętrznie. Jak do tego dochodzi w drugim przypadku? Zwykle dzieje się tak na osobnych kartach dla podobnych produktów. Tego typu duplicate content nie wpływa negatywnie na ocenę naszej strony przez Google, wciąż jednak wyszukiwarka musi się zastanowić, który wynik zasługuje na pokazanie w rankingu i na jakiej pozycji.
Przykład dwóch podobnych produktów z takim samym tekstem
https://www.pikinini.pl/dziecko_w_ogrodzie/domek_dla_motyli_z_rusalka_osetnik-1
https://www.pikinini.pl/dziecko_w_ogrodzie/domek_dla_motyli_z_paziem_krolowej_niebieski-1
Duplikatem może być też produkt przypisany do kilku kategorii. Przy niepoprawnej strukturze towar otrzyma w każdej z nich inny adres URL, co również oznacza powieloną treść.
https://www.ministerstwogadzetow.com/kubek-pieski.html, https://www.ministerstwogadzetow.com/dom-i-styl-zycia/kubek-pieski.html
- Opis kategorii jako duplicate content
Następny problem zwykle zdarzający się w sklepach internetowych, które mają rozbudowaną ofertę na wiele podstron. Jeśli pozwolisz na pokazywanie opisu przy stronicowaniu, filtrowaniu i sortowaniu kategorii, to Twój tekst będzie się pojawiał wielokrotnie. Lepiej wdrożyć jedno z rozwiązań:
- ustawić tag
no-index
dla kolejnych stron, - wykorzystać
rel="canonical"
, - zostawić opis na 1. stronie z produktami i wyłączyć jego wyświetlanie przy innych okazjach.
- Różne adresy URL prowadzące do tej samej strony
Duplicate content kojarzy się zwykle z samym tekstem pokazanym na stronie internetowej, jednak może on również być kopią podstron pod różnymi linkami.
Przykłady:
przykladowylink.pl i www.przykladowylink.pl
przykladowylink.pl/
www.przykladowylink.pl/strona-glowna
www.przykladowylink.pl/index.php czy /index.html
http://przykladowylink.pl oraz https://przykladowylink.pl
Pamiętaj, że odnośnik z www i bez, to dwie różne wersje strony. Taka sama zasada działa przy http oraz https.
https://www.casu.pl/klapki-damskie
https://www.casu.pl/klapki-damskie?p=1
Wyżej widzisz za to dwa linki prowadzące do identycznej treści, przy czym w jednym występuje paginacja. To też jest duplicate content.
- Dodatkowe parametry w linkach
Wszelkie dodatkowe parametry w adresach, np. śledzące źródła odwiedzin: utm_source, utm_campaign itd. mogą być indeksowane przez wyszukiwarkę Google. A to znowu oznacza dla Ciebie duplikat.
- Strony testowe, do druku oraz nieprzetłumaczone wersje językowe
Czasem za duplicate content stoi po prostu niedopatrzenie. Zwykle pod postacią opublikowanej wersji strony, która nie powinna ujrzeć światła dziennego. Jeżeli strona do druku występuje pod innym adresem i nie jest wykluczona z indeksacji, to możesz się spodziewać powielonej treści pod różnymi linkami. Do tego jest szansa, że pojawi się ona w wynikach wyszukiwania i będzie ściągać ruch w niechciane przez Ciebie miejsce.
- Oddzielna strona dla wersji mobilnej z taką samą treścią
Mobile rośnie w siłę, a więc wiele firm musiało podjąć decyzję czy robić responsywną, a może mobilną wersję swojej strony internetowej. Jednym z minusów wyboru tej drugiej jest właśnie kopia strony, jeśli nie zastosujemy tagów <link> z odpowiednimi elementami rel.
m.przykladowylink.pl
przykladowylink.pl/mobile
- Różne ID dla sesji użytkownika
Często w sklepach internetowych tworzymy sesje dla użytkowników, dzięki czemu wybrane produkty zostają w ich koszykach. To bardzo wygodne dla internauty, jednak może przysporzyć Ci problemów w postaci zduplikowanej treści, gdy do adresu URL zostaje dodane ID klienta.
Jak szukać powielonych treści?
Wszystko zależy tak naprawdę od tego, co chcesz znaleźć. Duplicate content możesz szukać za pomocą wyników wyszukiwania oraz w darmowych narzędziach Google.
- Proste wyszukiwanie identycznych tekstów w sieci – „ ”
Skopiuj fragment i wklej go do wyszukiwarki w cudzysłowie. Google sprawdza maksymalnie 32 słowa, więc jeżeli dodasz ich więcej, to wyrazy powyżej tej liczby zostaną pominięte. Otrzymasz w odpowiedzi wyniki, na których pojawia się dokładnie ten sam tekst.
- Sprawdzenie zaindeksowanych strony serwisu – site:przykładowylink.pl
W ten sposób widzisz w wyszukiwarce wszystkie zaindeksowane podstrony. Co więcej, możesz zmodyfikować nieco komendę, aby znaleźć zduplikowane adresy.
site:przykladowylink.pl -inurl:https
Wpisz -inurl (minus na początku ma znaczenie), aby wykluczyć z wyszukiwania linki, np. posiadające certyfikaty https. W ten sposób zweryfikujesz, czy na Twoim serwisie nie pozostały strony bez odpowiednich przekierowań.
Za sprawą operatora inurl możesz też poszukać zaindeksowanych adresów z parametrem śledzącym, które również zaliczają się do duplicate content.
site:przykladowylink.pl inurl:utm_campaign
- Zaawansowane operatory do wyszukiwania duplicate content w Google
Poszukaj po frazie, czy ktoś korzysta z Twoich treści lub po intext: wpisz fragment, aby sprawdzić same teksty. -site wyklucza Twoją witrynę z wyników.
„fraza” -site:przykladowylink.pl
intext:„tekst” -site:przykladowylink.pl
Duplicate Content w Google Search Console
Duplicate content możesz też znaleźć za pomocą Google Search Console. Wystarczy w bocznym menu w zakładce Indeks wybrać Stan, a wtedy pokażą się statystyki dla Twojej witryny. Sprawdzisz tam wykluczone strony, a ze szczegółów dowiesz się, z jakiego powodu tak się stało. Wyjdzie Ci np. informacja „Duplikat, użytkownik nie oznaczył strony kanonicznej”.
Co robić, gdy znajdziesz zduplikowany content?
- Popraw tekst
Na pierwszy miejscu zawsze będzie unikalna treść, dlatego najlepiej napisać ją zupełnie od nowa. Jeśli nie masz za dużo czasu i planujesz wykorzystać np. opis producenta, to postaraj się przeredagować go i dopisać do niego jak najwięcej informacji. Takie zasady tyczą się również wielokrotnie powielonej treści w obrębie Twojego serwisu.
Bez względu na to, czy decydujesz się robić własny tekst, czy wykorzystać istniejący, pamiętaj o optymalizacji pod słowa kluczowe. Na naszym blogu znajdziesz artykuł, w którym pokazujemy jak w prosty sposób podrasować opis od producenta w Asystencie Contentu.
- Wyklucz z indeksacji
Noindex przypisujesz stronom, które nie mają dla Ciebie większego znaczenia. Nie widzisz potrzeby ich indeksowania przez roboty Google, a niestety generują na Twojej stronie duplicate content. Są to na przykład podstrony, które powstają przy nałożeniu filtrów wyszukiwania lub pojawiający się wszędzie regulamin. Możesz to zrobić poprzez meta tag noindex
oraz X-Robots-Tag
.
Dodaj do kodu HTML wybranej strony w sekcji <head>
:
<meta name="robots" content="noindex">
Skonfiguruj zwracanie nagłówka noindex
w odpowiedzi HTTP za pomocą:
X-Robots-Tag: noindex
X-Robots-Tag: none
- Zastosuj przekierowanie 301
To świetny sposób, aby wykluczyć z użycia wszelkie kopie linków, np. strony głównej. Przekierowanie 301 ma na celu przenosić ruch z jednej wersji URL na inny. Jeśli usuniesz podstronę lub zmienisz prowadzący do niej link, to bez tego przekierowania użytkownik po wejściu na stronę otrzyma błąd 404. Google nie odnajdzie takiego adresu. To wpływa znowu na doświadczenie internauty. Nie będzie zachwycony, gdy zapędzisz go w kozi róg serwisu.
- Użyj linków kanonicznych
Wspomniany już przeze mnie wyżej rel="canonical"
, to tag, który daje informacje robotom wyszukiwarki. Dzięki niemu wiedzą, którą stronę warto zaindeksować na daną frazę. Kanonizacja odnośników jest automatyczna. Możesz jednak własnoręcznie zasugerować crawlerom, że wybrany przez Ciebie link jest najlepszy.
Wykorzystaj ten sposób, gdy na różnych adresach URL masz duplicate content i nie chcesz go zmieniać. Świetnym przykładem są produkty dostępne w kilku kolorach (dla przykładu czarny, żółty i brązowy), a dodane na osobnych kartach. Najpierw musisz ustalić, który z nich cieszy się największym powodzeniem wśród klientów. Załóżmy, że będzie to przedmiot w kolorze czarnym. Wtedy wariantom o żółtej i brązowej barwie ustawiasz tag canonical na wybraną wersję.
Jak to zrobić?
W sekcji <head>
kodu HTML strony dodajesz:
<link rel="canonical" href="http://www.przykladowylink.pl/strona.html" />
rel="canonical"
może być również użyty w nagłówku http.
- Syndykacja treści
Termin odnosi się sposobu rozpowszechniania tekstów z Twojej strony internetowej na innych portalach. Jest formą promocji wpisów blogowych – wysyłasz artykuły do innych serwisów z oznaczeniem źródła oraz autora. Jeśli planujesz przekazać swoje treści, upewnij się, że będą one odpowiednio podpisane i podlinkowane oraz niecytowane w całości. Dzięki temu Google nie powinien ich uznać za duplicate content.
Czy duplikacja treści jest karana przez Google?
Tak naprawdę jest niewiele przypadków, w których witryna zostanie ukarana za duplicate content. Są to np. skrajne próby manipulacji wynikami wyszukiwania. Wtedy istnieje prawdopodobieństwo, że witryna zostanie usunięta z indeksu. Drugą opcją jest zgłoszenie naruszenie praw autorskich do Google.
Dlaczego więc tak wiele się mówi o poprawianiu treści? Ponieważ duplikaty mają wpływ na SEO i pozycjonowanie.
Po Twoich stronach chodzą roboty wyszukiwarki. To jak często i prędko to robią, zależy np. od szybkości serwisu. Jeśli ten działa wolno, to Google nie będzie dodatkowo go przeciążał większą liczby zapytań. Wydłuża to cały proces, a Ty tracisz ruch, bo strony są niewidoczne. Wyszukiwarka ocenia też zapotrzebowanie na indeksację. Co nakłania crawlery na regularne odwiedzanie Twojej strony? Popularność, ale również aktualność i niepowtarzalność treści. Wewnętrzny duplicate content może więc opóźniać działanie Googlebotów.
Poza tym, miejsce w wynikach wyszukiwania jest ustalane m.in. za sprawą opublikowanych treści. Istnieje nawet szansa, że część powielonych stron nie zostanie w ogóle wyświetlona internautom. W praktyce zdarza się jednak, że np. karty produktów z identycznym tekstem pojawiają się w wyszukiwarce. Crawlery muszą wtedy zdecydować tylko na podstawie innych czynników rankingowych, która strona powinna znaleźć się wyżej.
Przegra ten, kto posiada gorsze oceny. Oczywiście, gdy masz autorski tekst, nadal liczą się pozostałe kryteria. Google lubi jednak unikalne treści i posiadanie ich na stronie zwiększy Twoje szanse na zdobycie wyższej pozycji. Nie powinno nikogo więc dziwić, że od pewnego czasu bardzo duży nacisk kładzie się na content marketing. Postaraj się usunąć duplicate content, aby wyszukiwarka lepiej oceniała cały serwis i poszczególne podstrony.
Komentarze