2018-02-22 Pozycjonowanie 26 Opinie

duplicate content - powielanie treści a seo

Duplicate content i 16 przypadków szkodliwego powielania treści [PORADNIK SEO]

Czy popełniasz błędy związane z Duplicate Content, szeroko rozumianą duplikacją treści na stronie i poza stroną www? Możesz mi wierzyć na słowo, ale większość klientów z którymi współpracuje ma problem z DC. Większość problemów z duplikacją treści wynika z nieświadomości właścicieli stron, co skutkuje obniżeniem widoczności strony w Google i utratą klientów z kanału organicznego. Zdarzają się przypadki, że niektóre osoby wykonują celowe działania związane z duplikacją treści na wielu różnych domenach próbując uzyskać lepszą widoczność i większy ruch. Niestety, ale skutek będzie odwrotny od zamierzonego. Największą karą dla właściciela strony za tego typu praktyki jest ban od Google polegający na usunięciu strony z indeksu wyszukiwarki. Zachęcam Cię, abyś w pierwszej kolejności przeprowadził audyt SEO. Namierzenie i naprawienie błędów związanych z duplikacją treści to absolutny must have, jeżeli chcesz walczyć z konkurencją o pierwsze miejsca w Google. W dzisiejszym poradniku poznasz najpopularniejsze przypadki powielania treści i zobaczysz sposoby rozwiązania problemów.

Zobacz wideo poradnik

Jak wygrać wojnę z Duplicate Content? Poradnik SEO.

Darmowa ściągawka dla subskrybentów bloga: Podaj poniżej swojego maila, aby pobrać checklistę o duplikacji treści w formie PDF, dzięki której szybciej nauczysz się eliminować szkodliwy DC na własnej stronie.

Czym jest Duplicate Content?

Duplicate Content (DC) – negatywne zjawisko polegające na powielaniu identycznego lub bardzo podobnego tekstu w obrębie jednej domeny bądź kilku domen internetowych. Zatem DC występuje w momencie, gdy identyczna treść została rozsiana w różnych miejscach sieci Internet. Algorytmy wyszukiwarki Google potrafią zidentyfikować stronę, która jako pierwsza opublikowała dany tekst w sieci. Ten tekst zostanie potraktowany jako unikalny, oryginalny i nieskopiowany. Pozostałe strony, które dopuszczą się skopiowania i publikacji tekstu na własnej stronie dopuszczą się duplikacji treści.

Zagrożenia związane z namierzaniem oryginałów treści przez Google

Istnieje pewne zagrożenie powiązane z duplikacją treści i autorytetem domeny, o którym warto wiedzieć.

Przykład

Załóżmy, że nowo założona strona internetowa bez żadnego autorytetu publikuje unikalny, wartościowy tekst na własnej stronie. Kilka minut później kilkuletnia strona www o wysokim autorytecie kopiuje i publikuje na własnej stronie tekst zaczerpnięty z nowo założonej strony.

Należy wiedzieć, że nowo założone strony internetowe są rzadko odwiedzane przez roboty Google. W efekcie czego ten tekst może zostać późno dodany do indeksu wyszukiwarki Google.

Z kolei kilkuletnie domeny o wysokim autorytecie są dobrze podlinkowane, roboty Google mogą każdego dnia odwiedzać taką stronę w celu indeksacji nowych treści.

Istnieje więc duże ryzyko, że algorytm Google jako pierwszy zindeksuje tekst na kilkuletniej domenie o wysokim autorytecie pomimo faktu, że domena dopuściła się kradzieży treści. Z kolei domena o niskim autorytecie, która przygotowała i opublikowała unikalny tekst może zostać potraktowana przez Google jako serwis, który opublikował duplikat.

Przy ustaleniu oryginału treści Google może mieć problem przez:

Czas, kiedy robot Google zindeksuje tekst.
Ilość linków przychodzących do strony.
Wiek i autorytet domeny.

Ważne jest korzystanie z narzędzi SEO, które wykryją wszelkie duplikaty treści w Internecie. Dzięki temu będziesz mógł odpowiednio zareagować, gdy namierzysz próby kradzieży treści z Twojej strony www.

17 ekspertów SEO o duplikacji treści

Postanowiłem zadać 2 pytania do specjalistów z dziedziny SEO:

Podaj 3 popularne przykłady duplikacji treści, które szkodzą stronie pozycjonowanej.
Podaj przynajmniej 3 narzędzia SEO, które wykorzystujesz do namierzenia duplikacji treści.

Zobacz odpowiedzi. Czy zgadzasz się z opiniami ekspertów? Daj znać w komentarzu 🙂

Duplikacja treści nie zawsze musi szkodzić, ale rozpatrując wszystkie aspekty sprawy mogę powiedzieć, że problematyczne jest:

powielanie treści opisów produktów w sklepach internetowych i jednoczesne wysyłanie tychże opisów do porównywarek
niewłaściwa implementacja tagu rel=”canonical” wraz z nieprawidłowo wykonanymi parametrami związanymi z sortowaniem i filtracją produktów na stronie
przedstawianie tych samych produktów czy usług pod różnymi adresami URL

Do namierzenia DC wykorzystuję następujące narzędzia:

Screaming Frog – do weryfikacji duplikowania znaczników META
Sitebulb – do wykrywania zduplikowanych podstron
Google – do wykrywania duplikacji treści

Oczywiście można wykorzystywać więcej narzędzi, a sama duplikacja zachodzi w większej liczbie przypadków.

Paweł Gontarek z https://www.zgred.pl

paweł gontarek

Miejsca najczęstszego duplikowania treści to zwykle:

Niezoptymalizowane strony filtrowania
Te same produkty i kategorie dostępne pod różnymi adresami URL
Brak preferowanej wersji serwisu
Nieprzemyślane tagi produktów i wpisów blogowych

Mimo tego, że problemy te występują w większości E-commerce, z którymi miałam do czynienia, właściciele stron są często nieświadomi błędów. Dlaczego? Duplicate content ma dla nich zbyt płytkie znaczenie. Sprawdzają to, czy opisy produktów są unikalne, dbają o niepowtarzanie tych samych treści w artykułach. Słowem – analizują to, co tworzą sami.

Duplikacja wywołana filtrowaniem, zbyt dużą ilością podobnych tagów, czy brakiem preferowanej wersji serwisu wynika jednak z przyczyn technicznych, często niezależnych od właścicieli stron, o których nie zawsze wiedzą lub nie zawsze potrafią sobie prawidłowo z nimi poradzić. Z tego właśnie względu rola specjalisty SEO jako osoby, która edukuje, jest bardzo ważna.

Jakie jest najlepsze rozwiązanie?

Dokładna optymalizacja techniczna. Dzięki zastosowaniu meta znaczników noindex, follow, tagów kanonicznych czy przekierowań 301 z łatwością uniknąć można wszystkich w/w problemów. Oczywiście, należy je poprawnie zaimplementować, w czym pomoże specjalista SEO.

Karolina Twardosz z http://semahead.pl

karolina twardosz

Na pewno kradzież czy też zapożyczanie różnego rodzaju wiadomości, porad itp. Często bywa tak, że właściciele stron zmienią kilka wyrazów i dodadzą coś od siebie i myślą, że wszystko jest ok. W praktyce okazuje się, że Google potrafi też takie rzeczy wykryć i nasza strona nie będzie pojawiać się wysoko w SERPach. To jest przykład duplikacji treści pomiędzy domenami. Oczywiście zdarzają się przypadki, gdzie uda się pojawić wysoko – ale to raczej szczęście i moc domeny może zrobić robotę.

A jako ciekawostkę mogę powiedzieć, że jakiś czas temu dostałem powiadomienie od Google w sprawie powielanej treści (słabej jakości) 🙂

Kolejna rzecz dotyczy się treści w obrębie własnej domeny. I tutaj można wymieniać przykłady. Błędy popełniają właściciele blogów oraz sklepów. Ci pierwsi źle dobierają tagi i kategorie. Czasem zdarza się tak, że tworzone są podobne wpisy. Google zauważa takie rzeczy i w najlepszym wypadku pojawiać się będą wszystkie wpisy, a w najgorszym żaden. Często bywa tak, że w takich przypadkach strony z domeny „skaczą”. Czyli raz jedna raz druga strona jest wysoko. Jeżeli zauważysz takie rzeczy to trzeba by się poważnie zastanowić nad optymalizacją swojej strony.

Jeśli chodzi o sklepy, to najczęstszym problemem są opisy produktów, podział na rodzaje produktów (linki strony produktowej, które różnią się np. kolorem czy tkaniną). Tutaj też należy wdrożyć poprawki on-site.

Odnośnie namierzania duplikatów w Google… Na moje własne potrzeby wystarcza Google. Odpowiednie zapytania i można znaleźć wszystko.

Piotr Cichosz z http://highlab.pl

piotr cichosz

Najczęstsze problemy z duplikacją treści pojawiają się przy nieprawidłowej optymalizacji podstron:

Parametry w adresach URL (sortowanie, filtrowanie, ID sesji, itp.)
Paginacja
Www vs non-www / http vs https / oddzielna wersja mobilna (bez zastosowanych przekierowań / bez ustawienia preferowanej domeny / bez canonical)

oraz przy…

Udostępnianiu treści wewnętrznej na wielu zewnętrznych serwisach

Podaj przynajmniej 3 narzędzia SEO, które wykorzystujesz do namierzenia duplikacji treści:

Google! 🙂
Siteliner
Copyscape
Screaming Frog / DeepCrawl

Bartek Berliński z https://sprawnymarketing.pl

bartek berliński

Duplikacja to dosyć obszerne pojęcie. Może występować wewn. serwisu jak i na zewn. Żadnego rodzaju nie powinniśmy ignorować.

Poniżej 3 przykłady, z którymi spotykam się podczas swojej pracy:

Duplikacja, która jest związana z niedopatrzeniem klienta. Polega na wyświetlaniu całej zawartości strony pod inną domeną ew. indeksacji wersji developerskiej podczas budowy / przebudowy serwisu. W internecie można znaleźć przypadki, gdy bardzo dobrze rankujące subdomeny są w wynikach wyszukiwania wyżej niż strona oryginalna. Często dzieje się tak za sprawą dużego autorytetu domeny głównej. Oczywiście, jest to niedopuszczalne i takie niedopatrzenie działa na niekorzyść klienta.
Bardzo często, wręcz nagminnie powtarzającym się niedopatrzeniem przez firmy developerskie jest indeksowanie wyników wyszukiwarki wewnętrznej wszelkiego typu filtrów i sortowań w sklepach internetowych (sortuj po najniższej cenie, sortuj po dacie dodania, filtruj po dostępnych artykułach etc). Tak naprawdę jest to żonglowanie tą samą zawartością kontentu tylko w innym ułożeniu na stronie. Przy dużych e-commersach skutecznie marnuje to crawl budget i takie podstrony często potrafią się kanibalizować. Powinniśmy w tym przypadku zastanowić się na wdrożeniem adresów kanonicznych i odpowiednich dyrektyw dla robotów.
Bardzo częstym przypadkiem duplicate content jest posiadanie tej samej zawartości witryny pod wersją z www, bez www, http i https. Z uwagi na ostatnie ostrzeżenia Google o odznaczeniu stron bez protokołu https w Google Chrome, duża liczba stron migruje i w większości przypadków taka migracja nie jest przeprowadzona zgodnie z dobrymi praktykami SEO. Podczas takiej migracji oprócz standardowej mapy przekierowań 301 trzeba zwrócić także uwagę na zapętlenie. Warto też sprawdzić czy wcześniej wstawione adresy kanoniczne nadal nie wskazują na wersje bez http. Mimo że Google coraz lepiej to rozróżnia, to nadal spotykamy przykłady, gdzie jest to przyczyną spadku widoczności.

Dariusz Jurek – Head of SEO w Sales Tube i właściciel marki Search Marketing Angels

dariusz jurek

Podczas codziennej pracy napotykam na różne rodzaje duplikacji treści. Gdyby oceniać zawartość stron internetowych na surowo, zdecydowanie najczęściej z tym problemem boryka się branża sklepów internetowych (e-commerce).

Duplikacja treści występuje w ich przypadku w kilku postaciach, przykładowo:

Treść powielona na domenach zewnętrznych (inne sklepy, agregatory typu Ceneo i Allegro, treści pobrane ze strony producenta)
Taka sama treść w obrębie wielu podstron (wiele podobnych do siebie produktów, np. warianty kolorystyczne posiadają dokładnie ten sam opis)
Zduplikowana treść w obrębie nieistniejących subdomen (nieprawidłowa konfiguracja Wildcard)

W zależności od warunków, każdy z powyższych rodzajów duplikacji może zaszkodzić witrynie i skutecznie obniżyć jej zasięg/widoczność w organicznych wynikach wyszukiwania Google, czego doskonałym dowodem jest drastyczny skok ruchu i widoczności w momencie naprawienia problemu. Naturalnie wbrew zapewnieniom ze strony pracowników Google, algorytm wcale nie radzi sobie z tym problemem tak doskonale, jak powinien.

Oczywiście duplikacja sama w sobie nie jest tak naprawdę niczym złym, są to po prostu kolejne podstrony, które po jej odliczeniu nie przynoszą żadnej wartości, której to właśnie poszukuje Google. Natomiast sygnały skumulowane w obrębie ważnych i istotnych dla rankingu podstron wciąż przenoszone są na rzecz tych słabych/zduplikowanych i właśnie to jest największym problemem.

Rozwiązań problemów ze zduplikowaną treścią jest wiele i dobranie prawidłowego zależy od określonych warunków, stopnia i rodzaju duplikacji.

Łukasz Trześniewski z https://lukaszt.pl

łukasz trześniewski

Największy problem mają właściciele sklepów internetowych, którzy pobierają opisy z „magazynów” i w ogóle ich nie modyfikują. Potem następuje faza zdziwienia, że najlepiej byłoby utworzyć ponad 1000 unikalnych opisów do każdego z produktów. I oczywiście w tym momencie większość praktycznie może zamykać swój sklep.

Drugim problemem jest pobieranie treści przez mniejsze witryny od „większych” graczy – no bo przecież im (tym dużym) to nie zrobi różnicy. To jednak, że mniejsza strona nie będzie przez to w stanie pojawić się w wynikach wyszukiwania, to już jest jednak drobnostka.

Trzeci problem z duplikacją treści to problem prawny. Często tak naprawdę ludzie nie zdają sobie sprawy, że kopiowanie czyjegoś materiału (tekstu, obrazka, filmu) i wykorzystywanie go do własnych korzyści może być po prostu niezgodne z prawem. Mało to było przypadków pozwów o naruszenie praw autorskich? W mojej opinii problemu zduplikowanej treści już jako takiego nie ma. Są jedynie pojedyncze sytuacje i wyjątki. Do wykrycia DC najczęściej wykorzystuje po prostu wyszukiwarkę Google wklejając fragment tekstu w cudzysłowach. Przy analizie duplikacji wewnętrznej pomagam sobie takimi narzędziami jak Screaming Frog czy SENUTO. Może nie pozwalają mi znaleźć duplikatów wprost, ale na pewno ułatwiają poszukiwania. Istnieje także narzędzie CopyScape do przeszukiwania kopii w całym Internecie, ale nie korzystam z niego prawie wcale.

Tomasz Stopka z http://klaster.co

tomasz stopka

Duplikację treści możemy podzielić na:

1. Duplikat w obrębie strony pozycjonowanej

Poniżej przedstawiam najpopularniejsze duplikaty, które wg. mnie najbardziej szkodzą stronom pozycjonowanym:

Opis kategorii występujący w kilku różnych kategoriach – ten przypadek najczęściej można obserwować wśród sklepów internetowych, a jeszcze częściej w przypadku dużych portali zarabiających na programach partnerskich. W sytuacji, kiedy występują zaawansowane filtry podkategorii – zdarza się, że po update jakiegoś modułu, występują błędy powodujące duplikację treści do innych podkategorii lub filtrów.
Opisy produktów kopiowane od producentów – częstym zjawiskiem jest wdrażanie opisów produktów od dostawców. W niektórych sytuacjach specyfikacja produktu jest tak specjalistyczna, jak chociażby specyfikacja techniczna laptopów, że nie da się inaczej. Niemniej w takiej sytuacji można stworzyć osobny opis do pozycjonowania, a ten agregowany opis warto wyłączyć z indeksacji.
Kanibalizacja fraz kluczowych – nazewnictwo nieco inne, ale sens jest taki sam. Oznacza to, że dla kilku różnych podstron jest w meta danych wdrożona taka sama fraza kluczowa. Jest to bardzo częste zjawisko i jednocześnie mocno szkodzi stronie pozycjonowanej.

2. Duplikaty występujące poza stroną

W tej sytuacji treści ze stron, sklepów czy portali internetowych występują na stronach zewnętrznych. Takie, które najbardziej szkodzą stronie pozycjonowanej i spotykam na co dzień to:

Podkradanie treści pomiędzy portalami – portale informacyjne często obserwują się między sobą, co umieszczają u siebie inni. Aby szybko umieścić jakiś news u siebie, tekst jest po prostu kopiowany. W sytuacji, kiedy portal cieszy się wyższym autorytetem dochodzi do sytuacji, kiedy skopiowany tekst szybciej indeksuje się na portalu, który „podkradł” tekst niż w oryginalnym odpowiedniku.
Opisy produktów na Allegro – czasem zdarzają się takie sytuacje, że sklep wdraża nowe produkty, przygotowuje do nich opisy i za pomocą automatycznej integracji, opis jest eksportowany do aukcji na Allegro. Dochodzi do sytuacji, gdzie opis na Allegro jest szybciej indeksowany niż na samym sklepie.
Sklepy dropshippingowe – spotykam sklepy internetowe, które są integrowane z hurtowniami. Produkty wraz ze stanami magazynowymi i opisami automatycznie są pobierane do tychże sklepów oferujących te same produkty. Właściciele tych sklepów nie wiedzą, że opisy powinny być unikalne lub ignorują taką sytuację.

Jakub Wasilewski z http://seoninja.pl

jakub wasilewski

W mojej opinii o duplicate content powinno się martwić szczególnie w tych przypadkach, gdzie:

Pod więcej niż jedną domeną istnieje ten sam serwis.
Jak wyżej, ale w specyficznym przypadku jeśli serwis istnieje pod adresem www.nazwadomeny.pl i nazwadomeny.pl bez odpowiednich przekierowań, to samo dotyczy wersji http i https.
Tu nie dostajemy kary jak niektórzy sądzą, ale po prostu marnotrawimy nie przekierowane linki i crawl budget.
Jeśli cała duża sekcja strony jest identyczna z treściami na innej stronie, np 90% produktów w sklepie ma identyczne opisy, h1, title. Tu po prostu będzie nam się trudno przebić z naszymi treściami.

Odnośnie wykrywania duplikacji treści używam:

Do raportu wszystkich stron w Google Analytics dodaję wymiar Nazwa Hosta i sprawdzam, czy strona nie działa pod wieloma adresami.
Podobną analizę, m.in. subdomen wykonuję w Senuto i Semstorm.
Duplikację treści sprawdzam CopyScape oraz Siteliner.

Krzysztof Marzec z https://www.devagroup.pl

krzysztof marzec

Większość z branży SEO źle postrzega duplikaty, a raczej inaczej niż na to patrzy Google. Google mówi o kopii całego serwisu jako problemie, a nie o duplikacji poszczególnych akapitów. Przecież apteki nie mogą tworzyć unikalnych opisów lekarstw czy też sklepy unikalnych opisów technicznych dla sprzętów AGD. Jeżeli wychodzi nowy telefon Samsung S8 to sklepy nie tworzą do niego unikalnego opisu tylko biorą od producenta, Google o tym znakomicie wie i dopuszcza takie kopie akapitów.

Innym przykładem jest Ceneo, które opiera się tylko i wyłącznie na skopiowanym kontencie i ma się w wynikach bardzo dobrze. Szkodzi kopia strony na innym adresie, a nie duplikaty contentu. W przeciwnym razie Ceneo nie miałby prawa bytu w Google.

Tomasz Wieliczko z https://xann.pl

tomasz wieliczko

Przykładów mógłbym podać wiele, ale jeśli 3, to niech będzie:

Indeksacja widoków, sesji, porzuconych koszyków – nie będę powtarzał się już z indeksacją tagów, listingów produktów ze względu na sortowanie itd., co wydaje się oczywiste, ale indeksacja dodatkowych widoków (np. mobilnych, co jest obecne w wielu szablonach na starsze Magento), porzuconych pustych koszyków i całych sesji (w Magento parametr URL „SID”) wydają się mało oczywiste, ale przy odpowiedniej skali, uniemożliwiają jakiekolwiek działania bez ich wyeliminowania.
Duplikacja zewnętrzna z porównywarkami produktów / domami handlowymi – typowy problem w większości e-commerce niezależnie od rozmiarów. Zaciągnięcie wyplutego przez WooCommerce albo Prestę .xml’a (który bazuje na tych samych atrybutach i zawartości, co właściwy sklep) do porównywarek to kiepski pomysł szczególnie dla początkujących. A jeśli właściciel sklepu zdecyduje się równolegle pracować z kilkoma porównywarkami, albo co gorsza tzw. domami handlowymi, które są w praktyce nakładkami na ich całą infrastrukturę, to potencjał na poprowadzenie efektywnej dobrej kampanii bez pozbycia się duplikatów jest niski.
Duplikacja warunków wysyłki / płatności w ukrytym tab’ie na karcie produktu – mimo że zdarza się to coraz rzadziej, to na rynku nie brakuje sklepów, których karty produktowe „ciągną za sobą” 2-4 tys. znaków warunków wysyłek / płatności, jakie zwyczajowo ukrywano (a nadal zdarza się, że ukrywa się) w tab’ach. I tak, np. mamy produkt, który zawiera 200 znaków unikalnej treści i 4 tys. znaków warunków wysyłki. A wystarczyło posłużyć się prostym hover’em („jakim kurierem wysyłacie paczki”, „ile zapłacę za wysyłkę?”) z odnośnikami do konkretnych podstron.

Adrian Pakulski z http://paq-studio.com

adrian pakulski

Aby w pełni zrozumieć problem jakim jest duplicate content, musimy postawić się w roli wyszukiwarki, która chce przedstawić użytkownikowi jak najlepsze informacje – wyświetlić mu najtrafniejsze wyniki na jego zapytanie.

Duplicate content oznacza, że ta sama treść wyświetla się na wielu adresach url, przez co wyszukiwarka Google gubi się i nie wie co ma wyświetlić użytkownikowi.

Najbardziej znanymi przykładami DC są opisy w kategoriach oraz produktach występujące w sklepach internetowych. Wyróżnić możemy dwa przykłady duplikacji: wewnętrzna i zewnętrzna.

DC wewnętrzny występuje wtedy, gdy np. mamy powielone opisy w kategoriach produktów. Najczęściej jeden opis występuje na wszystkich podstronach (na stronicowaniu) w obrębie jednej kategorii.

Inaczej wygląda sprawa w przypadku duplikacji zewnętrznej. Najprościej mówiąc występuje wtedy, kiedy ktoś skopiuje treści występujące na naszej stronie. Najczęstszym przykładem tego zjawiska jest kopiowanie opisów produktów ze stron producentów.

Niestety bardzo ciężko temu zaradzić, nawet jeśli zablokujemy możliwość kopiowania testów w naszym serwisie, zawsze ktoś może podejrzeć źródło naszej strony i skopiować interesującą go zawartość.

Kolejnym przykładem powielonej treści są takie same meta tagi na wielu lub wszystkich podstronach. Właściciele stron często zapominają o tym elemencie i ustawiają w tytułach tylko nazwę firmy, a meta opisy zostawiają nieuzupełnione. Warto zadbać o unikalne tagi title dla każdej strony, wyszukiwarki zwracają na to uwagę.

Jako ostatni przykład niech posłuży duplikacja treści która występuje w przypadku wdrożenia https. Serwis występuje w dwóch wersjach: https://twojadomena.pl oraz http://twojadomena.pl, dla Google są to dwie różne strony z taką samą zawartością. Koniecznie trzeba wykonać przekierowanie 301 na jedną wersję strony, najsensowniejsze będzie skierować ruch na wersję z certyfikatem SSL. Ta sama sytuacja ma miejsce w przypadku, gdy używamy wersji strony z www i bez www w adresie.

Michał Całka z https://octamedia.pl

michał całka

Warto wyraźnie rozdzielić zagadnienie powielania treści w obrębie tej samej witryny/domeny od kopiowania treści w obrębie wielu witryn/domen.

Powielanie treści w obrębie naszej domeny:

Brak kanonicznych adresów URL strony głównej i jej podstron (często spotykany błąd z WWW i BEZ WWW oraz HTTP i HTTPS.
Przykład 1 – strona główna może zostać zaindeksowana pod adresami https://domena.pl/ https://www.domena.pl/ , http://domena.pl/ , http://www.domena.pl/
Przykład 2 – podstrony mogą zostać zaindeksowane pod adresami https://domena.pl/oferta.html , https://www.domena.pl/oferta.html , http://domena.pl/oferta.html , http://www.domena.pl/oferta.html
Kopiowanie obszernych fragmentów tekstów między różnymi stronami jednej witryny np. znaczna część treści z adresu www.domena.pl/o-firmie.html jest skopiowana do zakładek typu www.domena.pl/oferta-1.html www.domena.pl/oferta-2.html
Tworzenie kopii całej strony domena.pl poprzez zaindeksowanie jej wersji testowych na subdomenach np. test.domena.pl czy www2.domena.pl
Tworzenie kopii strony głównej domena.pl poprzez adresy typu: domena.pl/index.html czy domena.pl/index.php
Duplikowanie treści opisów kategorii na stronach paginacji w sklepach internetowych np. domena.pl/bizuteria-zlota/ i domena.pl/bizuteria-zlota/page-2/ , domena.pl/bizuteria-zlota/page-3/

Powielanie treści w obrębie różnych domen:

Ta sama zawartość witryny w obrębie różnych końcówek domeny np. mojadomena.pl , mojadomena.com, mojadomena.eu . Często spotykany problem w przypadku właścicieli firm, którzy jednocześnie wykupują wszystkie rozszerzenia domen dla nazwy firmy i stawiają na nich jeden serwis z tą samą zawartością.
Skopiowana zawartość całej strony. Właściciel domeny lub Webmaster zamówił projekt graficzny nowej strony, lecz zapomniał zamówić treści u Copywritera stąd pomysł by „pożyczyć treści” od witryn konkurencyjnych.
Skopiowana zawartość fragmentów witryny bez zgody właściciela. Pracownik marketingu napisał artykuł na stronę firmową, który jest następnie kopiowany przez konkurencję lub portale internetowe bez zgody firmy.
Skopiowana zawartość fragmentów witryny przez jej właściciela. Bardzo często w procesie link buildingu kopiowane są treści z różnych zakładek typu „o firmie”, „oferta”.
W przypadku e-commerce często spotykanym przykładem powielania treści są opisy pozycjonowanych podstron kategorii, producentów lub produktów.

Kamil Dudziak z https://afterweb.pl

kamil dudziak

Duplikacja treści na stronie może być wynikiem świadomego działania – idziemy na skróty i kopiujemy na przykład opisy produktów do sklepu internetowego. Duplikacja może też wynikać z nieprawidłowo zaprojektowanej strony, wtedy możemy nie zdawać sobie sprawy, że w naszej witrynie dochodzi do duplikacji treści.

Warto więc od czasu do czasu przeprowadzić weryfikację z wykorzystaniem narzędzi. My stosujemy w tym celu narzędzie Siteliner, które bezpłatnie przeanalizuje do 250 stron miesięcznie. Przy większych liczbach stron trzeba wykupić płatną wersję. Stosujemy także inne tego typu narzędzie: Copyscape. W naszej agencji świetnie sprawdza się także DeepCrawl. Nie jest to narzędzie wyspecjalizowane w wyszukiwaniu duplikacji, ale pośród wielu funkcji ma i tę. Podobnie zresztą jak inne tego typu zaawansowane narzędzia z branży SEO, które stosujemy w codziennej pracy, jak chociażby Screaming Frog, Ahrefs i Sitebulb.

Wreszcie, stosujemy bardzo proste i dostępne dla każdego rozwiązanie. Jeśli mamy podejrzenia, że konkretna strona może być duplikatem, wklejamy jej treść do Google. To również skuteczna metoda weryfikacji treści nie tylko w obrębie własnej witryny, ale również w odniesieniu do innych stron.

Artur Wojczal z https://widoczni.com

artur wojczal

Do wykrycia duplikacji treści korzystam z narzędzi: Siteliner, Copyscape, Google 😉

Wojciech Władziński z http://www.seowordpress.pl/

wojciech władziński

Przykład 1: Duplikacja wewnętrzna (w obrębie własnej strony).
Przykład 2: Duplikacja (kradzież) treści i zamieszczenie ich na innych stronach.
Przykład 3: Duplikacja struktury adresów (brak poprawnie ustawionych przekierowań rewrite).

Do szybkiego sprawdzenia duplikatów tekstu najlepiej wykorzystać wyszukiwarkę Google, wklejając w nią fragment tekstu ze strony (najlepiej z użyciem cudzysłowu). Bardziej rozbudowanymi narzędziami do ciągłego monitorowania duplikacji treści jest platforma Copyscape.com, a także Google Alerts.

Jakub Brożyna z http://seosklep24.pl

jakub brożyna

Poruszając tematy w obrębie duplicate content warto pochylić się nie tylko nad samymi stronami www, a również nad Web 2.0. Przykładowo opisy filmów na YouTube – często nie są zoptymalizowane pod kątem wyszukiwarki, a nawet są tą samą powielaną regułką. Warto pamiętać iż YT jest drugą największą wyszukiwarką na świecie – to samo tyczy się pola „Tagi”. Kolejna kwestia to hasztagi na Instagramie. Jak powszechnie wiadomo algorytm Instagrama wymaga, aby hasztagi nie powielały się pod każdym zdjęciem, a dokładnie opisywały dany obraz. W przypadku nagminnej duplikacji może czekać nas „shadow ban”. Kolejna kwestia to wpisy na GMB, często są po prostu kopią lub częścią artykułów na naszej stronie a wydaje nam się iż warto poświęcić te kilka minut i napisać unikalny opis, aby móc zalinkować z business.site do naszego artykułu na stronie 😉 Następnie wizytówki NAP – większość firm kopiuje „o nas” ze strony i wkleja je do kilku, kilkunastu portali – nie tędy droga! Co do stron to tak jak już się koledzy wypowiedzieli: title, meta, H1, H2 i oczywiście content!

Narzędzia:

Google
Screaming Frog
Ahrefs – Site audit

Igor Wiśniewski z https://adwave.eu/

Igor Wiśniewski

Jak sprawdzić Duplicate Content z narzędziami SEO?

Dobrym sposobem jest sprawdzenie duplikacji z poziomu darmowego lub płatnego oprogramowania dostępnego w Internecie.

#1 – Wyszukiwarka Google

Najszybszym sposobem jest sprawdzenie duplikacji wewnętrznej z poziomu organicznych wyników wyszukiwania.

W pole wyszukiwarki Google wpisz site:nazwadomeny.pl „ciąg znaków, który podejrzewasz o duplikację treści”. Ciąg znaków w cudzysłowach może zawierać nawet kilka zdań.

#2 – Siteliner

Siteliner – narzędzie do badania duplikacji wewnętrznej pod kątem nasycenia słów kluczowych na stronie. Pokazuje, które adresy zawierają najbardziej zduplikowaną treść. Przydatne, aby wychwycić przesycane frazy kluczowe na stronie.

Strona narzędzia: http://www.siteliner.com/

#3 – Copyscape

Copyscape – narzędzie informuje, czy content publikowany pod danym adresem URL jest unikalny w Internecie. Jeżeli zostanie namierzone zjawisko DC, to narzędzie pokaże adres URL duplikujący wraz z podświetleniem powielonego tekstu. W efekcie szybko można zidentyfikować adresy stron internetowych, które dopuściły się kradzieży treści z Twojej strony.

Strona narzędzia: http://www.copyscape.com/

#4 – Seoreviewtools

Seoreviewtools – narzędzie do badania internal DC i external DC. Wyświetla adresy podstron, gdzie zostało namierzone zjawisko duplikacji treści. Rejestracja konta jest darmowa.

Strona narzędzia: http://www.seoreviewtools.com/duplicate-content-checker/

#5 – Udoskonalenia HTML w Google Search Console

Udoskonalenia HTML – funkcjonalność darmowego narzędzia Google Search Console, która prezentuje wszelkie problemy z duplikacją meta tagów: tytułu czy meta description. Pomocne w optymalizacji strony pod SEO.

Strona narzędzia: https://www.google.com/webmasters/tools/

#6 – Screaming Frog

Screaming Frog – przydatne narzędzie w optymalizacji strony pod SEO. Pod kątem DC pozwala namierzyć zduplikowane podstrony oraz powielania meta tagów: tytułu, meta description czy nagłówków. Narzędzie za darmo sprawdzi 500 adresów URL.

Strona do pobrania narzędzia: https://www.screamingfrog.co.uk/

#7 – Xenu Link Sleuth

Xenu Link Sleuth – narzędzie całkowicie darmowe. Pozwala namierzyć duplikację podstron oraz meta tagów tytułów i meta description dla całej strony (niezależnie od wielkości strony).

Strona do pobrania narzędzia: http://home.snafu.de/tilman/xenulink.html

Szybkie indeksowanie w Google

Najlepszym sposobem, aby szybko zindeksować stronę główną bądź dowolny adres URL jest skorzystanie z formularza zgłaszania strony do Google – https://www.google.com/webmasters/tools/submit-url. Po zgłoszeniu adresu, Google szybko dostrzeże unikalny tekst, doda adres do indeksu i przypisze oryginał treści do Twojej domeny. W pewien sposób zabezpieczysz się przed kradzieżą treści ze strony.

Zobacz wideo poradnik

Submit URL w praktyce.

Alternatywnym rozwiązaniem jest skorzystanie z instrukcji Google Search Console, aby zainstalować narzędzie na własnej stronie. Po wykonaniu instalacji GSC należy odwiedzić funkcjonalność „Pobierz jako Google” i zgłosić nowy adres do indeksu wyszukiwarki.

Zobacz wideo poradnik

Pobierz jako Google.

Duplikacja treści czy unikalna treść?

Duplikację treści można przyrównać do świata rzeczywistego. Jakie są konsekwencje plagiatu książek, prac magisterskich czy utworów muzycznych? Zapewne już wiesz, że czekają Cię kłopoty…

A teraz przejdźmy do świata wirtualnego…

Jak wyglądałby Internet, gdyby użytkownik wpisując dowolne zapytanie do wyszukiwarki Google otrzymałby 10 identycznych wyników organicznych na pierwszej stronie? Użytkownik nie otrzymałby żadnej wartości dodanej. Wyszukiwarka Google stałaby się bezużyteczna, ponieważ prezentowane wyniki wyszukiwania byłyby niskiej jakości.

W jakim celu Google miałoby promować treść, która została skopiowana z innej strony www?

Skuteczne pozycjonowanie strony internetowej, która zawiera duplikaty treści jest niemożliwe.

Duplikaty treści, to brak wartości dodanej dla użytkownika. W tym celu Google uruchomił algorytm Panda. Zadaniem algorytmu jest karanie stron niskiej jakości, które zawierają powielane, zduplikowane treści. W konsekwencji spada widoczność strony, pozycje słów kluczowych, ruch na stronie i dopływ klientów z organicznych wyników wyszukiwania.

Jedną z największych kar Google jest wycięcie strony z indeksu wyszukiwarki Google, która powiela treści w celu manipulowania rankingiem.

Chcesz zdobyć klientów z Internetu? W pierwszej kolejności musisz zainwestować pieniądze w ciekawą i oryginalną treść.

Zobacz wideo poradnik

5 żelaznych zasad – jak pisać teksty SEO?

A może nie masz czasu na tworzenie treści? Możesz zamówić teksty tematyczne i specjalistyczne przez platformę TextBookers z realizacją zamówienia nawet w 48 h. Poznaj moją opinię o TextBookers wraz z instrukcją korzystania z platformy.

Rodzaje Duplicate Content

Wyróżniamy dwa rodzaje duplikacji treści:

Duplikacja wewnętrzna (internal DC) – polega na powielaniu treści wewnątrz jednej domeny na różnych adresach URL.
Duplikacja zewnętrzna (external DC) – polega na powielaniu identycznej treści na zewnętrznych domenach internetowych.

Przykłady duplikacji wewnętrznej na stronie

Zajmijmy się duplikacją wewnętrzną już od początku tworzenia strony internetowej.

#1 – Strona testowa i strona oficjalna

Istnieją przypadki, że przed uruchomieniem oficjalnej strony internetowej – witrynę buduje się na stronie testowej. Problem zaczyna się pojawiać w sytuacji, gdy strona testowa i strona oficjalna indeksują się w Google. W efekcie powstaje duplikacja treści i Google jako oryginał może uznać stronę testową, gdyż jako pierwsza mogła pojawić się w indeksie wyszukiwarki.

Rozwiązanie problemu:

Strona testowa nie może być zindeksowana w Google.

Poniższy kod meta robots umieść w sekcji head dla każdej strony testowej:


<meta name="robots" content="noindex, nofollow">

Alternatywnym rozwiązaniem jest zablokowanie dostępu do testowej strony w pliku robots.txt.

Poniższy kod blokuje dostęp do strony dla robotów sieciowych:

User-agent: *
Disallow: /

#2 – Duplikacja wersji desktopowej i mobilnej

Niektórzy właściciele stron nadal preferują tworzenie strony w wersji desktopowej i osobnej strony w wersji mobilnej. Osobiście preferuje tworzenie stron w wersji responsywnej, czyli RWD – gdzie strona automatycznie dopasowuje się do każdej rozdzielczości ekranu na jednym adresie URL.

Posiadając stronę w wersji deskotopowej i mobilnej następuje duplikacja treści:

twojadomena.pl – wersja desktopowa
m.twojadomena.pl – wersja mobilna

Rozwiązanie problemu:

Dla strony głównej w wersji desktopowej trzeba wskazać w sekcji head alternatywny adres na wersji mobilnej.


<link rel="alternate" href="https://m.twojadomena.pl">

Dla strony głównej w wersji mobilnej trzeba wskazać w sekcji head adres kanoniczny wersji desktopowej.


<link rel="canonical" href="https://twojadomena.pl" />

#3 – Duplikacja strony głównej

Jeden z najpopularniejszych problemów związanych z Duplicate Content dotyczy właśnie głównej strony startowej, która dostępna jest dla robotów sieciowych pod wieloma adresami URL.

Przykładowe adresy, które mogą duplikować stronę główną:

http://projektmarketing.pl
http://www.projektmarketing.pl
https://projektmarketing.pl
https://www.projektmarketing.pl
http://projektmarketing.pl/index.html
http://projektmarketing.pl/index.php

Powyżej widzimy kilka przykładowych adresów URL strony głównej, które wywołują Duplicate Content. Google nie rozumie, który adres strony głównej jest adresem docelowym. Dobrym rozwiązaniem jest przekierowanie 301 (Redirect 301), które pozwala trwale przenieść moc z jednego adresu na drugi adres. To zaledwie jeden z wielu przypadków, gdzie można wykorzystać potencjał tego rodzaju przekierowania.

Zobacz wideo poradnik

Duplikacja strony głównej.

Rozwiązanie problemu:

Wklej do pliku .htaccess następujący kod, który uruchomi https pod przeglądarką. Popraw wszystkie linki wewnętrzne, aby prowadziły do jednego adresu strony głównej.

<IfModule mod_rewrite.c>
RewriteEngine On
RewriteCond %{HTTP_HOST} ^www\.(.*)$ [NC]
RewriteRule ^(.*)$ https://%1/$1 [R=301,L]
RewriteCond %{HTTPS} !=on [NC]
RewriteRule ^(.*)$ https://%{HTTP_HOST}%{REQUEST_URI} [R=301,L]
</IfModule>

#4 – Duplikacja adresów URL podstron

Strony internetowe zbudowane na autorskich, przestarzałych systemach CMS mogą wywoływać adres jednej podstrony na kilku różnych adresach URL. W efekcie powstaje zjawisko duplikacji treści.

Rozwiązanie problemu:

Naprawienie systemu CMS lub blokowanie indeksowania podstron po określonych parametrach, które mogą wywoływać DC.

#5 – Powielanie identycznego bloku tekstu na różnych adresach URL

Wyobraź sobie że posiadasz 1000 znaków ze spacjami powielanego tekstu na każdej stronie.

Przy założeniu, że unikalne opisy na podstronach posiadają tylko 500 znaków – duplikacja staje się czynnikiem, który może obniżyć widoczność strony w Google.

Tak znacząca duplikacja może spowodować obniżenie widoczności wszystkich podstron w Google, ponieważ algorytm Panda może je potraktować jako strony niskiej jakości.

Rozwiązanie problemu:

Usunięcie identycznych bloków treści, które są duplikowane na różnych adresach URL. Alternatywnym rozwiązaniem jest umieszczenie pliku graficznego z tekstowym komunikatem, zamiast powielanego tekstu na każdej stronie.

#6 – Powielanie opisów stron produktowych

Najczęstszy problem związany duplikacją treści w sklepach internetowych. Problem polega na tym, że opisy produktów są kopiowane bezpośrednio ze strony producenta lub dystrybutora. Następnie powielane opisy są opublikowane w sklepie internetowym, co może wywołać bardzo negatywne zjawisko związane z duplikacją treści.

Przy założeniu, że sklep zawiera 1000 podstron, a adresów zduplikowanych produktów jest 900 – powstaje znaczący Duplicate Content. Algorytm Panda z pewnością oceni ten sklep, nadając status strony niskiej jakości.

Zobacz wideo poradnik

Jak powinna wyglądać struktura produktów w sklepie internetowym pod SEO?

Link do wpisu: https://projektmarketing.pl/struktura-produktow-i-tekst-seo-w-pozycjonowaniu-sklepow-internetowych/

Rozwiązanie problemu:

Dane techniczne i właściwości produktu nie ulegają zmianie. Dodanie przynajmniej 1000 znaków unikalnego tekstu na stronie produktowej do skopiowanego opisu ze strony producenta może zwiększyć widoczność na słowa z długiego ogona i zwiększyć procent unikalności treści w całym serwisie.

Możesz zamówić unikalny, wartościowy opis produktu na platformie TextBookers w cenie 3,20 pkt (3,94 PLN brutto) / 1000 znaków ze spacjami. Maksymalny czas realizacji napisania tekstu to 96 h. Jak widzisz cena napisania tekstu jest przystępna dla każdego właściciela sklepu internetowego.

Jeżeli masz ograniczony budżet, to wykorzystaj metodę małych kroków: zlecaj x tekstów w danym miesiącu i stopniowo nasycaj sklep unikalnymi treściami.

Bardzo dobrym rozwiązaniem jest uruchomienie modułu dodawania opinii o produkcie z gwiazdkami ocen, które zostaną wzbogacone o mikroformaty.

W efekcie uzyskasz darmowy, unikalny content z opinii napisanych przez użytkowników. Dodanie gwiazdek ocen w mikroformatach pozwoli wyświetlić gwiazdki w wynikach wyszukiwania i zwiększyć CTR (klikalność) stron produktowych. Warto skorzystać z darmowej reklamy w wynikach wyszukiwania i podnieść klikalność strony, która ma bezpośredni wpływ na pozycjonowanie stron w Google.

#7 – Paginacja i strony sortowania, a powielanie treści

Paginacja, czyli podział rozbudowanej strony na podstrony.

Zakładając, że posiadamy kategorię Meble warsztatowe i 5 stron paginowanych. W efekcie pojawia się 5 podstron, które zawierają zduplikowany tytuł oraz meta description.

Dla Google najważniejsza jest pierwsza strona, czyli wyjściowy adres URL kategorii.

Rozwiązanie problemu:

Wykorzystaj nowe atrybuty rel=”next” i rel=”prev” oraz canonical.

W ten sposób poinformujesz Google o relacjach pomiędzy podstronami:

next – informuje robota sieciowego, która podstrona jest następna.
prev – informuje robota sieciowego, która podstrona jest poprzednia.

Zakładając, że mamy kategorię meble warsztatowe: https://punktmeblowy.pl/kategoria-produktu/meble-warsztatowe/

Na 1 stronie paginacji w sekcji head umieszczamy:

<link rel="canonical" href="https://punktmeblowy.pl/kategoria-produktu/meble-warsztatowe/" />
<link rel="next" href="https://punktmeblowy.pl/kategoria-produktu/meble-warsztatowe/page/2/" />

Na 2 stronie paginacji w sekcji head umieszczamy:

<link rel="canonical" href="https://punktmeblowy.pl/kategoria-produktu/meble-warsztatowe/page/2/" />
<link rel="prev" href="https://punktmeblowy.pl/kategoria-produktu/meble-warsztatowe/" />
<link rel="next" href="https://punktmeblowy.pl/kategoria-produktu/meble-warsztatowe/page/3/" />

Na 3 stronie paginacji w sekcji head umieszczamy:

<link rel="canonical" href="https://punktmeblowy.pl/kategoria-produktu/meble-warsztatowe/page/3/" />
<link rel="prev" href="https://punktmeblowy.pl/kategoria-produktu/meble-warsztatowe/page/2/" />
<link rel="next" href="https://punktmeblowy.pl/kategoria-produktu/meble-warsztatowe/page/4/" />

Na 4 stronie paginacji w sekcji head umieszczamy:

<link rel="canonical" href="https://punktmeblowy.pl/kategoria-produktu/meble-warsztatowe/page/4/" />
<link rel="prev" href="https://punktmeblowy.pl/kategoria-produktu/meble-warsztatowe/page/3/" />
<link rel="next" href="https://punktmeblowy.pl/kategoria-produktu/meble-warsztatowe/page/5/" />

Na 5 stronie paginacji w sekcji head umieszczamy:

<link rel="canonical" href="https://punktmeblowy.pl/kategoria-produktu/meble-warsztatowe/page/5/" />
<link rel="prev" href="https://punktmeblowy.pl/kategoria-produktu/meble-warsztatowe/page/4/" />

Alternatywnym rozwiązaniem jest samodzielny canonical.

Zobacz wideo poradnik

Jak sobie radzić z duplikacją treści przez canonical na Joomla?

#8 – Duplikacja tytułu i meta description

Tytuł i meta description, to kluczowe znaczniki do opisu zawartości stron internetowych w wyszukiwarce Google.

Standardowy wynik wyszukiwania Google zawiera:

Tytuł – powinien zawierać około 60 znaków z najważniejszą frazą wybraną do pozycjonowania (silny wpływ na pozycjonowanie).
Przyjazny adres URL – zawiera słowa kluczowe rozdzielone myślnikiem (może zwiększyć klikalność strony, mały wpływ na pozycjonowanie).
Meta description – meta opis wydłużony przez Google nawet do 320 znaków, tekst reklamowy zawierający frazy kluczowe i zachęty do wejścia na stronę (może zwiększyć klikalność strony poprzez zastosowanie „call to action” i znaków specjalnych).

Najbardziej negatywnym zjawiskiem jest powielenie treści tytułu i meta description na każdej podstronie serwisu. W efekcie Google może mieć problemy, aby zrozumieć tematykę i zawartość danej strony. Nie uzyskasz wysokich pozycji słów kluczowych w Google, ponieważ strona internetowa nie jest zoptymalizowana pod kątem SEO.

Gdzie namierzyć problemy z tytułami i meta description?

Zainstaluj narzędzie Google Search Console i przejdź do udoskonalenia HTML, gdzie namierzysz wszystkie najważniejsze problemy z meta tagami.

Zobacz wideo poradnik

Udoskonalenia HTML w Google Search Console.

Rozwiązanie problemu:

Idealna jest sytuacja, kiedy znacznik tytułu i meta description jest ustawiony ręcznie z uwzględnieniem najważniejszych słów kluczowych, które opisują zawartość danej podstrony. Optymalne ustawienia tytułu i meta description przygotuje specjalista SEO.

Zobacz wideo poradnik

Jak napisać unikalny tytuł i meta description wpisu na blogu?

#9 – Duplikacja kategorii i tagów

Nazewnictwo kategorii oraz tagów należy starannie rozpisać w pliku excel lub na kartce papieru.

Kategorie służą do grupowania tematów szerokich, np: Meble warsztatowe (kategoria produktów).
Tagi do grupowania tematów wąskich, np: RAConstruction (nazwa producenta, nazwa autora).

Unikaj stosowania takich samych nazw tagów i kategorii.

Nie wolno dopuścić do sytuacji, gdzie będziesz tworzył 10 bliźniaczo podobnych tagów. W efekcie zostanie wygenerowanych 10 podobnych adresów URL, które będą dotyczyły jednego tematu. Moc płynąca po stronie zostanie przekazana, rozbita na 10 sztucznych podstron.

Rozwiązanie problemu:

Wykorzystuj maksymalnie 2 lub 3 unikalne tagi w artykule. Jeżeli nie masz szerszego pojęcia o tagach, to lepiej całkowicie z nich zrezygnuj. Podobne tagi możesz usunąć i wykonać przekierowanie 301 na jeden unikalny tag.

#10 – Wyszukiwarka na stronie

Wewnętrzna wyszukiwarka na stronie może być bardzo przydatna. Przy drobnej konfiguracji w Google Analytics można monitorować zapytania, jakie użytkownicy wpisują do wyszukiwarki na stronie.

Zobacz wideo poradnik

Jak monitorować wyszukiwania w witrynie?

Uruchomienie wyszukiwarki na stronie może prowadzić do duplikacji treści.

Rozwiązanie problemu:

Wystarczy zablokować robotom indeksującym parametr generowany przez wewnętrzną wyszukiwarkę.

W przypadku wyszukiwarki w WordPress do pliku robots.txt należy wkleić następujący kod:

User-agent: *
Disallow: /?s=

#11 – Duplikacja wersji językowych

Ostatnio podczas robienia audytu SEO dla jednego z klientów spotkałem bardzo interesujący problem z duplikacją treści. Problem polegał na tym, że teksty polskiej wersji językowej oraz teksty zagranicznych wersji językowych zostały opublikowane niezmiennie w języku polskim.

W efekcie powstał wielokrotny Duplicate Content, który skutkował drastycznymi spadkami w Google. Polskie frazy kluczowe zaczęły rankować w Google na zagranicznych adresach URL. Tak nie powinno być. Jest to bardzo kosztowna pomyłka wynikająca z błędnej struktury sklepu internetowego pod SEO.

Rozwiązanie problemu:

Wszystkie wersje zagraniczne powinny zostać jak najszybciej przetłumaczone na język charakterystyczny dla danego kraju:

Wersja polska – przetłumaczenie strony na język polski.
Wersja niemiecka – przetłumaczenie strony na język niemiecki.
Itd.

Jeżeli proces przetłumaczenia sklepu na wersjach językowych zostanie wydłużony w czasie, wówczas warto wyindeksować wszystkie wersje zagraniczne z wyników wyszukiwania. Proces ponownego zaindeksowania wersji językowych w Google powinien nastąpić po całkowitym przetłumaczeniu danej wersji językowej.

Zobacz wideo poradnik

Duplikacje wersji językowych sklepu internetowego na PrestaShop – rozwiązanie problemu.

Link do wpisu: https://projektmarketing.pl/jak-uniknac-duplikacji-tresci-na-wersjach-jezykowych-prestashop/

#12 – DC z wildcard

Wildcard – to przydatna funkcja dla doświadczonych administratorów stron. Pozwala szybko uruchomić subdomeny. Aktywując funkcjonalność wildcard na głównym adresie twojadomena.pl zindeksowane subdomeny w Google będą wskazywać stronę główną. W ten sposób generowany jest Duplicate Content strony głównej na poziomie subdomeny.

Najgorsza sytuacja występuje wtedy, gdy w Google indeksują się subdomeny wskazujące na stronę główną. W efekcie powstaje wielokrotny DC, który trzeba wyeliminować.

Rozwiązanie problemu:

Zweryfikuj, czy hosting uruchomił funkcjonalność wildcard. Jeżeli moduł został aktywowany, to należy go wyłączyć.

Zakładając, że posiadasz już aktywowany wildcard – to według mnie najlepszym rozwiązaniem jest wdrożenie poprawnego canonical.

#13 – Duplikacja wpisu i PDF

Popularne osoby zajmujące się marketingiem internetowym rekomendują, aby udostępnić użytkownikom 3 formy treści:

Wpis na blogu.
PDF, który zawiera wpis na blogu.
Materiał wideo.

Problem występuje w momencie, gdy publikujemy wpis na blogu i dokument PDF z powielaną zawartością wpisu.

W efekcie wpis na blogu i materiał PDF z identyczną zawartością jest dostępny pod 2 różnymi adresami URL, powodując duplikację treści.

Rozwiązanie problemu:

Idealnie, gdy na bazie wpisu na blogu powstaje unikalny dokument PDF. Dokumentem PDF może być transkrypcja wideo.

Jeżeli jednak zawartość wpisu jest powielana w PDF, wówczas:

Dodaj do linków PDF atrybut nofollow.
W .htaccess dodaj canonical na PDFie, który wskazuje na oryginalny wpis blogowy.

Przykłady duplikacji zewnętrznej

Poznałeś najważniejsze przykłady wewnętrznego powielania treści i sposoby rozwiązywania problemów. Poniżej prezentuję listę przykładowych błędów, które wynikają z duplikacji zewnętrznej. Mówiąc o duplikacji zewnętrznej mam na myśli świadome i nieświadome działania, jakie są wykonywane na zewnętrznych domenach internetowych.

#1 – Mikrostrony i mikroblogi

Często napotykam sytuację, że klient jest dosyć dobrze zoptymalizowany, natomiast ma problemy z budowaniem widoczności w Google. Przyczyną problemów może być obecność mikrostron, które całkowicie duplikują zawartość głównej domeny pozycjonowanej. Niektórzy właściciele stron uważają, że obecność kilku domen z powieloną zawartością może pomóc w efektywnym pozycjonowaniu strony.

W efekcie powstaje kopia lub kopie serwisu, gdzie wszystkie domeny indeksują się w Google wraz z identyczną treścią.

Rozwiązanie problemu:

Powielanie tej samej treści pod inną domeną internetową szkodzi w pozycjonowaniu strony. Najlepszym rozwiązaniem jest stworzenie unikalnej treści na stronie, która jest kopią serwisu.

Alternatywnym rozwiązaniem problemu jest wykonanie przekierowania 301 z domeny zawierającej kopię strony na domenę pozycjonowaną.

#2 – Katalogowanie strony

Popularnym sposobem pozyskiwania linków jest płatne katalogowanie strony. Metoda polega na dodaniu linka do katalogu strony internetowej wraz z krótkim opisem firmy, około 300-1500 znaków. Niektóre osoby, a nawet firmy świadczące usługi związane z katalogowaniem stron oferują publikację linków z powielonym opisem firmowym.

Tego rodzaju duplikacja może być także przeszkodą w budowaniu widoczności strony z kanału organicznego.

Zobacz wideo poradnik

Dodawanie serwisu do katalogu Wirtualna Polska z unikalnym opisem.

Rozwiązanie problemu:

Staraj się dodawać linki ręcznie i pisać unikalne opisy do katalogów stron internetowych. Możesz skorzystać z platformy TextBookers do zamówienia oryginalnych opisów do katalogów stron. Cena za 1000 znaków to 2,10 pkt (2,58 PLN brutto) – czas realizacji 48 h.

#3 – Kopie artykułów gościnnych i sponsorowanych

W ostatnim czasie znalazłem dwa tematyczne serwisy do publikacji darmowego artykułu gościnnego o tematyce żeglarstwa. Po przesłaniu dwóch sformatowanych artykułów wraz z linkiem, właściciel stron internetowych opublikował 2 artykuły w serwisie A i powielił zawartość 2 artykułów na stronie B.

Rozwiązanie problemu:

Dobrym rozwiązaniem jest uruchomienie na kopii artykułu – canonical wskazujący na oryginalną zawartość artykułu.

Więcej o powielaniu treści od Google: https://support.google.com/webmasters/answer/66359?hl=pl

Mam też do Ciebie ogromną prośbę. Jeżeli uznasz, że poradnik o Duplicate Content okazał się wartościowy i pomocny, to udostępnij go swoim znajomym lub podlinkuj. Gdziekolwiek… Niech inni ludzie też na tym skorzystają.

4.6/5 - (19 votes)

Unikalne artykuły o MARKETINGU I SEO Prosto na Twój najlepszy adres e-mail.

26 komentarze - Duplicate content i 16 przypadków szkodliwego powielania treści [PORADNIK SEO]

Agnieszka pisze:

22 stycznia 2018 o 08:50

Szacun za tak wielką dawkę wiedzy oraz za chęci podzielenia się wiedzą.

Odpowiedz
1. Paweł Duda pisze:
  
  22 stycznia 2018 o 09:05
  
  Nie ma za co 🙂 Zapraszam częściej na bloga 🙂
  
  Odpowiedz
Zgred pisze:

1 lutego 2018 o 19:19

Genialny artykuł – będziesz miał rzesze wielbicieli niebawem 😉 Wrzucam go do bibliografii do nowego wpisu 🙂

Odpowiedz
1. Paweł Duda pisze:
  
  1 lutego 2018 o 21:11
  
  Dzięki Paweł,
  
  Mam nadzieję, że ten artykuł dotrze do jak największej ilości odbiorców 🙂 Duplikacja treści jest jednym z największych problemów właścicieli stron, a nadal niewiele osób zdaje sobie z tego sprawę.
  
  Pozdrawiam.
  
  Odpowiedz
Artur Wojczal pisze:

22 lutego 2018 o 14:31

Świetny poradnik! Jeszcze raz wielkie dzięki za zaproszenie 😉

Odpowiedz
1. Paweł Duda pisze:
  
  22 lutego 2018 o 15:27
  
  A ja dziękuję za skorzystanie z zaproszenia 🙂 50% zaproszonych skorzystało – także dobra konwersja uważam 🙂
  
  Odpowiedz
Karolina Twardosz pisze:

22 lutego 2018 o 15:09

Jedyna kobieta w tak zacnym gronie, czuję się wyróżniona 😉 dzięki za tę możliwość, artykuł na super wysokim poziomie, oby tak dalej! Trzymam kciuki i mocno kibicuję.

Odpowiedz
1. Paweł Duda pisze:
  
  22 lutego 2018 o 15:31
  
  Karolino, dzięki za solidną dawkę wiedzy 🙂
  
  Odpowiedz
Krzysztof pisze:

22 lutego 2018 o 15:15

Dziękuję za artykuł i za filmy na YT. Teraz dopiero widzę jakie błędy są i jak wyglądała „praca” poprzedniej „agencji”. Dużo pracy przede mną 🙁 Jednocześnie mam pytanie. Czy w prestashop wpisanie tego samego opisu do: krótkiego opisu, powtórzenie w dużym opisie i skopiowanie do meta description powoduje również duplikację? Dzięki za odpowiedź!

Odpowiedz
1. Paweł Duda pisze:
  
  22 lutego 2018 o 15:40
  
  Dzięki Krzysiek,
  
  Moim zdaniem kopiowanie tekstu z zawartości strony i wklejanie do meta opisu nie ma sensu.
  
  W nawiązaniu do meta opisu polecam pisać ręczne meta zachęcające do wejścia na stronę z użyciem znaków specjalnych. Co prawda meta opis nie wpływa jakoś znacząco na pozycjonowanie, ale na CTR (klikalność strony) już tak. Z kolei klikalność ma już oficjalny wpływ na pozycje, więc warto zadbać o jego ręczne napisanie.
  
  Ustawianie meta opisu jest to praca raczej jednorazowa, chociaż ten CTR można optymalizować – jednak wymaga to dodatkowych nakładów, co przy rozbudowanych e-commerce generuje koszty (pieniężne lub czasowe).
  
  Odpowiedz
CiekawyMarketing pisze:

22 lutego 2018 o 20:55

Moim zdaniem dokument PDF nie powinien być traktowany jako duplikat. Tak może teoretyzując to przecież inny format. Ktoś sobie może go ściągnąć, żeby później wydrukować. Duplikatem można być nazwać taki sam PDF umieszczony na innej domenie, ale w ramach tego samego bloga, nie powinno być traktowane jako duplikat, Przynajmniej tak powinno to traktować google, tzn tak bym sobie tego życzył 🙂

Odpowiedz
1. Paweł Duda pisze:
  
  22 lutego 2018 o 21:28
  
  Może się tak zdarzyć, że PDF będzie wyższej niż np: wpis na blogu, a nie zawsze jest to pożądana sytuacja.
  Format PDF czy format HTML nie mają znaczenia, bo roboty skanują treści i linki osadzone w obu plikach, więc może to być DC (dużo zależy od wielkości domeny, wieku czy autorytetu). Więcej na ten temat – https://moz.com/community/q/can-pdf-be-seen-as-duplicate-content-if-so-how-to-prevent-it
  
  Ja wolę canonicalem na PDF wskazać oryginalną zawartość wpisu (pomocne do uniknięcia zewnętrznej duplikacji treści).
```
RewriteRule ([^/]+)\.pdf$ - [E=FILENAME:$1]
<FilesMatch "\.pdf$">
 Header add Link "< https://projektmarketing.pl/%{FILENAME}e >; rel=\"canonical\""
</FilesMatch>
```
  Jeżeli chciałbyś zrobić taką konstrukcję, to trzeba by było nazywać plik PDF jak adres URL wpisu na blogu, czyli
  
  https://projektmarketing.pl/struktura-produktow-i-tekst-seo-w-pozycjonowaniu-sklepow-internetowych/
  https://projektmarketing.pl/wp-content/uploads/2018/01/struktura-produktow-i-tekst-seo-w-pozycjonowaniu-sklepow-internetowych.pdf
  
  Jak wkleisz adres linku PDF do tego narzędzia – http://websniffer.cc/ – to zobaczysz, jak wygląda canonical w nagłówku HTTP.
  
  P.S. Przy małej ilości PDF w witrynie bym się nie przejmował duplikacją. Jeżeli masz dużo PDF powielających content i niewielki site, to warto się tym zainteresować.
  
  Odpowiedz
GOLDWEB pisze:

20 marca 2018 o 13:47

Dobra robota! Masz u mnie suba na YT 😉

Odpowiedz
1. Paweł Duda pisze:
  
  20 marca 2018 o 15:09
  
  Dzięki za cegiełkę, która umożliwi szybsze pozycjonowanie kanału na YT i poza nim 🙂
  
  Good job! 🙂
  
  Odpowiedz
Piotr pisze:

8 października 2018 o 18:42

Świetna robota Pawle, tak dużej dawki wiedzy o duplikacji jeszcze nie spotkałem w sieci. Sporo definicji, wyjaśnień problemu, poparte licznymi przykładami. Przyda się 🙂

Odpowiedz
1. Paweł Duda pisze:
  
  9 października 2018 o 00:11
  
  Jeszcze kilka przykładów można było napisać o duplikacji, ale i tak wyszedł spory „tasiemiec” 😉
  
  Odpowiedz
Mateusz Dudek pisze:

22 lutego 2019 o 11:17

Kawał dobrego, merytorycznego artykułu. Dużo przykładów, które zostały omówione i nie rozpisywałeś się celowo (same konkrety), a mimo to wyszedł spory artykuł – oczywiście jak najbardziej na plus 🙂 Dzięki!

Odpowiedz
Grzegorz pisze:

13 marca 2019 o 17:04

Przyznam szczerze, że artykuł jest wyczeprujący – gratuluję pracy 🙂 PS. czy mógłbyś napisać jakiej wtyczki używasz do stworzenia spisu treści? 🙂

Odpowiedz
1. Paweł Duda pisze:
  
  15 marca 2019 o 09:10
  
  Grzegorz,
  
  W filmie szczegółowa instrukcja, jak zrobiłem spis treści całkowicie za darmo – https://www.youtube.com/watch?v=REC–mkY8E4
  
  Odpowiedz
Tomasz pisze:

24 czerwca 2019 o 09:25

Musiałeś się sporo namęczyć pisząc ten artykuł. Z pewnością przełoży to się na wzrost oglądalności twojego serwisu. Zapisuję Twoją stronę do ulubionych 😉

Odpowiedz
Marcin pisze:

11 kwietnia 2020 o 11:04

Najlepszy artykuł jaki czytałem w tej tematyce i ogólnie o SEO.

Odpowiedz
Grzech Twardy pisze:

29 listopada 2020 o 17:32

Potężna dawka wiedzy. Na pewno się przyda

Odpowiedz
Sowa pisze:

1 grudnia 2020 o 15:48

Dobry artykuł – mało kto sobie zdaje sprawę z problemów, jakie płyną z duplikacji treści.

Najgorsze są sklepy internetowe i opisy produktów. Starasz się i je poprawiasz, a zaraz przyjdzie jakiś gamoń i przekopiuje wszystko.

Odpowiedz
Seochess.pl pisze:

26 grudnia 2020 o 16:27

To niebezpieczna rzecz, ale z tego co wiem nie ma czegoś takiego jak duplicate content. W sensie, Google za to nie karze, ale nie jest to pozytywne zjawisko. Spinowanie tekstu to katastrofalne rozwiązanie.

Odpowiedz
Foxmedio pisze:

3 lutego 2021 o 18:54

Bardzo dobry artykuł, trzeba być bardzo ostrożnym w przypadku duplikowania treści.

Odpowiedz
Grzegorz Szymański pisze:

2 lipca 2021 o 03:14

Jest mnóstwo sposobów, jak unikać duplicate content. Wiele z nich tutaj wymieniłeś, ale jest sporo innych o których trzeba wiedzieć. Ja też korzystam z atrybutów i rozwiązuje problem bardzo szybko.

Odpowiedz

POBIERZ DARMOWY PORADNIK "Jak wybrać dobrą agencję SEO?"

Duplicate content i 16 przypadków szkodliwego powielania treści [PORADNIK SEO]

Czym jest Duplicate Content?

Zagrożenia związane z namierzaniem oryginałów treści przez Google

17 ekspertów SEO o duplikacji treści

Jak sprawdzić Duplicate Content z narzędziami SEO?

#1 – Wyszukiwarka Google

#2 – Siteliner

#3 – Copyscape

#4 – Seoreviewtools

#5 – Udoskonalenia HTML w Google Search Console

#6 – Screaming Frog

#7 – Xenu Link Sleuth

Szybkie indeksowanie w Google

Duplikacja treści czy unikalna treść?

Rodzaje Duplicate Content

Przykłady duplikacji wewnętrznej na stronie

#1 – Strona testowa i strona oficjalna

#2 – Duplikacja wersji desktopowej i mobilnej

#3 – Duplikacja strony głównej

#4 – Duplikacja adresów URL podstron

#5 – Powielanie identycznego bloku tekstu na różnych adresach URL

#6 – Powielanie opisów stron produktowych

#7 – Paginacja i strony sortowania, a powielanie treści

#8 – Duplikacja tytułu i meta description

#9 – Duplikacja kategorii i tagów

#10 – Wyszukiwarka na stronie

#11 – Duplikacja wersji językowych

#12 – DC z wildcard

#13 – Duplikacja wpisu i PDF

Przykłady duplikacji zewnętrznej

#1 – Mikrostrony i mikroblogi

#2 – Katalogowanie strony

#3 – Kopie artykułów gościnnych i sponsorowanych

Unikalne artykuły o MARKETINGU I SEO Prosto na Twój najlepszy adres e-mail.

26 komentarze - Duplicate content i 16 przypadków szkodliwego powielania treści [PORADNIK SEO]

Dodaj komentarz Anuluj pisanie odpowiedzi