Conținut duplicat = aceeași conținut (sau foarte asemănător) pe mai multe URL-uri. Google penalizează pagini cu conținut duplicat intern și extern.
Conținut duplicat = aceeași text (40%+ similarity) apare pe 2+ URL-uri diferite, interne site-ului tău sau pe alte site-uri. Tipuri: (1) Internal duplicate: /articol și /articol/ (cu trailing slash); (2) Pagini similar content (ex. articol scurt + versiunea lungă); (3) Distribuție conținut: crezi pe multiple domains (syndicajt). Google trebuie să aleagă care URL canonical să rankeze — celelalte sunt devalorizate. Penalizari: rank prost, authority split între URLs, crawl budget wasted pe duplicates. Fix: use canonical tags, 301 redirects, unique content pe fiecare URL.
Conținut duplicat = rank prost și trafic split. Două pagini cu same content rankează la 1/10 valoarea unui single URL unic. 100 articole unice rankează mult mai bine decât 50 articole unice + 50 re-published.
Sursă: Google — Duplicate ContentSEO tehnic cuprinde optimizările infrastructurii site-ului — crawlabilitate, indexare, viteza de încărcare, HTTPS și structura datelor — care permit Google să găsească și să înțeleagă paginile tale.
Canonical URL este atributul rel="canonical" care spune Google care e versiunea "adevărată" a unei pagini când există versiuni duplicate (ex. cu și fără www, cu și fără trailing slash).
Hreflang este un tag HTML care informează Google ce versiuni ale unei pagini exista în alte limbi sau regiuni, evitând penalizări pentru conținut duplicat multilingv.
Indexarea Google este procesul prin care Google adaugă paginile web în baza sa de date (indexul Google) după ce le-a crawled, făcându-le eligibile să apară în rezultatele de căutare.