Conținut duplicat apare când același text sau texte foarte similare există pe URL-uri multiple — fie pe același site, fie pe site-uri diferite — creând confuzie pentru Google în alegerea versiunii de rankat.
Conținut duplicat (duplicate content) există când blocuri substanțiale de text identic sau foarte similar apar la adrese web multiple. Tipuri interne: pagini de categorie cu paginație (page/2, page/3), filtre de produs cu același conținut, URL-uri cu parametri (product?sort=price), versiuni http vs https sau www vs non-www. Tipuri externe: conținut copiat de pe alte site-uri sau distribuit pe mai multe domenii proprii fără canonicalizare. Google încearcă să aleagă o versiune canonică — și poate alege greșit.
Conținutul duplicat intern diluează autoritatea de ranking între versiuni în loc să o consolideze. Extern, conținutul copiat poate fi penalizat. Soluția: canonical tags corect configurate, redirecturi 301 și crearea de conținut unic per pagină.
Sursă: Google Search Central — Duplicate ContentTag-ul canonical (rel="canonical") indică Google care este versiunea principală a unei pagini atunci când există URL-uri similare sau duplicate, prevenind penalizările pentru conținut duplicat.
SEO tehnic cuprinde optimizările infrastructurii site-ului — crawlabilitate, indexare, viteza de încărcare, HTTPS și structura datelor — care permit Google să găsească și să înțeleagă paginile tale.
Robots.txt este un fișier text plasat la rădăcina site-ului care indică crawlerilor (Google, Bing, GPTBot) ce pagini pot sau nu pot accesa și indexa.
Crawlabilitatea este capacitatea roboților Google de a accesa, naviga și citi paginile site-ului tău — o condiție prealabilă esențială pentru indexare și ranking.