Duplicate Content


Allgemein

Duplicate Content (dt. „doppelter Inhalt“) entsteht, wenn gleicher Inhalt auf verschiedenen Webseiten angezeigt wird. Ob die Seiten dabei auf unterschiedlichen Domains oder auf derselben liegen, ist dabei egal. Im Einzelfall ist eine Unterscheidung zwischen internen und externen Duplicate Content allerdings sinnvoll.

Duplicate Content ist im Bereich der Suchmaschinenoptimierung ein wichtiges Thema, da Suchmaschinen diese Inhalte gezielt erkennen können. Teilweise wird Duplicate auch negativ bewertet werden. Der Grund ist denkbar einfach: Große Suchmaschinen sehen Duplicate Content als einen Betrugsversuch, der die eigenen Spider daran hindert, das Internet als Ganzes sauber zu erfassen und nutzerfreundlich zu indexieren.

Interner vs. Externer duplicate Content

Interner Duplicate Content ist vor allem bei Online Shops ein Problem. Vor allem dann, wenn einzelne Produkte nicht nur direkt aufrufbar sind, sondern auch über eine Kategorie oder eine gezielte Suche. Werden in diesem Falle alle drei verschiedenen Seiten indexiert, kommt es zu gleichen Inhalten. Die Suchmaschine kann allerdings nicht erkennen, welche Seite tatsächlich ranken soll. Auch unsaubere interne Verlinkung, bspw. unterschiedliche Groß- und Kleinschreibung, kann internen Duplicate Content generieren.

Externer Duplicate Content ist hingegen domainübergreifend gemeint. Es spielt in diesem Falle also keine Rolle, auf welcher Domain ein Inhalt erscheint. Häufig entstehen hier gleiche Inhalte, weil ein Seitenbetreiber die Inhalte einer anderen kopiert.

Wie kann Duplicate Content erstehen?

Duplicate Content kann durch zahlreiche Fehler entstehen. Diese können entweder auf einer falschen Server-Konfiguration, fehlerhaften Umgang mit dem Content Management System oder aber durch Content-Scraping entstehen.

Content Scraping ist dabei allerdings nur selten ein Problem. Die Suchmaschinen können – so die offizielle Aussage von Google – mittlerweile gut erkennen, welche Seite lediglich Inhalte klaut und welche Seite tatsächlich eigene Inhalte erstellt.

Aufrufbare Subdomains

Der offensichtlichste Fall von Duplicate Content entsteht, wenn eine Webseite auf allen Subdomains aufgerufen werden kann und dabei kein Canonical Tag gesetzt wird. Behoben werden kann dieses Problem meist durch eine .htaccess Dateien. Hier kann eine RewriteRule hinterlegt werden, die alle Subdomains auf die Haupt-Domain weiterleitet.

Fehlende Trailing Slashes

Wenn einzelne URLs auf bestimmte Verzeichnisse verweisen, kann ein fehlendes „/“ – also ein fehlender Trailing Slash – Duplicate Content erzeugen. Das ist immer dann der Fall, wenn eine Seite über

    • www.beispiel.de/verzeichnis1/zweites_verzeichnis und
    • www.beispiel.de/verzeichnis1/zweites_verzeichnis

aufrufbar ist.

In diesen Fällen gibt es mehrere Möglichkeiten, um das Inhaltsproblem zu beheben:

  1. ein Redirect durch die .htaccess (die einfachste Lösung)
  2. die Verwendung eines canonical tags
  3. den gezielten Einsatz der robots.txt
  4. manuelle Korrektur der URL-Schreibweise

Was sollte ich bei Duplicate Content tun?

Duplicate Content ist ein Problem für viele Webseitenbetreiber. Allerdings lässt sich das Problem meist schnell beheben.:

  • Canonical Tags / rel=“canonical“: Die einfachste Möglichkeit um internen Duplicate Content zu vermeiden ist ein Canonical Tag. Durch dieses im Head-Bereich platzierte Link-Attribut können Webmaster Suchmaschinen mitteilen, welche Seite die „Hauptseite“ ist. Das ist insbesondere für Online Shops und Seiten, die Druckversionen anbieten, eine einfache Lösung. Den Umgang mit dem Canonical-Tag erklären wir hier.
  • noindex-Tags: Ebenso simpel ist der noindex-Tag. Dieser Meta-Tag verhindert, dass eine Seite oder ein Beitrag durch die Suchmaschinen in den Index aufgenommen wird. Wird eine Seite nicht indexiert, kann sie auch keinen Duplicate Content hervorrufen.
  • einzelne Sprachversionen festlegen Online-Shops haben häufig ein Problem mit doppelten Inhalten, wenn sie Produktbeschreibungen in mehreren Sprachen anbieten. Durch das hreflang-Attribut lassen sich allerdings einzelne Sprachversionen definieren.
  • dauerhafte Redirects durch die .htaccess
  • 301-Redirect durch PHP