SEO: So tickt Google! (Teil IV)

Veröffentlicht am 8. Januar 2010 in der Kategorie Marketing & Vertrieb von

Themen: , , ,

IdéeBereits lange bekannt ist das Problem des doppelten Inhalts (engl. Duplicate Content). Suchmaschinen haben eine Datenbank, um Internetseiten abzulegen. Sie leisten sich sogar ein Archiv für alle indexierten Seiten. Daher ist es verständlich, wenn die Suchmaschinen doppelt vorhandene Inhalte nicht doppelt indexieren.

Von Thomas Kaiser

Daher muss eine Suchmaschine bei doppelt vorhandenem Inhalt entscheiden, welchen Inhalt sie aufnimmt und welchen nicht. Klingt einfach, ist aber in der Praxis tückisch.

Die meisten Domains sind unter der URL mit vorangestelltem www und ohne diesem www erreichbar. Sie können in den Google Webmaster Tools einstellen, welche Variante sie präferieren. Alternativ können Sie eine Weiterleitung per 301 von der Variante ohne www zu der Variante mit www einrichten. Beide Wege führen zum Ziel. Eine letzte und neuere Variante ist der Canonical Link.

Sie sehen: SEO (Search Engine Optimization, dt. Suchmaschinenoptimierung) ist deswegen so komplex, weil es für viele Probleme auch viele Lösungswege gibt. Aber nicht immer sind alle Lösungswege die richtigen, da man alle Parameter und Umstände kennen muss, um die optimalste Variante zu wählen.

Generell gilt: Wenn Ihre eigene Domain mehr als einmal im Index ist, bedeutet dies in der Regel immer schlechte Platzierungen. Dabei kann der Zustand von heute auf morgen auftreten und auch wieder verschwinden.

Bei Domains mit identischem Inhalt entscheidet Google sich in der Regel für die Domain mit dem höchsten PageRank. Offensichtlich kommen sich aber immer wieder verschiedene Algorithmen in die Quere, die dann zu seltsamen und nicht gewünschten Resultaten führen.

Suchmaschinenoptimierung: der Canonical Link

Das Duplicate Content-Problem bereitet den Suchmaschinen erhebliche Schwierigkeiten, da doppelte Inhalte nur unnötig Ressourcen verbrauchen. Allerdings kann das Problem nicht durch Algorithmen der Suchmaschinen einfach und klar gelöst werden. Daher sprachen sich die großen Suchmaschinen ab und führten das Canonical-Link-Element ein. Es ermöglicht, im Header einer Webseite eine kanonische URL anzugeben.

Eine kanonische URL ist eine Internetadresse, die sozusagen das „Original“ darstellt. Damit ist es möglich, den Suchmaschinen mitzuteilen, welche Adresse indexiert werden soll und welche nicht. Dazu schreiben Sie im Kopf einer Seite folgende Zeile:

<link rel=“canonical“ href=“http://www.beispiel.de/page.html“/>

Den tieferen Sinn und die Möglichkeiten wollen wir uns an Beispielen ansehen. Wenn Sie beispielsweise innerhalb Ihrer Website Session-IDs einsetzen, so stellen diese ein Problem dar. Sie können daher im Kopf der Seite stets die Internetadresse ohne die Session-ID als Canonical Link eintragen. Und schon wird die Session-ID aus dem Google-Index verschwinden.

Alternativen wie eine XML-Sitemap erfordern einen Pflegeaufwand und eine Überprüfung der XML-Sitemap, während eine einmal richtig integrierte Canonical URL dieses Problem auf Dauer lösen kann.

Wenn Ihre Website unter mehreren Domains erreichbar ist, können Sie den Suchmaschinen mitteilen, welche Domain im Index aufgenommen werden soll. Dies ist bei fast allen Domains der Fall, denn viele Internetauftritte sind nicht nur über die Domain erreichbar, sondern über eine IP-Adresse oder über eine Subdomain des Providers.

Wenn Sie ein Affiliate-Programm betreiben, verlinken die Partner mit einem Parameter Ihre Website. Dieser Parameter wird vielleicht über die gesamte Website durchgezogen. Mit einer Canonical URL wäre dieser Parameter kein Problem mehr.

Sie haben einen internationalen Auftritt und Ihre Seiten sind über mehrere Domains erreichbar, beispielsweise über eine .de- und eine .com-Domain. Die englischen Inhalte sind aber auch über die .de erreichbar und die deutschen auch über .com, weil alles auf einem Server läuft. Damit nun die deutschen Inhalte auch nur der .de-Domain zugeordnet werden, schreiben Sie die Canonical URL für die deutschen Seiten mit der .de-Endung und auf den englischen Seiten mit der .com-Domain. Und schon weiß die Suchmaschine, was zu tun ist.

Wenn Sie ein Load Balancing-System betreiben, sind Ihre Webseiten beispielsweise unter www. erreichbar und unter www2. Damit sich beide Domains nicht ins Gehege kommen und Duplicate Content verursachen, schreiben Sie in alle Seiten die Canonical URL mit der Domain www. Dann wird die www2-Domain auch nicht im Index von Google auftauchen.

Diese zunächst kleine neue Idee der Suchmaschinen erweist sich also als ein gewaltiges Instrument, denn es ermöglicht dem Website-Betreiber, den Suchmaschinen Anweisungen zu geben, ohne dass sich für den Besucher etwas ändert.

In der Vergangenheit musste man sich viele Gedanken über mögliche 301-Weiterleitungen machen, über XML-Sitemaps oder andere Methoden. Ein weiterer wesentlicher Effekt für die Suchmaschinen: Wenn dieses Werkzeug richtig eingesetzt wird, werden die Ressourcen der Suchmaschinen erheblich eingespart, da die Suchmaschinen sicherlich eine Menge an Duplicate Content in ihrem Index haben.

Somit dürfte dieses Werkzeug auch einiges an Energieersparnis bringen, da der Rechenaufwand der Suchmaschinen ohne dieses Instrument höher wäre. Allerdings setzt es voraus, dass die Website-Betreiber und insbesondere die Anbieter von CMS-Lösungen dieses Feature auch sinnvoll in ihre Systeme integrieren. Probleme dürfte es auch dann geben, wenn die Adresse in dem Canonical Link nicht existiert oder selbst wiederum weiterleitet. Daher sollte der Einsatz genau geplant und überwacht werden.

Weitere (englischsprachige) Details und ein Video von Google finden Sie unter www.mattcutts.com/blog/canonical-link-tag/.

Dieser Beitrag ist ein Auszug aus dem Buch Top Platzierungen bei Google & Co..

Weitere Artikel dieser Serie:

Suchmaschinenoptimierung: So tickt Google – Teil I
Suchmaschinenoptimierung: So tickt Google – Teil II
Suchmaschinenoptimierung: So tickt Google – Teil III
Suchmaschinenoptimierung: So tickt Google - Teil V

(Bild: © Fotolia.com)