Wenn ein und derselbe Text unter zwei verschiedenen Domains bzw. unter zwei verschiedenen Adressen erscheint, wird meist nur der Text der “stärkeren” Seite in die Suchmaschine aufgenommen. Es gibt auch die weit verbreitete These, dass die “schwächere” Seite aufgrunddessen ein negatives Voting bekommt – sicher wissen das natürlich nur die Suchmaschinenbetreiber.
Was tun gegen doppelten Content?
In den ersten drei Fällen reicht es, den doppelten Text entweder zu modifizieren oder von der eigenen Seite zu entfernen oder – sofern er unerlaubt auf der anderen Seite zu finden ist, gegen den Betreiber der Seite vorzugehen. Eigene Erfahrungswerte haben gezeigt, dass eine freundliche Erstkontaktaufnahme in den meisten Fällen die Probleme auf entspannte Art und Weise löst.
Zum letzten Fall noch eine kurze Erläuterung:
Viele Domains sind sowohl unter
http://www.domain.de/
als auch unter
http://domain.de/
oder gar unter
http://www.andere-domain.de/
erreichbar. Hierbei handelt es sich um doppelten Content und man läuft Gefahr,
dass dieser abgewertet wird.
Standard-Domain definieren (z.B. per mod_rewrite)
Zur Vermeidung dieses Risikos kann man einfach eine Standard-Domain definieren.
Hierzu legt man eine Datei an, die man .htaccess nennt (oder man erweitert die
ggf. bereits vorhandene Datei um den folgenden Inhalt (bitte beachten, dass
mod_rewrite aktiviert sein muß, ansonsten einfach den Provider diesbezüglich fragen):
RewriteEngine On
Options +SymLinksIfOwnerMatch
RewriteCond %{HTTP_HOST} ^meine-domain.de
RewriteRule (.*) http://www.meine-domain.de/$1 [R=301,L]
Weitere Formen von Doppeltem Content
A.) Völlig identische Seiten/Dokumente
Zwei absolut identische Dokumente die von unterschiedlichen URLs erreichbar sind.
B.) Inhaltlich völlig identische Seiten
Zu A zugehörig nur mit geringen Abweichungen im Quellcode
C.) Weitgehend identische Seiten im selben Verbund (~ Domain)
Google wertet alle Seiten ab die innerhalb des <head> gleich sind. Das betrifft insbesondere den <tilte>-tag sowie die Meta-Description und die Keywords.
D.) Weitgehend identische Seiten - irgendwo im Web
Google kümmert sich nicht um jede einzelne Seite - problematisch wird dies erst ab einer sehr hohen anzahl von Seiten.