Drupal SEO: Duplicate Content verhindern

Zusätzlich zu den bekannten Drupal SEO Vorgehensweisen behandelt dieser Beitrag explizit die Vermeidung von Duplicate Content.
Drupal ist in einigen Bereichen besonders anfällig für dieses Problem, da es Inhalte sehr gut auflistet und miteinander in Verbindung setzt, dabei die Inhalte aber auch identisch auf mehreren Seiten anbietet.

1. Standard Startseite "/node" entfernen

Vielleicht kennt ihr den Pfad noch aus der Erstinstallation:
http://www.example.com/node

Diese Seite listet alle Beiträge auf, welche die Eigenschaft "auf der Startseite veröffentlichen" besitzen.
Nutzt ihr diese Standardauflistung allerdings nicht als Startseite, sondern habt eine andere Seite eingerichtet, bekommt ihr hier ein bekanntes Problem mit Duplicate Content.

Es gibt mehrere Möglichkeiten dieses Problem zu beheben:

Seite ganz entfernen

  1. //put this in settings.php
  2. function custom_url_rewrite_inbound(&$result, $path, $path_language) {
  3.   if ($path == 'node') {
  4.     //this will cause a page not found
  5.     $result = '';
  6.   }
  7. }

Alternativ:

  1. /**
  2. * Implementation of hook_menu_alter().
  3. */
  4. function my_module_menu_alter(&$callbacks) {
  5. unset($callbacks['node']);
  6. }

Quelle: http://dominiquedecooman.com/blog/how-remove-drupal-default-node-page-aka-default-front-page-view

Weiterleitung einrichten

Path Modul installieren!

Menü > Strukturierung > URL-Aliase > URL-Alias hinzufügen
(http://www.example.com/admin/build/path/add).

Als Quell-URL: "node" eintragen
Als Ziel-URL die gewünschte Startseite eintragen, zu der die Weiterleitung erfolgen soll.

Seite mit tatsächlicher Startseite überschreiben

Diese Lösung setze ich selbst ein. Als Vorteil sehe ich die einfache Einrichtung und Standardisierung des Startseiten-Pfades.

Durch Einsatz des "path"-Moduls kann im Bearbeiten-Formular des Startseiten-Nodes manuell ein URL-Alias angegeben werden. Dazu einfach den Haken "Automatischer Alias" entfernen und "node" als Pfad eingeben.
Die Startseite überschreibt dann sauber den "node"-Pfad.

Viel Erfolg mit diesen Anpassungen!

2. Achtung bei Taxonomie-Pfaden!

Eine gute Problembeschreibung (Englisch) findet ihr auch hier:
http://zengenuity.com/blog/a/201011/widespread-seo-problems-drupal-taxon...

Durch das Taxonomie-Formular werden entstehen doppelte Seiteninhalte aufgrund der Auflistungen. Vorwiegendes Problem sind aber meist identische Seitentitel.
Zweites Problem sind doppelte Links auf dieselben Inhalte, beispielsweise durch Anhängen von "/0" ans Ende der URL.
Dieses Problem ist einfach durch Einstellungen im Drupal Global Redirect Modul zu beheben. Weitere Hinweise findet ihr im Artikellink oberhalb.

Das andere Problem sind die Seitentitel. Zu diesem Zweck empfiehlt sich die Verwendung des Drupal "page_title"-Moduls. Hier empfiehlt sich eine Unterscheidung zwischen normalen Node-Titles und Taxonomie-Titeln.
So kann beispielsweise für Nodes ein Aufbau wie:
[type-name]: [page-title] | [site-name]: [site-slogan]
verwendet werden.

Für Taxonomie-Begriffe kann beispielsweise ein Term wie dieser genutzt werden, um unterschiedliche Titel zu erzeugen:
"Kategorie [vocab]: [page-title] | [site-name]"

3. Sprachneutrale Übersetzungen

Verwendet man die Mutlilanguage-Fähigkeiten von Drupal (beispielsweise i18n), so sind sprachneutrale Nodes unter den Pfaden aller Sprachen erreichbar.
Das stellt ein Problem dar, da es sich um duplicate content handelt.
Die eine Lösungsmöglichkeit besteht darin, eine Canonical URL zu setzen.
Die andere ist gerade hier in Arbeit:
http://drupal.org/node/201675#comment-4699542

Eine lauffähige Standardlösung scheint es derzeit leider nicht zu geben.

Weitere Tipps zur SEO in Drupal finden sich in den Modulen:

Sowie auf zahlreichen Seiten zu dem Thema!
Dennoch ist Erfahrung wohl das wichtigste Werkzeug. Sollten Sie professionelle Unterstützung bei der Suchmaschinenoptimierung benötigen, helfen wir Ihnen gerne. Details zu unseren Dienstleistungen finden Sie hier:

http://www.webks.de/design_webdesign_agentur_leistungen/seo

Viel Erfolg mit den Tipps, ich freue mich auch über Hinweise und Ergänzungen!

Einordnung:

Comments

Post new comment

The content of this field is kept private and will not be shown publicly. If you have a Gravatar account associated with the e-mail address you provide, it will be used to display your avatar.
  • Web page addresses and e-mail addresses turn into links automatically.
  • Internal paths in single or double quotes, written as "internal:node/99", for example, are replaced with the appropriate absolute URL or path. Paths to files in single or double quotes, written as "files:somefile.ext", for example, are replaced with the appropriate URL that can be used to download the file.
  • Allowed HTML tags: <a> <em> <strong> <cite> <code> <ul> <ol> <li> <dl> <dt> <dd><blockquote>
  • Lines and paragraphs break automatically.
  • Pairs of<blockquote> tags will be styled as a block that indicates a quotation.
  • You can enable syntax highlighting of source code with the following tags: <c>, <cpp>, <css>, <drupal5>, <drupal6>, <java>, <javascript>, <mysql>, <php>, <python>, <ruby>, <smarty>, <xml>. The supported tag styles are: <foo>, [foo]. PHP source code can also be enclosed in <?php ... ?> or <% ... %>.
  • Textual smileys will be replaced with graphical ones.
  • Each email address will be obfuscated in a human readable fashion or (if JavaScript is enabled) replaced with a spamproof clickable link.

More information about formatting options

Type the characters you see in this picture. (verify using audio)
Type the characters you see in the picture above; if you can't read them, submit the form and a new image will be generated. Not case sensitive.