StartseiteSEO

sitemap.xml

19.12.2008 (Update vom 24.04.2008)
Eine Sitemap hat zwar keinen direkten Einfluss auf das eigentliche Ranking einer Seite. Durch eine Sitemap wird jedoch Google über die relative Wichtigkeit (Priority) der zu crawlenden URLs informiert. Das kann zu zu einer erhöhten Präsenz und Sichtbarkeit der Website im Index führen. Die Wichtigkeit ist jedoch keine absolute Maßzahl zwischen 0 und 1 - jeder würde dann alle Seiten auf 1 setzen - sondern ein Maß der relativen Wichtigkeit einzelner Seiten innerhalb der Website. Man kann damit beeinflussen, welche Seiten zuerst vom Crawler besucht werden und welche später, nachdem die anderen Seiten schon im Index sind.

Als Standard hat sich die Form der sitemap.xml durchgesetzt. In dieser Datei stehen folgende relevanten Informationen über jede Seite einer Website.
Beispiel:

< url >
< loc >http://www.suma-pro.de/index.php< /loc >
< lastmod >2008-04-12< /lastmod >
< changefreq >monthly
< priority >0.3
< /url >
...
< url >
< loc >http://www.suma-pro.de/adwords/adwords.php< /loc >
< lastmod >2008-04-21
< changefreq >weekly
< priority >0.8
< /url >
...
Die wichtigsten Parameter sind

LastMod
Gibt den Suchmaschinen den Hinweis, welche Seiten aktuell geändert wurden und daher indiziert werden sollen und welche Seiten ignoriert werden können.

ChangeFreq
Gibt den Bots einen Hinweis auf die Änderungshäufigkeit einer Seite. Freilich merken sich die Bots diese Hinweise - und wenn man sie veräppelt kommen sie längere Zeit nicht mehr. Man erreicht möglicherweise genau das Gegenteil des Erwünschten.

Priority
Informiert die SUMAs über die relative Wichtigkeit einer Seite innerhalb dieser Website und steuert damit auch die Geschwindigkeit der Indizierung. Seiten mit sehr geringer Priorität sind z.B. Impressum, AGB etc., die nur sehr selten geändert werden.

Im obigen Beispiel werden für die index-Seite die Bots aufgefordert nur monatlich zu indizieren, die AdWords-Seite hingegen wöchentlich.

Software zur Sitemap-Erstellung

Man kann sich eine Reihe kostenfreier Tools ergoogeln, z.B.

www.xml-sitemaps.com
www.auditmypc.com/xml-sitemap.asp

Allerdings muß darin ChangeFreq und Priority nach der automatischen Erstellung manuell zeitaufwendig korrigiert werden. Dann kann man die Einstellungen bis zum nächsten Aufruf speichert.

Deutlich bequemer geht es mit dem GsiteCrawler.com
Diese Software wird auf dem eigenen PC installiert und speichert die Einstellungen zu ChangeFreq und Priority. Nur die gewünschten Änderungen müssen eingegeben werden. Und durch die Automatikfunktion braucht man sich nicht mehr um die Aktualisierung der Sitmap nach einer Änderung in der Website zu kömmern. Denn nach jeder Änderung der Webseite sollte die sitemap.xml neu erzeugt und ins Rootverzeichnis der Website gestellt werden. Nach jeder Modifikation muß LastMod aktualisiert werden. Danach kann die aktualisierte sitmap.xml bei den großen Suchmaschinen Google, MSN, Yahoo! neu angemeldet werden.

Aber auch andere Formate der sitemap werden von Google akzeptiert.

RSS 2.0- und Atom 1.0-Feeds für BlogWebseiten

Textdateien mit Webseiten-URLs zur Erstellung der sitemap.xml

Video-XML-Sitemaps zur Indizierung von Videos

Weitere spezielle Fomate werden in Googles Webmaster Zentrale besprochen.



Seitmap bei den Suchmaschinen einreichen

Eine Sitemap kann auf mehrere Arten bei den Suchmaschinen eingereicht weren.

Einreichung per HTTP Ping

Der GsiteCrawler meldet jede Sitemap-Aktualisierung automatisch per Ping an Google und Yahoo! Das ist für die Spider das Signal, möglichst schnell wieder die aktualisierten Seiten zu crawlen. Man kann diesen Ping auch manuell im Browser an Google senden mit Angabe der Adresse der Sitemap-Datei

http://www.google.com/webmasters/tools/ping?sitemap=http://www.beispiel.com/sitemap.xml

Anmelden bei den Suchmaschinen Google, Yahoo, Ask und MSN live geht mit

http://www.sitemapwriter.com/notify.php?crawler=all&url=http://www.beispiel.de/sitemap.xml
Dann wird die Sitemap den Liste von Sitemaps, die gecrawlt werden sollen, hinzugefügt. Google erwartet die Sitemap im Rootverzeichnis. Diesen Standort teilt man dem Googe-Bot in der robot.txt mit, z.B.

Sitemap: http://www.suma-pro.de/sitemap.xml

Damit findet dann auch jeder andere Robot die sitemap.xml und berücksichtigt diese Information beim crawlen. Nicht alle Robots werten die robots.txt aus. Die meisten suchen die sitemap.xml aber im Stammverzeichnis einer Website.

Die Anmeldung einer Sitemap bei den Suchmaschinen hat zudem den unschlagbaren Vorteil, daß die robots innerhalb der nächsten 24 Stunden wahrscheinlich und innerhalb von 48 Stunden mit Sicherheit vorbeikommen, um die Indizierung der Seite zu beginnen oder forzusetzen. "In 24 Stunden im Google Index" ist mit einer Sitemap somit keine Hexerei sondern gesichertes Knowhow jedes SEO.

Einreichung per Webmaster Tools

Google empfiehl als besten Weg, die Sitmap über die Webmaster Tools einzureichen. Dort sieht man auch, wann der Robot das letzte Mal die Website besucht hat und wieviel Seiten aller eingereichten Seiten bereit indiziert wurden. Hält man diese Mengen auf einem Excel-Cahrt vor, kann man die Bandbreite des Crawlers ermitteln. Bei einer neuen Website arbeitet sich der Crwler durch 30-40% aller Seiten durch. Danach werden bei jedem Besuch weitere 2-3 Unterseiten indiziert. Ändert man in der Priorisierung der Seiten nichts und reicht sie erneut ein, kommt der Crawler zwar vorbei, aber berücksichtigt keine neuen Seiten mehr. Geänderte Seiteninhalte und Veänderungen der Priorisierung der Seiten sind die Mittel, um die Bots zum arbeiten zu bringen.

Einreichung per robot.txt

Wird die Sitemap in den REP-Parametern der robot.txt angegeben, werten die Crawler diese Angabe aus. Sie kommen jedoch nicht extra vorbei.

Zusammenfassung

Notwendigkeit, Aufbau, Parameter und Funktionsweise einer Sitemap werden beschrieben; ebenso die Übermittlung an die Suchrobots.


Dr. Wolf Blass & Sabine Blass

Kommentare

Hier klicken, um einen Kommentar zu schreiben

Die erste Seite interne Verlinkung
© suma-pro.de (2007- Mit Suchmaschinenoptimierung nach dem
SEO MASTERPLAN
und gutem Shop-Design auf die erste Seite
Datum der letzten Änderung