StartseiteSEO

Sitemap Indexdatei

05.11.2008
Sitemaps dürfen nur 50.000 Dateinamen enthalten, bzw. dürfen nur 10MB groß sein, damit die Web-Server nicht in die Knie gehen. Was macht man bei größeren Websites?

Enthält eine Site mehr als 50.000 Dateinamen, müssen mehrere Sitemap-Dateien zu je maximal 50.000 URLs oder maximal 10 MB Größe erstellt werden. Wurden so mehrere Sitemaps.xml erstellt, kann man diese in einer Sitemap Indexdatei (Sitemap Index File) für die Robots bereitstellen. Eine Sitemap Indexdatei darf 1.000 Sitemap-Dateien enthalten.

Somit kann man 50.000 * 1.000 = 50.000.000 = maximal 50 Millionen Dateien in der sitemap_index.xml einer Website bereit stellen.

Moderne kostenlose Sitemap-Tools wie z.B. derGsiteCrwaler erstellen jeweils für 40.000 URLs eine sitemap.xml und dazu noch den Sitemap Index File.



Protokoll der Sitemap Indexdatei

Das Protokoll der Sitemap Indexdatei wird ausführlich in den Google Webmaster Tools beschrieben. Die Allgemeine Form ist

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>http://www.beispiel.de/sitemap1.xml.gz</loc>
<lastmod>2008-11-05T13:07:17+00:00</lastmod>
<changefreq>monthly</changefreq>
<priority >0.9</priority>
</sitemap>
<sitemap>
<loc>http://www.beispiel.de/sitemap2.xml.gz</loc>
<lastmod>2008-11-04</lastmod>
<changefreq>weekly</changefreq>
<priority >0.8</priority>
</sitemap>
</sitemapindex>

Wie bei der Sitemap.xml sind auch hier die Werte der Parameter changefreq und priority lediglich Empfehlungen für die Bots und keine Kommandos. Werden aber z.B. keine unterschiedlichen Prioritäten angegeben, meckern die Webmaster Tools. Bei der Verwendung der Parameter changefreq und priority erwartet der Googlebot, daß die einzelnen Dateien unterschiedlich priorisiert werden. Alle URLs auf always
und 1.0 zu setzen, bringt also überhaupt nichts.

Codeseite UTF-8

Weiterhin wird erwartet, daß die Sitemap Indexdatei in der Codeseite UTF-8 codiert ist.

Beispielsweise sieht der Webcode
http://www.beispiel.de/übung.html&q=name
da in UTF-8 so aus:
http://www.beispiel.de/%C3%BCbung.html&amp;q=name
Die Sitemap dann dann ebenfalls mit gzip komprimiert werden, darf im unkomprimierten Zsutand allerdings auch nicht größer als 10 MB sein.

Ordner der Sitemap


Der Ordner, in dem die Sitemap Datei abgelegt ist, legt die Dateien fest, die von den Bots indiziert werden. Daher sollte man die Sitemap immer in das Quellverzeichnis des Webservers. Eine Sitemap im Verzeichnis
http//www.beispiel.de/Artikel/sitemap.gz
findet alle URLs unter dem Verzeichnis
http//www.beispiel.de/Artikel
aber nicht die URLs im Verzeichnis
http//www.beispiel.de

Allerdings kann man über die Robot.txt auch einen anderen Ort für die Sitemap bestimmen. Die Bots finden die Sitemap aber nur, wenn die Bots die Robot.txt auch auswerten.



Sitemaps bei Suchmaschinen anmelden

Nach der Erstellung der Sitemaps z.B. mit dem kostenlosen GsiteCrawaler sollten diese auch bei den Suchmaschinen angemeldet werden. Die wichtigsten Anmeldungen per PING sind

http://www.google.com/webmasters/sitemaps/ping?sitemap=http://www.beispiel.de/sitemap.xml
http://search.yahooapis.com/SiteExplorerService/V1/ping?sitemap=
http://www.beispiel.de/sitemap.xml
http://submissions.ask.com/ping?sitemap=
http://www.beispiel.de/sitemap.xml
http://webmaster.live.com/ping.aspx?siteMap=
http://www.beispiel.de/sitemap.xml

oder man meldet die Sitemap gleich gemeinsam an mit

http://www.sitemapwriter.com/notify.php?crawler=all&url=http://www.beispiel.de/sitemap.xml

Sitemap in shop to date

In shop to date wird man mit der Erstellung von Sitemap Indexdateien nicht konfrontiert, weil dieses CMS einfach zu klein für derartig große Websites ist.

Normale Sitemap Dateien kann man mit s2d freilich einrichten und auf der Website mit dem Plugin Sitemap auch auf einer Unterseite für den Besucher grafisch ansprechend darstellen.

Zusammenfassung

Die Sitemap Indexdatei wird immer dann erstellt, wenn mehrere Sitemap Dateien erforderlich sind, um mehr als 50.000 Unterseiten einer Website crawlbar zu machen.


Dr. Wolf Blass & Sabine Blass

Kommentare

Hier klicken, um einen Kommentar zu schreiben

zu Suchmaschinen-Eintragungen Anforderungen an eine Pressenotiz
© suma-pro.de (2007- Mit Suchmaschinenoptimierung nach dem
SEO MASTERPLAN
und gutem Shop-Design auf die erste Seite


Datum der letzten Änderung