Ein neues Sitemap-Plugin muss her!

Eine Möglichkeit, einer Suchmaschine alle Seiten mitzuteilen, ist die Bereitstellung einer Datei namens sitemap.xml. Diese Datei wird von WordPress nicht automatisch erstellt; doch es gibt Plugins, die den Job erledigen. Da mir vor vielen Jahren keines gut gefiel, hatte ich ein eigenes geschrieben.

Der übliche Aufbau einer sitemap.xml:

  1. <?xml version="1.0" encoding="UTF-8"?>
  2. <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  3. <url>
  4. <loc>http://www.example.com/</loc>
  5. <lastmod>2005-01-01</lastmod>
  6. <changefreq>monthly</changefreq>
  7. <priority>0.8</priority>
  8. </url>
  9. </urlset>

Beispiel von sitemaps.org

Unterhalb von <url> ist nur das "loc"-Element Pflicht, und im alten Plugin hatte ich auf die optionalen Elemente verzichtet.

"changefreq" ist bei einem Blog sinnlos; auch glaube ich nicht, dass sich irgendeine Suchmaschine davon beeinflussen lässt.

"priority" ist schon berüchtigt für den Schindluder, der damit getrieben wurde. Daher denke ich nicht, dass sich Suchmaschinen dafür interessieren.

"lastmod" hingegen lässt sich ermitteln und könnte nützlich sein. Ich setze es mit auf die Todo-Liste.

Somit sieht die bisherige sitemap.xml reichlich langweilig aus:

  1. <?xml version="1.0" encoding="UTF-8"?>
  2. <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  3. <url>
  4. <loc>http://leopoldnet.de/</loc>
  5. </url>
  6. <url>
  7. <loc>http://leopoldnet.de/impressum</loc>
  8. </url>
  9. <url>
  10. <loc>http://leopoldnet.de/start-meiner-website-als-blog</loc>
  11. </url>
  12. <url>
  13. <loc>http://leopoldnet.de/freezing-leafs</loc>
  14. </url>
  15. <!-- und so weiter -->

Die sitemap.xml von leopoldnet.de vom 28.01.2017

Und noch etwas fehlt: Die Übersichtsseiten der Schlagwörter und Kategorien – auf die Todo-Liste damit.

Die Bildererweiterung von Google

Google hat die sitemap.xml um Bildinformationen erweitert; da dies auf sitemaps.org nicht beschrieben wird, könnte es eine Eigeninitiative gewesen sein. Die Bilder müssen einer Seite zugewiesen werden; pro Seite sind 1000 Bilder erlaubt. Im Beispiel sähe es so aus:

  1. <?xml version="1.0" encoding="UTF-8"?>
  2. <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
  3. xmlns:image="http://www.google.com/schemas/sitemap-image/1.1">
  4. <url>
  5. <loc>http://ihrebeispielurl.de/beispiel.html</loc>
  6. <image:image>
  7. <image:loc>http://ihrebeispielurl.de/bild.jpg</image:loc>
  8. </image:image>
  9. <image:image>
  10. <image:loc>http://ihrebeispielurl.de/foto.jpg</image:loc>
  11. </image:image>
  12. </url>
  13. </urlset>

Beispiel von support.google.com

Sieht auch nicht besser aus, doch hier gibt es spannende, optionale Elemente:

<image:caption>

Dieses Element sieht Google für den Untertitel vor; WordPress wiederum hat ein Feld "Alternativtext". Auch ist das Feld "Beschriftung" denkbar.

<image:geo_location>

Anders als ich dachte, sind hier keine Koordinaten gewünscht, sondern der Ort als Klartext; zum Beispiel "Bremen, Deutschland". Leider stellt WordPress für Medien kein entsprechendes Feld zur Verfügung, die Information könnte ich unter "Beschreibung" einfügen, wobei eine Art Auszeichnung nötig wäre: loc{Bremen, Deutschland} oder so.

<image:title>

Hierfür scheint das Feld "Titel" wie geschaffen.

<image:license>

Sicher interessant, aber derzeit für mich nicht.

Ganz klar: Hier lassen sich deutlich mehr Informationen über die Sitemap übermitteln.

Die Todo-Liste

  • "lastmod" hinzufügen
  • Schlagwörter und Kategorien berücksichtigen
  • Bilder mit Beschreibungen hinzufügen

Dann mache ich mich mal an die Arbeit

Google vergibt

Ergebnis Bildersuche
Für eine größere Ansicht auf das Bild klicken.

Als mir das Instagram-Plugin zunächst den ganzen Text inklusive der Hashtags als Beitragstitel importierte, hat Google meine Website aus der Bildersuche entfernt; denn WordPress nutzt den Beitragstitel als Alternativtext für das Bild, und Google wertet den Alternativtext für die Bildersuche aus. Bei den ganzen Hashtags vermutete der Algorithmus Keyword-Spamming und zog die Konsequenz.

Etwa eine Woche nachdem ich die ganzen Beiträge nachgearbeitet hatte, war Google beruhigt und die Bilder wieder da: Google vergibt den Sündigern 😄

Google scheint unzufrieden

Google scheint unzufrieden zu sein.

Zwar werden meine Seiten in den Index aufgenommen, aber die Beschreibung aus dem entsprechendem Meta-Element wird nicht immer angezeigt. Ich gehe davon aus, der Text ist zu kurz. Doch in zumindest dieser Krise gibt es eine Chance: Es zwingt mich, meine Instagram-Bilder besser zu präsentieren, als sie nur zu kopieren.

Auf Instagram schreibe ich inzwischen fast nur auf englisch, da ich dort überwiegend internationale Follower habe. Der Blog indes sollte deutschsprachig sein, somit muss ich in Zukunft eigene Texte für den Blog schreiben.

Und dann ist auch Google zufrieden.