Export eines Antville-Blogs über HTTP
Mit Hilfe des Perlskripts readantville.pl kann man nun alle Einträge eines Antville-Blogs über Web auslesen und in eine RSS 2.0-Datei speichern lassen.
Voraussetzung dafür ist allerdings, dass man entweder noch die Standardeinstellungen von Antville benutzt (in Bezug auf Datumsformat und Skins), oder aber dass man diese kurzfristig noch anpasst.
Folgendermaßen ist vorzugehen:
In den Einstellungen des Blogs muss die Sprache auf Englisch (UK) gestellt werden. Dies ist wichtig, damit das Datum das richtige (englische) Fomat hat. Einige Importroutinen von anderen Blogs und Readern, wie auch WordPress, können deutsche Datumsangaben nicht erkennen und interpretieren. Außerdem empfiehlt es sich bei der Einstellung “Days on front page:” eine höhere Zahl als 3 einzustellen. Zum Beispiel 10. Damit bleibt die Zahl der Anfragen an den bisherigen Server in Grenzen.
Die Skin ‘Story display’ sollte wie folgt aussehen:
<div><% story.content part="title" %></div> <div><% story.topic as="text" %></div> <div><% story.createtime format="EEE, d MMM yyyy HH:mm:ss Z" %></div> <div><% story.content part="text" %></div>
Und der Skin ‘Full story view’ sollte so aussehen:
<% story.skin name="dayheader" %> <% story.skin name="display" %> <p><% story.commentlink prefix="... " %> <% story.editlink prefix=" ... " %> <% story.onlinelink prefix=" ... " %></p>
Nach setzen dieser Einstellungen (die im wesentlichen nur ein Zurücksetzen auf die Defaults der meisten Antville-Blogs bedeuten), kann man mein Skript starten.
Dieses hat zwei Optionen: Lesen und Speichern alle Artikel und Lesen eines einzelnen Artikels. Natürlich nehmen wir ersteres. Daraufhin wird abgefragt, welches die Starturl des Blogs ist. Dort geben wir die Seite des Blogs ein, bei der die aktuellen Artikel enthalten sind. Das Skript wird diese Seite und alle folgenden, die dann auf ältere Beiträge zeigen, durchsuchen.
Weiterhin wird man noch gefragt ob man die Artikel speichern will. Das sollte man mit einer Eingabe wie “ja” beantworten (wenn man nichts eingibt, wird auch nicht gespeichert). Außerdem wird man dann bei der gewünschten Speicherung der Artikel noch nach den Blognamen und dessen Beschreibung gefragt. Läuft alles ordentlich durch, werden im Verzeichnis in dem auch das Skript einige neue Dateien angelegt:
- artikelindex.txt
- global-artikelindex.txt
- “domainname”.xml (wenn die Artikel gespeichert werden sollen)
- “domainname”-items.xml (wenn die Artikel gespeichert werden sollen)
“domainname” wird ersetzt durch die Adresse der Starturl.
In “domainname.xml” haben wr nun alle Artikel des Blogs im RSS 2.0-Format. Dieses lässt sich über die Importfunktion (RSS) von WordPress lesen.