Hallo Lug-DDler!
Vor kurzem, gab es mal einen Thread, in dem es um das Parsen von HTML-Dateien ging. Problem: Ich möchte mir ein Skript basteln, welches immer den aktuellen Fahrplan vor unserer Haustür ausgibt. Nur die DVB-AG arbeiten mit dynamischen Seiten, so das ich URL's zusammenstellen muß und POST-Abfragen stellen muß.
Könnt Ihr mir kurze Hinweise auf die entsprechenden Perl oder sonstigen Module geben?
Danke. Bert
Bert Lange schrieb:
Vor kurzem, gab es mal einen Thread, in dem es um das Parsen von HTML-Dateien ging. Problem: Ich möchte mir ein Skript basteln, welches immer den aktuellen Fahrplan vor unserer Haustür ausgibt. Nur die DVB-AG arbeiten mit dynamischen Seiten, so das ich URL's zusammenstellen muß und POST-Abfragen stellen muß.
Ich habe ein kleines Skript erstellt, das genau diese Arbeit macht... Da es sehr kurz ist, ich denke daß ich an der Liste schicken darf...
#!/bin/sh dirDWN='/usr/lucabert/Varie/DVB'
function getPage() { /usr/bin/wget $1 -O - 2> /dev/null | \ /bin/sed -e "s/<[a-zA-Z]*>//g" | \ /bin/sed -e "s/^[a-zA-Z]*>//g" | \ /bin/sed -e "s/</[a-zA-Z]*>//g" | \ /bin/sed -e "s/<A.*//; t end; b cont; :end q; :cont" | \ /bin/sed -e "s/<!--.*//g" | \ /bin/sed -e "s/<meta.*//g" | \ /bin/sed -e "s/<body.*//g" | \ /bin/sed -e "s/<a.*//g" | \ /bin/sed -e "s/name=.*//g" | \ /bin/awk '{ if($0 ne '') print; }' > $2 /bin/chmod 644 $2 }
getPage http://www.dvb.de/inhaf/HAF-1/-110812.htm $dirDWN/line1Waltherstrasse-Kleinschachwitz.txt
Das Problem des Skripts ist daß, wenn DVB die Seite ändert (manchmal, bei Planänderung passiert), ich muß die URL auch ändern...
Tschüß Luca Bertoncello (lucabert@lucabert.de)
On Sun, Jun 29, 2003 at 08:02:37AM +0000, Luca Bertoncello wrote:
Bert Lange schrieb:
Vor kurzem, gab es mal einen Thread, in dem es um das Parsen von HTML-Dateien ging. Problem: Ich möchte mir ein Skript basteln, welches immer den aktuellen Fahrplan vor unserer Haustür ausgibt. Nur die DVB-AG arbeiten mit dynamischen Seiten, so das ich URL's zusammenstellen muß und POST-Abfragen stellen muß.
Ich habe ein kleines Skript erstellt, das genau diese Arbeit macht... Da es sehr kurz ist, ich denke daß ich an der Liste schicken darf...
Naja, nicht genau.
Das Problem des Skripts ist daß, wenn DVB die Seite ändert (manchmal, bei Planänderung passiert), ich muß die URL auch ändern...
Und genau deswegen wollte ich eine POST-Anfrage (nicht GET, wie hier) an http://www.dvbag.de/inhaf/default.asp?auswahl=fin13/y13.html stellen und dort erstmal die richtigen URLs für meine Haltestelle rausparsen.
Es nützt mir nämlich nichts, wenn der Fahrplan geändert wird und ich merk nix davon. Aber trotzdem Danke für den Ansatz des Parsens.
Bert
Bert Lange schrieb:
Und genau deswegen wollte ich eine POST-Anfrage (nicht GET, wie hier) an http://www.dvbag.de/inhaf/default.asp?auswahl=fin13/y13.html stellen und dort erstmal die richtigen URLs für meine Haltestelle rausparsen.
Wenn das Problem nur die POST Anfrage ist, du kannst lynx oder curl benutzen! Sie erlauben dir eine Form mit POST-Method zu schicken!
Tschüß Luca Bertoncello (lucabert@lucabert.de)
On Sun, Jun 29, 2003 at 08:18:38PM +0000, Luca Bertoncello wrote:
Wenn das Problem nur die POST Anfrage ist, du kannst lynx oder curl benutzen! Sie erlauben dir eine Form mit POST-Method zu schicken!
Der w3m kann es auch, wie ich nach dem Tipp mit lynx feststellen musste. Die aktuelle URL kann ich mir nun z.B. aus folgender Datei rausholen: http://www.dvbag.de/inhaf/fin13/y13.htm
Bert
lug-dd@mailman.schlittermann.de