Bert Lange schrieb:
Vor kurzem, gab es mal einen Thread, in dem es um das Parsen von HTML-Dateien ging. Problem: Ich möchte mir ein Skript basteln, welches immer den aktuellen Fahrplan vor unserer Haustür ausgibt. Nur die DVB-AG arbeiten mit dynamischen Seiten, so das ich URL's zusammenstellen muß und POST-Abfragen stellen muß.
Ich habe ein kleines Skript erstellt, das genau diese Arbeit macht... Da es sehr kurz ist, ich denke daß ich an der Liste schicken darf...
#!/bin/sh dirDWN='/usr/lucabert/Varie/DVB'
function getPage() { /usr/bin/wget $1 -O - 2> /dev/null | \ /bin/sed -e "s/<[a-zA-Z]*>//g" | \ /bin/sed -e "s/^[a-zA-Z]*>//g" | \ /bin/sed -e "s/</[a-zA-Z]*>//g" | \ /bin/sed -e "s/<A.*//; t end; b cont; :end q; :cont" | \ /bin/sed -e "s/<!--.*//g" | \ /bin/sed -e "s/<meta.*//g" | \ /bin/sed -e "s/<body.*//g" | \ /bin/sed -e "s/<a.*//g" | \ /bin/sed -e "s/name=.*//g" | \ /bin/awk '{ if($0 ne '') print; }' > $2 /bin/chmod 644 $2 }
getPage http://www.dvb.de/inhaf/HAF-1/-110812.htm $dirDWN/line1Waltherstrasse-Kleinschachwitz.txt
Das Problem des Skripts ist daß, wenn DVB die Seite ändert (manchmal, bei Planänderung passiert), ich muß die URL auch ändern...
Tschüß Luca Bertoncello (lucabert@lucabert.de)