Hallo Liste,
ich habe die Aufgabe bekommen, aus den verschiedenen Ordnern eines IMAP-Servers alle E-Mails in je eine pdf-Datei umzuwandeln. Dabei sollen die Namen der erzeugten Pdf-Dateien mindestens das Sendedatum und die Betreffzeile im Namen tragen.
Nun habe ich schon einen ganze weile gesucht und probiert, aber funktionierende Lösung habe ich nicht gefunden.
Habt Ihr eine Idee?
Die größten Fortschritte habe ich mit Thunderbird und W***s (schäm!!!) erreicht. Dabei habe ich eine virtuellen Druckertreiber (FreePdf XP) eingerichtet, mit dem ich alle ausgewählten Dateien in jeweils eine pdf-Datei drucke und die auf der Festplatte ablege. Unter dieser Kombination erreiche ist zumindest dass die pdf-Dateien als Namen die Betreffzeile tragen. Da zwingend das Datum der Absendung mit enthalten sein soll bin ich mit dieser Lösung, aus verständlichen Gründen nicht ganz zu frieden.
Auf die händische Bearbeitung des Dateinamens werde ich wohl nicht ganz verzichten können, da zusätzlich noch weitere Informationen enthalten sein müssen, die mehr oder viel mehr versteckt in der E-Mail vorhanden ist. In Anbetracht der Menge von 1000 bis 1500 E-Mail möchte ich den Aufwand und die Fehleranfälligkeit jedoch so gering wie möglich halten.
Vielen Danke für eventuelle Hinweise bei der Zielfindung
Jens
"Jens Boehme" jens-boehme@gmx.de writes:
ich habe die Aufgabe bekommen, aus den verschiedenen Ordnern eines IMAP-Servers alle E-Mails in je eine pdf-Datei umzuwandeln. Dabei sollen die Namen der erzeugten Pdf-Dateien mindestens das Sendedatum und die Betreffzeile im Namen tragen.
Vielleicht habe ich das nicht verstenden ... ich sehe zwei Teilprobleme: zum einen das automatisierte Umwandeln in eine PDF-Datei (wie schön soll das aussehen?) und zum anderen die Erstellung des Dateinamens.
Für ersteres wäre muttprint recht schön:
muttprint -p - -f mailfile > foo.ps ps2pdf foo.ps
Für zweiteres kommst du IMHO nicht drumrum, mittels einer Skriptsprache (z.B. Perl oder Shell) die nötigen Header-Informationen aus der Datei rauszupopeln und daraus dann den Dateinamen zu machen.
Sven
Sven Rudolph schrieb:
(wie schön soll das aussehen?) und zum anderen die Erstellung des
Schönheit ist immer sehr relativ zu sehen, von daher ist nicht ganz einfach zu beantworten. Würde mal sagen der Ausdruck sollte eher schön sein und nicht nur die E-Mail Rohansicht wiedergeben.
Für ersteres wäre muttprint recht schön:
muttprint -p - -f mailfile > foo.ps ps2pdf foo.ps
An mutt hatte ich noch gar nicht gedacht/versucht. Werde es am Freitag gleich mal testen.
Für zweiteres kommst du IMHO nicht drumrum, mittels einer Skriptsprache (z.B. Perl oder Shell) die nötigen Header-Informationen aus der Datei rauszupopeln und daraus dann den Dateinamen zu machen.
rauspopeln - ein schöner sehr treffender Ausdruck! Ich hatte gehofft dass es noch ein andere Lösung gibt.
Jens
Für zweiteres kommst du IMHO nicht drumrum, mittels einer Skriptsprache (z.B. Perl oder Shell) die nötigen Header-Informationen aus der Datei rauszupopeln und daraus dann den Dateinamen zu machen.
rauspopeln - ein schöner sehr treffender Ausdruck! Ich hatte gehofft dass es noch ein andere Lösung gibt.
Es gibt eine Erweiterung für Thunderbird names smartsave - damit kann man seine Mails mit Ordnerstruktur rekursiv als Text-Dateien / Verzeichnisse exportieren. Bei der Namensgebung ist man afaik recht flexibel (ich verwende das nicht selber, Datum und Betreff im Namen sollten möglich sein) - wär ggf. was zum Ausprobieren.
Alex
Hallo Liste,
hier noch einmal eine kurze Zusammenfassung meine Vorgehens bei der Erstellung der pdf-Dateien.
Die Umwandlung der großen Anzahl von E-Mails in pdf-dateien habe ich unter Benutzung des Thunderbird Add-Ons "SmartSave", eines pdf-Druckertreibers und etwas bash/gawk gelöst.
Im ersten Arbeitsschritt habe ich alle E-Mails in pdf-Dateien umgewandelt. Durch die Selektion aller E-Mails und der Auswahl des pdf-Druckertreibers ging dies zügig von statten. Auf der Festplatte landet für jede E-Mail eine pdf-Datei, welche als Namen die Betreffzeile trägt.
Als Zweites habe ich mit dem Add-On "SmartSave" die gleichen E-Mails als Textdateien auf die Festplatte gespeichert. Dabei kann man sehr komfortabel und flexibel den Namen der Datei aus den verschiedenen Attributen der E-Mail, wie beispielsweise Absender, Empfänger, Sendedatum, Betreffzeile ... usw. zusammensetzen. Erfreulicher weise wir die Umwandlung in einer Textdatei protokolliert.
Im dritten Arbeitsschritt habe ich diese Protokolldatei unter Verwendung von bash und gawk wiederum in ein Shell-Skript umgeformt, mit dem ich die Namen der pdf-Dateien in die gewünschte Form bringe.
Zum Schluß bleibt nur noch die Platte aufgeräumt werden.
Jens
Jens Böhme jens-boehme@gmx.de writes:
Für ersteres wäre muttprint recht schön:
muttprint -p - -f mailfile > foo.ps ps2pdf foo.ps
An mutt hatte ich noch gar nicht gedacht/versucht. Werde es am Freitag gleich mal testen.
muttprint heißt nur so, weil es mal als Mail-Schön-Drucker für Mutt entwickelt wurde. Es ist eigentlich von mutt unabhängig und ist z.B. unter Debian eine eigenständiges Paket. Du mußt also wirklich nach muttprint und nicht nach mutt suchen.
Sven
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1
Jens Böhme schrieb: | Sven Rudolph schrieb: |> Für zweiteres kommst du IMHO nicht drumrum, mittels einer |> Skriptsprache (z.B. Perl oder Shell) die nötigen Header-Informationen |> aus der Datei rauszupopeln und daraus dann den Dateinamen zu machen. | rauspopeln - ein schöner sehr treffender Ausdruck! Ich hatte gehofft | dass es noch ein andere Lösung gibt.
Ging das nicht mal mit formail (von procmail)?
Tobias
lug-dd@mailman.schlittermann.de