Hi Liste,
gibt es eine elegante Möglichkeit aus einer pdf-Datei einzelne Seiten(-bereiche) zu extrahieren? Druckt man die Datei mit Acrobat Bereichsweise in eine pdf-Datei, dann wird die neue Datei riesig. Statt 2,5 MB für 100 Seiten benötigt die neue Datei 5,1 MB für 14 Seiten. (Mit gzip kommt man auf ein reichliches Megabyte.) Geht man den Umweg über Ghostscript (z.B. pdf2ps -> ps2pdf) dann erhält man pdf-Dateien mit einer pixeligen Schrift.
Jens Weiße
PS: Für alle die sich wundern kommt hier eine Problembeschreibung. Mit pdflatex erstelle ich eine pdf-Datei (mit Postscript-Schriften). Die sieht auch richtig schnuckelig aus. Jetzt will einen Teil (14 Seiten) per Mail verschicken. Dann ist eine kleinere Datei äusserst praktisch. Nur den gewünschten Bereich von latex erzeugen lassen geht auch nicht richtig, weil dann die Referenzen zu den anderen Bereichen fehlen. <böse> Gut, fast jeder Mensch hat irgendeine zip-Version auf seinem Rechner, aber leider ist nicht jeder so clever diese auch zu benutzen, wenn man eine zip-Datei am Hals hat. :-(
Jens Weiße wrote:
Hi Liste,
Hi Jens,
gibt es eine elegante Möglichkeit aus einer pdf-Datei einzelne Seiten(-bereiche) zu extrahieren? Druckt man die Datei mit Acrobat Bereichsweise in eine pdf-Datei, dann wird die neue Datei riesig. Statt 2,5 MB für 100 Seiten benötigt die neue Datei 5,1 MB für 14 Seiten. (Mit gzip kommt man auf ein reichliches Megabyte.)
D.h. du kannst die PDF-Dateien mit gzip noch komprimieren ? Dann solltest du mal deine Acrobat-Einstellungen anschauen. (Der Distiller bastelt das PDF komplett neu zusammen, inkl. Rekomprimierung der Bilder - da würde ich mal drauf tippen)
Aber wenn du schon Acrobat hast, warum löschst du nicht einfach die Seiten und speicherst wieder ?
Geht man den Umweg über Ghostscript (z.B. pdf2ps -> ps2pdf) dann erhält man pdf-Dateien mit einer pixeligen Schrift.
BTW: Da Ghostscript PDF von hause aus versteht, geht nur ps2pdf mit PDF-Datei als Eingabe ganz wunderbar und erspart dir den Umweg über Postscript. Dabei werden nämlich wahrscheinlich die Fonts durch welche ersetzt, die dann beim PDF wieder pixelig werden ...
Ghostscipt hat übrigens 'ne Unmenge an Optionen, auch für PDF. Vielleicht helfen die ja weiter ? Achja, und es sollte mind. v6.5x sein. Frühere Ghostscripts hatten so ihre Probleme mit PDF.
Jens Weiße
Jens
Am Donnerstag, dem 25. April 2002 um 19:43:47, schrieb Jens Lorenz:
Ghostscipt hat übrigens 'ne Unmenge an Optionen, auch für PDF.
Welche denn?
$ ps2pdf -help Usage: ps2pdfwr [options...] (input.[e]ps|-) [output.pdf|-]
Und keine man page, hmm.
Torsten
On 26.04.02 Torsten Werner (twerner@intercomm.de) wrote:
Am Donnerstag, dem 25. April 2002 um 19:43:47, schrieb Jens Lorenz:
Ghostscipt hat übrigens 'ne Unmenge an Optionen, auch für PDF.
Welche denn?
$ ps2pdf -help Usage: ps2pdfwr [options...] (input.[e]ps|-) [output.pdf|-]
Und keine man page, hmm.
bash-2.05a$ file $(which ps2pdf) /cygdrive/c/Programme/gs/gs7.03/lib/ps2pdf: Bourne shell script text executable bash-2.05a$ more /cygdrive/c/Programme/gs/gs7.03/lib/ps2pdf #!/bin/sh # $Id: ps2pdf,v 1.1 2000/03/09 08:40:40 lpd Exp $ # Convert PostScript to PDF.
# Currently, we produce PDF 1.2 by default, but this is not guaranteed # not to change in the future. exec ps2pdf12 "$@" bash-2.05a$ file $(which ps2pdf12) /cygdrive/c/Programme/gs/gs7.03/lib/ps2pdf12: Bourne shell script text executable bash-2.05a$ more /cygdrive/c/Programme/gs/gs7.03/lib/ps2pdf12 #!/bin/sh # $Id: ps2pdf12,v 1.1 2000/03/09 08:40:40 lpd Exp $ # Convert PostScript to PDF 1.2 (Acrobat 3-and-later compatible).
exec ps2pdfwr -dCompatibilityLevel=1.2 "$@" bash-2.05a$ file $(whoch ps2pdfwr) /cygdrive/c/Programme/gs/gs7.03/lib/ps2pdfwr: Bourne shell script text executabe bash-2.05a$ more /cygdrive/c/Programme/gs/gs7.03/lib/ps2pdfwr #!/bin/sh # $Id: ps2pdfwr,v 1.6 2001/06/22 16:09:22 lpd Exp $ # Convert PostScript to PDF without specifying CompatibilityLevel.
<Optionenbehandlung snipped>
# We have to include the options twice because -I only takes effect if it # appears before other options. exec gs $OPTIONS -q -dNOPAUSE -dBATCH -sDEVICE=pdfwrite "-sOutputFile=$outfile" $OPTIONS -c .setpdfwrite -f "$infile" bash-2.05a$
-> man gs
SCNR, H.
Am Freitag, dem 26. April 2002 um 12:26:20, schrieb Hilmar Preusse:
-> man gs
So schlau bin ich auch gewesen, aber welche speziellen PDF-Optionen finde ich denn in 'man gs'? IMHO keine.
Torsten
Die PDF-Optionen findet man in der (HTML)-Hilfe zu GhostScript, dort: file:/usr/share/ghostscript/6.51/doc/Ps2pdf.htm und die Hilfe ist auch von der Index-Datei file:/usr/share/ghostscript/6.51/doc/Readme.htm aus zugreifbar. Der Pfad ist in diesem Fall von einer SuSE- Distribution.
Stefan
.
__________________________________________________ Do You Yahoo!? Yahoo! Games - play chess, backgammon, pool and more http://games.yahoo.com/
Am Freitag, 26. April 2002 09:16 schrieb Torsten:
Am Donnerstag, dem 25. April 2002 um 19:43:47, schrieb Jens Lorenz:
Ghostscipt hat übrigens 'ne Unmenge an Optionen, auch für PDF.
Welche denn?
$ ps2pdf -help Usage: ps2pdfwr [options...] (input.[e]ps|-) [output.pdf|-]
Und keine man page, hmm.
Es gibt (exakt) _eine_ man page. Auf dieser gibt es keinen Hinweis auf potentiellen pdf-Input und die Optionen. Falls man interessiert ist, darf man die Datei Ps2pdf.htm konsultieren. Von dort geht's zur Datei mit den Optionen ( Use.htm#Switches ). Eine etwas ungewöhnliche Art der Programmdokumentation.
Jens
Am Donnerstag, 25. April 2002 19:43 schrieb Jens Lorenz:
D.h. du kannst die PDF-Dateien mit gzip noch komprimieren ? Dann solltest du mal deine Acrobat-Einstellungen anschauen. (Der Distiller bastelt das PDF komplett neu zusammen, inkl. Rekomprimierung der Bilder - da würde ich mal drauf tippen)
Aber wenn du schon Acrobat hast, warum löschst du nicht einfach die Seiten und speicherst wieder ?
Auf die Idee mit der Acrobat Suite bin ich auch schon gekommen. Nur habe ich keine 300 Euro :-( und kein funktionsfähiges Windows auf der Platte :-) Deshalb habe ich die Funktion "Drucken in Datei" des Readers genommen.
Geht man den Umweg über Ghostscript (z.B. pdf2ps -> ps2pdf) dann erhält man pdf-Dateien mit einer pixeligen Schrift.
BTW: Da Ghostscript PDF von hause aus versteht, geht nur ps2pdf mit PDF-Datei als Eingabe ganz wunderbar und erspart dir den Umweg über Postscript.
Das war neu für mich. Auch die man-page gibt keinen Hinweis auf diese (praktische) Funktion. Für alle die es interessiert, kommt hier die Lösung. Funktioniert sehr gut und liefert eine kleine Datei.
ps2pdf -dFirstPage=nummer -dLastPage=nummer Eingabe.pdf Ausgabe.pdf
Dabei werden nämlich wahrscheinlich die Fonts durch welche ersetzt, die dann beim PDF wieder pixelig werden ...
Hm... Deshalb verwende ich immer Postscriptschriften. Eigentlich sollten doch unkannte Schriften in das Dokument eingebunden werden. Warum dann bei der "pdf2ps -> ps2pdf" Umwandlung so was entsteht finde ich merkwürdig.
Ghostscipt hat übrigens 'ne Unmenge an Optionen, auch für PDF. Vielleicht helfen die ja weiter ? Achja, und es sollte mind. v6.5x sein. Frühere Ghostscripts hatten so ihre Probleme mit PDF.
Jens Weiße
Jens Weiße wrote:
Hi Jens,
D.h. du kannst die PDF-Dateien mit gzip noch komprimieren ? Dann solltest du mal deine Acrobat-Einstellungen anschauen. (Der Distiller bastelt das PDF komplett neu zusammen, inkl. Rekomprimierung der Bilder - da würde ich mal drauf tippen)
Aber wenn du schon Acrobat hast, warum löschst du nicht einfach die Seiten und speicherst wieder ?
Auf die Idee mit der Acrobat Suite bin ich auch schon gekommen. Nur habe ich keine 300 Euro :-( und kein funktionsfähiges Windows auf der Platte :-) Deshalb habe ich die Funktion "Drucken in Datei" des Readers genommen.
Ich war davon ausgegangen, daß du mit "Acrobat" die Acrobat Suite meinst ...
Geht man den Umweg über Ghostscript (z.B. pdf2ps -> ps2pdf) dann erhält man pdf-Dateien mit einer pixeligen Schrift.
BTW: Da Ghostscript PDF von hause aus versteht, geht nur ps2pdf mit PDF-Datei als Eingabe ganz wunderbar und erspart dir den Umweg über Postscript.
Das war neu für mich. Auch die man-page gibt keinen Hinweis auf diese (praktische) Funktion. Für alle die es interessiert, kommt hier die
Ich habe es durch einen Tippfehler auf der Kommandozeile herausgefunden.
Lösung. Funktioniert sehr gut und liefert eine kleine Datei.
ps2pdf -dFirstPage=nummer -dLastPage=nummer Eingabe.pdf Ausgabe.pdf
Das klingt gut. Werde ich gleich in ein Shell-Skript giessen. (Ich komme bestimmt auch mal an dem Problem vorbei)
Dabei werden nämlich wahrscheinlich die Fonts durch welche ersetzt, die dann beim PDF wieder pixelig werden ...
Hm... Deshalb verwende ich immer Postscriptschriften. Eigentlich sollten doch unkannte Schriften in das Dokument eingebunden werden. Warum dann bei der "pdf2ps -> ps2pdf" Umwandlung so was entsteht finde ich merkwürdig.
Ich habe aufgehört mich über sowas zu wundern. Einfach solange mit den Optionen spielen und umwandeln bis das gewünschte herauskommt. Nicht schön, aber funktioniert für mich.
Jens
On 26.04.02 Jens Weiße (jens.weisse@gmx.net) wrote:
Moin,
Das war neu für mich. Auch die man-page gibt keinen Hinweis auf diese (praktische) Funktion. Für alle die es interessiert, kommt hier die Lösung. Funktioniert sehr gut und liefert eine kleine Datei.
ps2pdf -dFirstPage=nummer -dLastPage=nummer Eingabe.pdf Ausgabe.pdf
Und jetzt die ganz dumme Frage: Wenn ich ein verschlüsseltes PDF hatte, von da aus auf ein PS-File gedruckt habe steckt diese Information im PS noch drin. ein ps2pdf geht dann in die Hose. Was nun?
H.
Am Sonntag, 28. April 2002 23:51 schrieb Hilmar:
ps2pdf -dFirstPage=nummer -dLastPage=nummer Eingabe.pdf Ausgabe.pdf
Und jetzt die ganz dumme Frage: Wenn ich ein verschlüsseltes PDF hatte, von da aus auf ein PS-File gedruckt habe steckt diese Information im PS noch drin. ein ps2pdf geht dann in die Hose. Was nun?
Da muss ich mangelder verschlüsselter Dateien passen. In der Dokumentation zu Ghostscript (alle Pfade für Suse7.3) findet sich in /usr/share/ghostscript/6.51/doc/Psfiles.htm ein Verweis auf /usr/share/ghostscript/6.51/lib/pdf_sec.ps (Das ist keine Postscriptdatei sondern eine ghostscript Bibliothek (ASCII-Format). Was die konkret macht --> keineAhnung!! Am Montag Morgen ist mir das alles noch zu hoch.)
In /usr/share/ghostscript/6.51/doc/New-user.htm (Abschnitt PDF_encryption) finden sich die folgenden Zeilen:
<-- schnipp --> PDF encryption
Geoff Keating has created code to allow processing encrypted PDF files. Unfortunately, current U.S. export control laws don't allow redistribution of this code from a site in the U.S., even though it's freely available to anyone anywhere in the world from Geoff's site in Australia: http://www.ozemail.com.au/~geoffk/pdfencrypt/
Instructions for using this file are on Geoff's Web page. <-- schnapp --> Das hab ich nocht nicht ausprobiert (<wehleidig> sooo zeitig...)
Jens Weiße
On 29.04.02 Jens Weiße (jens.weisse@gmx.net) wrote:
Moin,
Da muss ich mangelder verschlüsselter Dateien passen. In der Dokumentation zu Ghostscript (alle Pfade für Suse7.3) findet sich in /usr/share/ghostscript/6.51/doc/Psfiles.htm ein Verweis auf /usr/share/ghostscript/6.51/lib/pdf_sec.ps (Das ist keine Postscriptdatei sondern eine ghostscript Bibliothek (ASCII-Format). Was die konkret macht --> keineAhnung!! Am Montag Morgen ist mir das alles noch zu hoch.)
OK, war 'ne dumme Frage: Ich muß nur das PDF mittels Ghostview/gs öffnen, dann gibts bei ghostscript (W$ GSVIEW32.EXE 4.0) den Punkt convert, mit dem ich dann einzelne Seiten in PDF konvertieren kann. Wahrscheinlich wird dabei dieses pdf_sec.ps verwendet, aber ich will das jetzt nicht nachprüfen.
Thnx, H.
Hilmar Preusse wrote:
On 26.04.02 Jens Weiße (jens.weisse@gmx.net) wrote:
Moin,
Nabend,
ps2pdf -dFirstPage=nummer -dLastPage=nummer Eingabe.pdf Ausgabe.pdf
Und jetzt die ganz dumme Frage: Wenn ich ein verschlüsseltes PDF hatte, von da aus auf ein PS-File gedruckt habe steckt diese Information im PS noch drin. ein ps2pdf geht dann in die Hose. Was nun?
H.
Das kann ich nicht nachvollziehen. Ich habe mit Ghostscript und Tools schon erfolgreich verschlüsselte PDFs in unverschlüsselte umgewandelt, indem ich auf Postscipt gedruckt habe und dann wieder PDF draus gemacht habe ...
Jens
lug-dd@mailman.schlittermann.de