Moin,
Mag sein, daß meine Frage naiv erscheint: Ich habe hier ein paar Bilder, die eingescannte Textseiten sind. D.h. sie sollten größtenteils weiß sein, bis auf die Buchstaben. Wie man weiß, sind sie dies aber nicht. Ich suche nun ein Programm dem ich mitteilen kann, daß es das Bild analysieren soll und alle Punkte, deren Schwarzheit ein gewisses Maß unterschreitet einfach weißen soll. Ich habe dabei an gimp gedacht, aber wie kaum anders zu erwarten, erschlägt mich die Komplexität dieses Programmes. Weiß jemand ob und wie das mit GIMP zu realisieren ist?
Hilmar
Am 06. August 2003 schrieb Hilmar Preusse:
Moin,
Mag sein, daß meine Frage naiv erscheint: Ich habe hier ein paar Bilder, die eingescannte Textseiten sind. D.h. sie sollten größtenteils weiß sein, bis auf die Buchstaben. Wie man weiß, sind sie dies aber nicht. Ich suche nun ein Programm dem ich mitteilen kann, daß es das Bild analysieren soll und alle Punkte, deren Schwarzheit ein gewisses Maß unterschreitet einfach weißen soll. Ich habe dabei an gimp gedacht, aber wie kaum anders zu erwarten, erschlägt mich die Komplexität dieses Programmes. Weiß jemand ob und wie das mit GIMP zu realisieren ist?
Spontan fällt mir dazu: Bild->Farben->Schwellwert oder Median-Filter ein.
Freundlich grüßend,
Erik
Hallo!
Am 2003-08-06 23:48 +0200 schrieb Erik Schanze:
Am 06. August 2003 schrieb Hilmar Preusse:
Moin,
Mag sein, daß meine Frage naiv erscheint: Ich habe hier ein paar Bilder, die eingescannte Textseiten sind. D.h. sie sollten größtenteils weiß sein, bis auf die Buchstaben. Wie man weiß, sind sie dies aber nicht. Ich suche nun ein Programm dem ich mitteilen kann, daß es das Bild analysieren soll und alle Punkte, deren Schwarzheit ein gewisses Maß unterschreitet einfach weißen soll. Ich habe dabei an gimp gedacht, aber wie kaum anders zu erwarten, erschlägt mich die Komplexität dieses Programmes. Weiß jemand ob und wie das mit GIMP zu realisieren ist?
Spontan fällt mir dazu: Bild->Farben->Schwellwert oder Median-Filter ein.
Das sind schon die richtigen Stichworte, aber ein bisschen was muss noch dazu gesagt werden. Eine einfache Schwellwertfilterung führt meistens dazu, dass die Buchstaben total ausfransen, Linien unterbrochen werden und "Dreckeffekte" auftreten, d. h., einzelne Flecken auf dem Papier werden dann schwarz. Für OCR ist sowas nicht gut geeignet, da sind Graustufenbilder IMHO besser. Fürs einfache Archivieren und Anschauen geht's natürlich.
Vor der Schwellwertfilterung bietet es sich an, eine Median-Filterung zu machen, weil die Rauschen entfernt ohne Unschärfe ins Bild einzubringen. Allerdings hat man auch damit das Problem ausfransender Ränder, evtl. musst Du ein bisschen mit den Parametern experimentieren. Leider hab ich im GIMP noch keinen Medianfilter gefunden; vielleicht heißt er auch nur anders?
Ciao, Pitti
On 06.08.03 Erik Schanze (schanzi_@gmx.de) wrote:
Am 06. August 2003 schrieb Hilmar Preusse:
Moin,
Ich suche nun ein Programm dem ich mitteilen kann, daß es das Bild analysieren soll und alle Punkte, deren Schwarzheit ein gewisses Maß unterschreitet einfach weißen Weiß jemand ob und wie das mit GIMP zu realisieren ist?
Spontan fällt mir dazu: Bild->Farben->Schwellwert oder
Hätte ich dazu sagen sollen, daß das Bild farbig ist?
drachi:[bilder] >identify ctl__.jpg ctl__.jpg JPEG 621x877 DirectClass 8-bit 90kb 0.0u 0:01
Zumindest bei meiner Version 1.2.3 ist nach der Verarbeitung das Bild S/W.
Median-Filter ein.
Sollte das im Englischen auch so heißen? Ich habs leider nirgendwo gefunden...
Hilmar
Am 07. August 2003 schrieb Hilmar Preusse:
On 06.08.03 Erik Schanze (schanzi_@gmx.de) wrote:
Am 06. August 2003 schrieb Hilmar Preusse:
Ich suche nun ein Programm dem ich mitteilen kann, daß es das Bild analysieren soll und alle Punkte, deren Schwarzheit ein gewisses Maß unterschreitet einfach weißen Weiß jemand ob und wie das mit GIMP zu realisieren ist?
Spontan fällt mir dazu: Bild->Farben->Schwellwert oder
Hätte ich dazu sagen sollen, daß das Bild farbig ist?
drachi:[bilder] >identify ctl__.jpg ctl__.jpg JPEG 621x877 DirectClass 8-bit 90kb 0.0u 0:01
Zumindest bei meiner Version 1.2.3 ist nach der Verarbeitung das Bild S/W.
Du redest in deinem Ausgangsposting nur von Schwarz und Weiß.
Wie definierst du "Schwarzheit" bei Farben?
Das klang für mich nach aufbereitung für eine OCR-Software. Da ist Farbe doch nur störend. Kannst du das Bild auch in einem verlustfreien Format (z. B. PNG) bereitstellen? JPEG ist für Schrift denkbar ungeeignet.
Median-Filter ein.
Sollte das im Englischen auch so heißen? Ich habs leider nirgendwo gefunden...
Ist dein Google kaputt?
z. B.: http://registry.gimp.org/list?category=4
Native ist das nicht bei GIMP dabei, musst du halt als Plugin laden.
Freundlich grüßend,
Erik
Hallo,
Spontan fällt mir dazu: Bild->Farben->Schwellwert oder
Hätte ich dazu sagen sollen, daß das Bild farbig ist?
Du redest in deinem Ausgangsposting nur von Schwarz und Weiß. Wie definierst du "Schwarzheit" bei Farben?
Ich nehme an, er meinte die Helligkeit eines Bildpunktes (arithmetisches Mittel der drei Farben!?). Also die Schwarzheit, die nach einer Konvertierung auf Graustufen resultiert.
Zumindest bei meinem Gimp wird unter Verwendung von Bild --> Farben --> Schwellwert aus einem bunten Bild ein schwarz-weißes. Ganz ist mir die Funktionsweise aber nicht klar (nur ungefähr). Stelle ich beide Regler auf 255, gibt's im Bild noch weiße Flecken. Wieso?
Alternativ Bild --> Farben --> Werte auf ein Graustufenbild ansetzen (wie in einer anderen Mail schon gedacht).
MfG Matthias
On 07.08.03 Erik Schanze (schanzi_@gmx.de) wrote:
Am 07. August 2003 schrieb Hilmar Preusse:
Moin,
Hätte ich dazu sagen sollen, daß das Bild farbig ist?
drachi:[bilder] >identify ctl__.jpg ctl__.jpg JPEG 621x877 DirectClass 8-bit 90kb 0.0u 0:01
Zumindest bei meiner Version 1.2.3 ist nach der Verarbeitung das Bild S/W.
Du redest in deinem Ausgangsposting nur von Schwarz und Weiß. Wie definierst du "Schwarzheit" bei Farben?
Genauso wie bei SW. Überschreitung eines gewissen Grenzwertes bei einer oder allen 3 Komponenten. Ich verlange ja nicht, daß das ganze fehlerfrei funktioniert, sondern nur, daß die Hauptflächen geweißt werden. Einzelne Pixel kann man ja händisch nachbearbeiten
Das klang für mich nach aufbereitung für eine OCR-Software. Da ist Farbe doch nur störend.
Nein. Eher ein Farbbild, das auch eins bleiben soll, nur daß der Hintergrund rein weiß werden soll.
Kannst du das Bild auch in einem verlustfreien Format (z. B. PNG) bereitstellen? JPEG ist für Schrift denkbar ungeeignet.
Könnte ich, aber das wäre dann aus jpeg konvertiert. Ist das nützlich? Das Scanprogramm bot mir noch TIF an, aber verwendet beim Speichern ein zieml. altes Kompressionsverfahren, was die woody-libtiff nicht unterstützt. Der Versuch, die libtiff entsprechend neu zu Compilieren schlug leider fehl.
[Median-Filter ein.]
Sollte das im Englischen auch so heißen? Ich habs leider nirgendwo gefunden...
Ist dein Google kaputt?
z. B.: http://registry.gimp.org/list?category=4
Native ist das nicht bei GIMP dabei, musst du halt als Plugin laden.
GIMP bringt ja von Hause aus ein paar Plugins mit, darum dachte ich...
Danke, Hilmar
Hallo Hilmar,
meist sind die "Verunreinigungen" des Scanergebnisses grau(?). Bei einer Auswahl von weissen Flaechen mit einem bestimmten Schwellwert werden wohl auch die Grau- toene betroffen sein, die zum Anti-Aliasing der Buchstaben benoetigt werden. Wenn Du das Ergebnis nachher fuer OCR verwenden willst, koennte das problematisch werden. Kannst Du eventuell mal ein harmloses Beispiel (Ausschnitt) zum Download freigeben? Ich wuerde es mal mit ImageMagick bzw. PerlMagick versuchen.
Stefan
.
On 08.08.03 Stefan Lagotzki (lago20@gmx.de) wrote:
Hallo,
meist sind die "Verunreinigungen" des Scanergebnisses grau(?). Bei einer Auswahl von weissen Flaechen mit einem bestimmten Schwellwert werden wohl auch die Grau- toene betroffen sein, die zum Anti-Aliasing der Buchstaben benoetigt werden. Wenn Du das Ergebnis nachher fuer OCR verwenden willst, koennte das problematisch werden.
Nein, ich will kein OCR damit machen. Ich will halt einfach nur einen weißen Hintergrund haben, in der Hoffnung, daß es dann besser aussieht und auch die Bilder kleiner werden.
Kannst Du eventuell mal ein harmloses Beispiel (Ausschnitt) zum Download freigeben? Ich wuerde es mal mit ImageMagick bzw. PerlMagick versuchen.
Here we go: http://vwisb7.vkw.tu-dresden.de/~hille42/ctl-test.jpg
Danke für alle Antworten, H.
Hallo,
Nein, ich will kein OCR damit machen. Ich will halt einfach nur einen weißen Hintergrund haben, in der Hoffnung, daß es dann besser aussieht und auch die Bilder kleiner werden.
Ein bisschen umständlich geht's mittels Bild --> Farben --> Kurven. Ich hab mal eine Testkurve konstruiert, die man in dem Dialog importieren kann: http://mitglied.lycos.de/pumbo0/testcurve In der Hoffnung, dass es was hilft...
Gruß Matthias
On 09.08.03 Matthias Sauppe (matthias.sauppe@gmx.de) wrote:
Hallo,
Nein, ich will kein OCR damit machen. Ich will halt einfach nur einen weißen Hintergrund haben, in der Hoffnung, daß es dann besser aussieht und auch die Bilder kleiner werden.
Ein bisschen umständlich geht's mittels Bild --> Farben --> Kurven. Ich hab mal eine Testkurve konstruiert, die man in dem Dialog importieren kann: http://mitglied.lycos.de/pumbo0/testcurve In der Hoffnung, dass es was hilft...
Ja, hilft. Danke! Auch damit werde ich spielen.
H.
On 07.08.03 Erik Schanze (schanzi_@gmx.de) wrote:
Am 07. August 2003 schrieb Hilmar Preusse:
On 06.08.03 Erik Schanze (schanzi_@gmx.de) wrote:
Moin,
Median-Filter ein.
Sollte das im Englischen auch so heißen? Ich habs leider nirgendwo gefunden...
Ist dein Google kaputt?
z. B.: http://registry.gimp.org/list?category=4
Native ist das nicht bei GIMP dabei, musst du halt als Plugin laden.
Meinst Du http://registry.gimp.org/plugin?id=228 ? Der sieht verdammt genauso aus, wie
drachi:[hille] >dlocate despeck gimp1.2: /usr/lib/gimp/1.2/plug-ins/despeckle gimp1.2: /usr/share/gimp/1.2/help/C/filters/despeckle.html
H.
Am 08. August 2003 schrieb Hilmar Preusse:
On 07.08.03 Erik Schanze (schanzi_@gmx.de) wrote:
Am 07. August 2003 schrieb Hilmar Preusse:
On 06.08.03 Erik Schanze (schanzi_@gmx.de) wrote:
Moin,
Median-Filter ein.
Sollte das im Englischen auch so heißen? Ich habs leider nirgendwo gefunden...
Ist dein Google kaputt?
z. B.: http://registry.gimp.org/list?category=4
Native ist das nicht bei GIMP dabei, musst du halt als Plugin laden.
Meinst Du http://registry.gimp.org/plugin?id=228 ? Der sieht verdammt genauso aus, wie
drachi:[hille] >dlocate despeck gimp1.2: /usr/lib/gimp/1.2/plug-ins/despeckle gimp1.2: /usr/share/gimp/1.2/help/C/filters/despeckle.html
Genau. Tut er bei dir?
Freundlich grüßend,
Erik
On 09.08.03 Erik Schanze (schanzi_@gmx.de) wrote:
Am 08. August 2003 schrieb Hilmar Preusse:
Moin,
Meinst Du http://registry.gimp.org/plugin?id=228 ? Der sieht verdammt genauso aus, wie
drachi:[hille] >dlocate despeck gimp1.2: /usr/lib/gimp/1.2/plug-ins/despeckle gimp1.2: /usr/share/gimp/1.2/help/C/filters/despeckle.html
Genau. Tut er bei dir?
Die Beschreibung gibt nichts her und aus den Ergebnissen konnte ich auch nicht so recht schlau werden, was despeckle sein soll. Was soll er denn tun?
H.
Hallo!
Die erste Frage hier, die ich mal beantworten kann!
Ich suche nun ein Programm dem ich mitteilen kann, daß es das Bild analysieren soll und alle Punkte, deren Schwarzheit ein gewisses Maß unterschreitet einfach weißen soll.
GIMP:
Image - Colors - Hue-Saturation: Saturation ganz runterdrehen, dadurch kommt das Bild in Graustufen
Image - Colors - Brightness-Contrast: Kontrast fast auf Maximal, mit Brightness kannst Du die Schwelle bestimmen. Das hat den Vorteil, daß Du trotzdem ein kleines Antialaising hast (Keine Treppchen), im Gegensatz zu Kontrast=Maximum.
Thomas
Hallo,
Image - Colors - Brightness-Contrast: Kontrast fast auf Maximal, mit Brightness kannst Du die Schwelle bestimmen. Das hat den Vorteil, daß Du trotzdem ein kleines Antialaising hast (Keine Treppchen), im Gegensatz zu Kontrast=Maximum.
Dadurch wird das Bild nicht schwarzweiß, sondern es bleibt mindestens eine Graustufe übrig.
Andere Idee: Bild --> Farben --> Werte. Dort am oberen Slider den linken (schwarzen) und rechten (weißen) Regler auf die selbe Position ziehen. Je nach Position ist der Schwellwert dann heller oder dunkler.
Viele Grüße Matthias
Hallo,
Am Mittwoch, 6. August 2003 23:36 schrieb Hilmar Preusse:
Moin,
Mag sein, daß meine Frage naiv erscheint: Ich habe hier ein paar Bilder, die eingescannte Textseiten sind. D.h. sie sollten größtenteils weiß sein, bis auf die Buchstaben. Wie man weiß, sind sie dies aber nicht. Ich suche nun ein Programm dem ich mitteilen kann, daß es das Bild analysieren soll und alle Punkte, deren Schwarzheit ein gewisses Maß unterschreitet einfach weißen soll. Ich habe dabei an gimp gedacht, aber wie kaum anders zu erwarten, erschlägt mich die Komplexität dieses Programmes. Weiß jemand ob und wie das mit GIMP zu realisieren ist?
Hilmar
In c't 1/2003 gab's einen Artikel, der sich am Rande mit diesem Thema beschäftigt hat (Titel: "Foto-Kopierer", ab S. 186). Da wurden verschiedene Schritte aufgeführt, die das Erscheinungsbild der Schrift verbessern sollen: 1. Auto-Kontrast 2. Helligkeit/Kontrast 3. Unscharf maskieren 4. In Bitmap wandeln Damit soll die "Fransigkeit" der Buchstaben ausgeglichen werden, und gleichzeitig die Detailtreue erhalten bleiben. Das war alles auf Photoshop ausgerichtet, aber in Gimp existieren anders bezeichnete aber ähnlich wirkende Funktionen.
Gimp lässt sich ja auch per Skript steuern - das bietet sich bei solchen Sequenzen an, sobald man mehrere Bilder zu bearbeiten hat.
Perl ist auch hier dein Freund, denn die Module Gimp & Gimp::Fu stellt eine wunderschöne Schnittstelle zu den meisten Funktionen dar.
Um die Empfehlungen der c't mal an ein paar von meinen Scans auszuprobieren, habe ich ein kleines Skript verwendet, das ich unter http://rcswww.urz.tu-dresden.de/~ar5/gimp_script.pl zur Verfügung stelle.
Schau's dir mal an, es ist bestimmt leicht für deine Zwecke anzupassen, sobald du die beste Funktionssequenz rausgefunden hast.
Lass mich wissen, wenn du noch mehr Details brauchst.
Andreas Richter
On 07.08.03 Andreas Richter (ar5@rcs.urz.tu-dresden.de) wrote:
Hallo,
In c't 1/2003 gab's einen Artikel, der sich am Rande mit diesem Thema beschäftigt hat (Titel: "Foto-Kopierer", ab S. 186). Da wurden verschiedene Schritte aufgeführt, die das Erscheinungsbild der Schrift verbessern sollen:
- Auto-Kontrast
- Helligkeit/Kontrast
- Unscharf maskieren
- In Bitmap wandeln
Damit soll die "Fransigkeit" der Buchstaben ausgeglichen werden, und gleichzeitig die Detailtreue erhalten bleiben. Das war alles auf Photoshop ausgerichtet, aber in Gimp existieren anders bezeichnete aber ähnlich wirkende Funktionen.
OK, danke. Vielleicht kann man ja den Artikel noch irgendwo auftreiben.
Gimp lässt sich ja auch per Skript steuern - das bietet sich bei solchen Sequenzen an, sobald man mehrere Bilder zu bearbeiten hat. Perl ist auch hier dein Freund, denn die Module Gimp & Gimp::Fu stellt eine wunderschöne Schnittstelle zu den meisten Funktionen dar.
Ich nix Perl, ich nix gimp.
Um die Empfehlungen der c't mal an ein paar von meinen Scans auszuprobieren, habe ich ein kleines Skript verwendet, das ich unter http://rcswww.urz.tu-dresden.de/~ar5/gimp_script.pl zur Verfügung stelle.
GIMP als Server -- auf Ideen kommen die Leute. Ich hab damit angefangen zu spielen und werde in den nächsten Tagen fortsetzen. Die ersten Ergebnisse sehen gut aus. Wie stelle ich es an, daß gleich als jpg/png exportiert wird?
Schau's dir mal an, es ist bestimmt leicht für deine Zwecke anzupassen, sobald du die beste Funktionssequenz rausgefunden hast. Lass mich wissen, wenn du noch mehr Details brauchst.
Erstmal nicht. Danke bis hierhin.
H.
On Tuesday 12 August 2003 20:12, Hilmar Preusse wrote:
GIMP als Server -- auf Ideen kommen die Leute. Ich hab damit angefangen zu spielen und werde in den nächsten Tagen fortsetzen. Die ersten Ergebnisse sehen gut aus. Wie stelle ich es an, daß gleich als jpg/png exportiert wird?
(define (script-fu-foo inText) ( let*( (theImage (car (gimp-file-load 0 "foo.png" "foo.png"))) (theLayer (car (gimp-image-get-active-layer theImage))) ) ... (gimp-image-clean-all theImage) (gimp-file-save 1 theImage theLayer "foo2.png" "foo2.png") )
Hatte ich mal geschrieben, um CD-Cover zu basteln (Hintergrundbild und Texte drauf). Wozu Perl verwenden, wenn's auch anders geht :)
Josef
On Wed, Aug 06, 2003 at 11:36:45PM +0200, Hilmar Preusse wrote:
Moin,
Mag sein, daß meine Frage naiv erscheint: Ich habe hier ein paar Bilder, die eingescannte Textseiten sind. D.h. sie sollten größtenteils weiß sein, bis auf die Buchstaben. Wie man weiß, sind sie dies aber nicht. Ich suche nun ein Programm dem ich mitteilen kann, daß es das Bild analysieren soll und alle Punkte, deren Schwarzheit ein gewisses Maß unterschreitet einfach weißen soll. Ich habe dabei an gimp gedacht, aber wie kaum anders zu erwarten, erschlägt mich die Komplexität dieses Programmes. Weiß jemand ob und wie das mit GIMP zu realisieren ist?
Hallo,
Warum scannst du die Bilder nicht gleich schwarz/weiß? Bei Sane heißt das "Lineart".
Ansonsten kannst du das auch mit ImageMagick's convert auf der Shell machen:
Schaue dir die Optionen -monochrome und -threshold an.
Gruß, Thomas
On 13.08.03 Thomas Guettler (guettli@thomas-guettler.de) wrote:
Hallo,
Warum scannst du die Bilder nicht gleich schwarz/weiß? Bei Sane heißt das "Lineart".
Weil da Farbanteile drin sind und die auch drin bleiben sollen. Sonst hätte ich keine Probleme mit Bild->Farben->Schwellwert keine Probleme.
Ansonsten kannst du das auch mit ImageMagick's convert auf der Shell machen: Schaue dir die Optionen -monochrome und -threshold an. ^^^^^^^^^^
Was ist das? Die manpage schweigt sich aus.
H.
Schaue dir die Optionen -monochrome und -threshold an. ^^^^^^^^^^
Hilmar Preusse wrote:
Was ist das? Die manpage schweigt sich aus.
Eigentlich der Schwellwert bei der Auswahl einer Farbe aus dem Bild (in GIMP z.B. mit der Zauberstabmaske). Hier sagt "man ImageMagick", dass man damit ein Zweifarbenbild erstellen kann, wobei jeder Pixel, der dem Schwellwert entspricht oder darueber liegt auf die max. Intensitaet gesetzt wird. Alle anderen Pixel werden auf die minimale Intensitaet gesetzt.
Die Angabe ist ein Fliesskommawert in Prozent. Bei 8-bit-Bildern wird das Argument in eine Zahl zwischen 0..255 und bei 16-bit-Bildern zwischen Null und echo "2^16-1" | bc umgerechnet (wobei IM dann noch eine spezielle Formel verwendet, um die Helligkeit zu berechnen).
Stefan
.
On Fri, Aug 15, 2003 at 12:15:26AM +0200, Hilmar Preusse wrote:
On 13.08.03 Thomas Guettler (guettli@thomas-guettler.de) wrote:
Hallo,
Warum scannst du die Bilder nicht gleich schwarz/weiß? Bei Sane heißt das "Lineart".
Weil da Farbanteile drin sind und die auch drin bleiben sollen. Sonst hätte ich keine Probleme mit Bild->Farben->Schwellwert keine Probleme.
Ansonsten kannst du das auch mit ImageMagick's convert auf der Shell machen: Schaue dir die Optionen -monochrome und -threshold an. ^^^^^^^^^^
Was ist das? Die manpage schweigt sich aus.
man ImageMagick:
-threshold <value> threshold the image
Create a bi-level image such that any pixel inten sity that is equal or exceeds the threshold is reassigned the maximum intensity otherwise the min imum intensity.
thomas
On 16.08.03 Thomas Guettler (guettli@thomas-guettler.de) wrote:
On Fri, Aug 15, 2003 at 12:15:26AM +0200, Hilmar Preusse wrote:
Hallo,
[-treshold]
Was ist das? Die manpage schweigt sich aus.
man ImageMagick:
Darauf muß man erstmal kommen, daß ImageMagick 'ne eigene Manpage hat. Danke.
H.
lug-dd@mailman.schlittermann.de