Hallo!
Am 2003-08-06 23:48 +0200 schrieb Erik Schanze:
Am 06. August 2003 schrieb Hilmar Preusse:
Moin,
Mag sein, daß meine Frage naiv erscheint: Ich habe hier ein paar Bilder, die eingescannte Textseiten sind. D.h. sie sollten größtenteils weiß sein, bis auf die Buchstaben. Wie man weiß, sind sie dies aber nicht. Ich suche nun ein Programm dem ich mitteilen kann, daß es das Bild analysieren soll und alle Punkte, deren Schwarzheit ein gewisses Maß unterschreitet einfach weißen soll. Ich habe dabei an gimp gedacht, aber wie kaum anders zu erwarten, erschlägt mich die Komplexität dieses Programmes. Weiß jemand ob und wie das mit GIMP zu realisieren ist?
Spontan fällt mir dazu: Bild->Farben->Schwellwert oder Median-Filter ein.
Das sind schon die richtigen Stichworte, aber ein bisschen was muss noch dazu gesagt werden. Eine einfache Schwellwertfilterung führt meistens dazu, dass die Buchstaben total ausfransen, Linien unterbrochen werden und "Dreckeffekte" auftreten, d. h., einzelne Flecken auf dem Papier werden dann schwarz. Für OCR ist sowas nicht gut geeignet, da sind Graustufenbilder IMHO besser. Fürs einfache Archivieren und Anschauen geht's natürlich.
Vor der Schwellwertfilterung bietet es sich an, eine Median-Filterung zu machen, weil die Rauschen entfernt ohne Unschärfe ins Bild einzubringen. Allerdings hat man auch damit das Problem ausfransender Ränder, evtl. musst Du ein bisschen mit den Parametern experimentieren. Leider hab ich im GIMP noch keinen Medianfilter gefunden; vielleicht heißt er auch nur anders?
Ciao, Pitti