Am 16.11.2009 um 16:08 schrieb Luca Bertoncello:
Hallo, Liste!
Kennt jemand ein Programm, mit dem ich mehrere PDF-Dateien lesen kann und die Inhalte in eine MySQL-Datenbank indizieren kann, so daß ich später, mit einer SQL-Anfrage ein beliebiges Text in allen PDFs suchen kann?
Vielleicht lässt sich hieraus was bauen: http://www.kapustabrothers.com/2008/01/20/indexing-pdf-documents-with-zend_s... Ist zwar nicht direkt MySQL, aber Lucene kann gut mit Volltext suchen umgehen.
Habe in einem Projekt mit der PHP Version schon einen Index mit über 8GB Daten und Millionen Datensätzen gebaut und es gab gute Antwortzeiten.
Peter -- http://www.drantos.com - Software Development