Hallo, Liste!
Kennt jemand ein Programm, mit dem ich mehrere PDF-Dateien lesen kann und die Inhalte in eine MySQL-Datenbank indizieren kann, so daß ich später, mit einer SQL-Anfrage ein beliebiges Text in allen PDFs suchen kann?
Ich danke euch! Luca Bertoncello (lucabert@lucabert.de)
Hej Luca!
Kennt jemand ein Programm, mit dem ich mehrere PDF-Dateien lesen kann und die Inhalte in eine MySQL-Datenbank indizieren kann, so daß ich später, mit einer SQL-Anfrage ein beliebiges Text in allen PDFs suchen kann?
Jain.
Full-blown: Desktop-Suchmaschinen. Eigenbaumaterial: pdf{to|2}text
Hälsningar Fabian
Am 16.11.2009 um 16:08 schrieb Luca Bertoncello:
Hallo, Liste!
Kennt jemand ein Programm, mit dem ich mehrere PDF-Dateien lesen kann und die Inhalte in eine MySQL-Datenbank indizieren kann, so daß ich später, mit einer SQL-Anfrage ein beliebiges Text in allen PDFs suchen kann?
Vielleicht lässt sich hieraus was bauen: http://www.kapustabrothers.com/2008/01/20/indexing-pdf-documents-with-zend_s... Ist zwar nicht direkt MySQL, aber Lucene kann gut mit Volltext suchen umgehen.
Habe in einem Projekt mit der PHP Version schon einen Index mit über 8GB Daten und Millionen Datensätzen gebaut und es gab gute Antwortzeiten.
Peter -- http://www.drantos.com - Software Development
lug-dd@mailman.schlittermann.de