-
Suchfunktion in PDFs
Hallo
die Suchfunktion habe ich bisher noch nicht eingesetzt. Zur Abklärung für ein laufendes Projekt müsste ich wissen, ob die Suchfuktion von TYPOlight auch die Inhalte in PDFs durchsucht und in der Suchresultatliste anzeigt?
Danke für eure Antwort.
-
-
Und ist auch ohne spezielle Module und ServerAngepasste Einrichtung nicht ohne weiteres moeglich.
-
Danke vielmals an euch, xtra und lindesbs.
Also mit TL Mitteln wird das Durchsuchen von PDFs definitiv nicht gehen?
Kennt jemand eine Möglichkeit, ein Modul, das man für sowas einsetzen könnte. Verstehe ich das richtig, dass der Inhalt eines PDFs beispielsweise in eine DB gepackt werde müsste, um überhaupt indiziert werden zu können?
Hat ja jetzt nichts mehr mit TL zu tun, aber wenn jemand sowas schon mal implementiert hat wäre ich sehr froh um einen Tipp. Danke schon mal.
-
Unter Linux gibts z.B. pdf2txt, damit koennen PDFs in Text verwandelt werden. Oder mittels OpenOffice geht sowas auch automatisiert.
Wenn der Text dann extrahiert wurde, kann dies natuerlcih auch in tl_search eingepflegt und gefunden werden.
-
Hallo alphabeet,
mit http://www.php-code.eu/code/Convert-...-Text-231.html könntest Du schonmal weiterkommen und das z.B. als externe PHP-Funktion in TL einbinden.
Mal so als Anregung zum Weiterdenken - TL kann das an sich nicht selbst.
LG, Carolina.
-
Danke lucina,
Die Idee kannte ich noch nicht. Muss ich mir mal bei Gelegenheit ansehen.
Dann muss nun noch geklaert werden, wie die PDFs in den Suchindex mit aufgenommen werden sollen. TL kennt diese ja nicht als "Seiten", die es durchparsen muss.
Evtl. koennte man das am Modul Downloadarchiv aufhaengen oder etwas in der Art.
-
Danke allen für die Inputs. Ich werde weiterforschen und sicher berichten, ob's klappt mit den PDFs Durchsuchen.
-
Ist dies immer noch aktuell oder gibt es da mittlerweile eine Erweiterung um Inhalte von PDFs über die TL interne Suche zu finden?
Liebe Grüsse,
Sandro
-
Es gibt keine Erweiterung dafür...
-
Das ist nicht ganz korrent. Es gibt eine Erweiterung dafür :D
Sie liegt seit mehr als einem Jahr bei mir auf der Festplatte rum, wurde aber bisher nur ein mal eingesetzt. Vorausgesetzt werden Binary-Programme auf dem Server (die Erwähnte pdf2text für PDFs, andere z.B. für Word oder Powerpoint). Ich habe das ganze sehr lange nicht mehr benutzt/getestet, wäre aber an einem kleinen "Pilotprojekt" interessiert... allerdings wird es nicht ganz kostenlos möglich sein :o
-
Hallo,
ich suche eine Funktion, wo man NICHT nach dem Innhalt der PDF suchen kann, sondern nach dem PDF als Datei.
Ich habe für alle PDF-Dateien eine meta.txt angelegt. Darin steht der Name der PDF-Datei und jener Name, die im FE ausgegeben werden.
Gibt es denn eine Möglichkeit, dass man dannach suchen kann, was in der meta.txt steht, bzw, dass man mehrer meta.txt mit in die suche integriert?
Ich habe bei einem anderen Beitrag schon mal so eine Anfrage gestellt, und diese wurde nur mit dem Link zu diesem Beitrag hier beantwortet. Leider hab ich bis dato noch nichts gefunden.
-
Das müsste eigentlich problemlos funktionieren, da der Inhalt der Seiten ja gefunden wird, und auf der Seite steht der Name.