Ergebnis 1 bis 6 von 6

Thema: Text aus PDF herausbringen

  1. #1
    Contao-Fan Avatar von manfred
    Registriert seit
    08.05.2011.
    Ort
    Schwäbisch Gmünd
    Beiträge
    548

    Standard Text aus PDF herausbringen

    Hallo,

    vielleicht kann jemand helfen: Wir haben ein PDF mit ca. 600 Seiten, auf jeder Seite steht entweder eine emailadresse oder eine URL.
    Beides sollte weg. Löschen, mit weißem Rechteck überdecken, irgendwie so. Wenn es eine Seite wäre würde ich die als Grafik speichern, dann weiß überdecken und wieder als PDF speichern.
    Aber bei der Menge von Seiten geht das nicht.

    Hat jemand einen Tipp, wie man so etwas ggf. automatisiert machen könnte, oder wer so etwas macht?

    Gruß Manfred.

  2. #2
    Contao-Fan
    Registriert seit
    30.06.2009.
    Beiträge
    370

    Standard

    Mit Adobe Acrobat professionell sollte das eventuell gehen. Da kannst du einen leeren Platzhalter über der Stelle positionieren.

    MfG
    servpoint

  3. #3
    Contao-Urgestein Avatar von fiedsch
    Registriert seit
    09.07.2009.
    Ort
    München
    Beiträge
    2.943

    Standard

    Du bedenkst aber auch, daß die "überdekten" Teile immer noch Teil des PDF sind und mit Tools wie z.B. pdftotext wieder zum Vorschein kommen.

    Das PDF neu erzeugen ist keine Option?

  4. #4
    Contao-Fan Avatar von Grossvater
    Registriert seit
    20.02.2013.
    Beiträge
    509

    Standard

    Ist der pdf Bild oder Text?
    Welche Programme stehen dir zur Verfügung?
    Geändert von Grossvater (10.12.2015 um 20:59 Uhr)

  5. #5
    Contao-Urgestein
    Registriert seit
    20.09.2012.
    Ort
    Lüneburger Heide
    Beiträge
    1.992
    Partner-ID
    12207
    User beschenken
    Wunschliste
    Contao-Projekt unterstützen

    Support Contao

    Standard

    Hi,

    wenn Du Adobe InDesign hast, kannst Du den Text komplett aus dem *.pdf in einen (mehrere) Textrahmen in Indesign reinkopieren.
    Dann ein Absatzformat erstellen, anwenden und mit GREP (reguläre Ausdrücke) E-mail Adressen und URL´s herausfiltern.

    InDesign übernimmt auch vorhandenen Formate.

    Etwas Hand anlegen müsste man dann womöglich schon um wieder ein gleich aussehendes *pdf mit InDesign zu speichern.

    Wäre aber eine Alternative zu Acrobat Pro und den weißen Lücken.

    Gruß
    tschero
    Autodidakt und HobbyWebdesigner

    www.webdesign24.biz
    Screencasts zu Contao

  6. #6
    Contao-Urgestein
    Registriert seit
    20.09.2012.
    Ort
    Lüneburger Heide
    Beiträge
    1.992
    Partner-ID
    12207
    User beschenken
    Wunschliste
    Contao-Projekt unterstützen

    Support Contao

    Standard

    Hi,

    hab das alles noch mal nachvollzogen und funktioniert sehr gut.
    Falls Ihr das nutzen möchtet, hier mal die notwendigen RegExp:

    URL´s finden:
    Code:
    \b(http|www).[^\s]+\b
    E-Mail Adressen finden:
    Code:
    \b[a-zA-Z0-9.-]+@[a-zA-Z0-9.-]+\.[a-zA-Z0-9.-]+\b
    ...und einen kleinen Screencast von mir dazu:
    Zum Screencast

    Diese "Übung" ist natürlich auch leicht mit einer 30 Tage Testversion von InDesign durchzuführen.

    Gruß
    tschero
    Geändert von tschero (16.12.2015 um 06:26 Uhr) Grund: Rechtschreibung
    Autodidakt und HobbyWebdesigner

    www.webdesign24.biz
    Screencasts zu Contao

Aktive Benutzer

Aktive Benutzer

Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)

Lesezeichen

Lesezeichen

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein
  •