Printable Version of Topic

-ff-net-forum
+--Forum: Computer und die Welt
+---Topic: PDF started by Trude


Posted by: Trude on 09 Maerz 2018, 18:51

Habe folgendes Problem:
Muss immer wieder pdf Dateien für das Seminar bearbeiten und diese kopieren.
Habe jetzt eine PDF Datei bei der man gar nichts machen kann.

Es funktioniert in
1) PDF-XChange Viewer: Kein Markieren möglich, hier habe ich noch nie kopieren können
2) Microsoft Edge: Kein Kopieren möglich

Was kann ich tun, dass ich nicht alles was ich exzerpieren muss herausschreiben muss.
Umwandlung in doxs oder txt online hat auch keinen Erfolg gebracht,

Bitte um Hilfe!!!!

Posted by: ff on 09 Maerz 2018, 19:07

Hallo Trude,

das Problem ist, dass die Beispieldatei, die du mir gesendet hast, keine "echte" pdf-Datei ist, wo du den Text markieren kannst, weil sie nur aus eingescannten Buchseiten, also BILDERN besteht.

Probiere einmal selbst:
1. Wandle ein Word-doc in ein pdf
2. Scanne eine Buchseite und speichere sie als pdf ...

Jetzt rate einmal, bei welchem pdf du den Text markieren und kopieren kannst ;-)

Um das Problem zu lösen sind folgende Schritte notwendig:

1. Du lädst das PDF in ein Texterkennungs-Programm und erhältst reinen Text
2. Je nach Qualität der Bilder korrigierst du die Erkennungsfehler im Text
3. Den fertigen Text kannst du beliebig weiterverarbeiten.

Falls du gerade kein Texterkennungsprogramm zur Verfügung hast, kannst du die kostenfreie Online-Lösung < >>> www.free-ocr.com <<< > verwenden. (Funktioniert recht gut, wenn man das PDF vorher in einzelne Bilder zerlegt)

Das Portal < >>> online-umwandeln.de <<< > wandelt sogar mehrseitige PDFs sehr brauchbar um, dafür nervt es mit Werbung ...

lg
ff

Posted by: Trude on 09 Maerz 2018, 20:36

Hallo ff,
vielen lieben Dank für deinen Tipp.
Ich bin ja nie auf die Idee gekommen, dass ein PDF eigentlich ein Bild ist.
Habe den ersten Artikel jetzt nach deinen Anweisungen von PDF in einzelne jpg s zerlegt.
Das Umwandeln ist schon ziemlich zeitaufwändig, funktioniert aber mit dem ocr Programm recht gut.
Achtung: Man muss bei jedem neuen Dokument immer wieder die Sprache neu einstellen.

Jetzt habe ich aber noch ein Dokument das zweiseitig ist.
Da werde ich jedes jpg. teilen müssen, nehme ich an.

Danke!!!!
Trude

Posted by: ff on 09 Maerz 2018, 21:08

Nein, ein PDF ist eigentlich kein Bild. Es ist ein "Container", wo Text und Bilder enthalten sein können. Wenn aber NUR Bilder enthalten sind, kannst du eben keinen Text herauskopieren.

Hast du es schon auf < >>> online-umwandeln.de <<< > mit dem kompletten PDF probiert? Da musst du nach dem Hochladen der PDF-Datei das gewünschte Ziel-Format auswählen. Z.B. doc.

Wenn es dann heißt, dass nur 2 Umwandlungen pro Stunde kostenfrei sind, könntest du deine Internet-Verbindung neu aufbauen. Vermutlich identifizieren die über die IP-Adresse und so erhältst du eine neue ...  :p

Posted by: Trude on 10 Maerz 2018, 22:56

Danke!!!!
Mit online-umwandeln.de hat es jetzt viel schneller und besser geklappt.
Super Tipp vom "Meister"

end


Powered by Ikonboard 3.1.1
Ikonboard © 2001 Jarvis Entertainment Group, Inc.