Vorheriges Thema anzeigen :: Nächstes Thema anzeigen |
Autor |
Nachricht |
HolgerS 
Anmeldungsdatum: 14.12.2001 Beiträge: 7062
|
Beitrag 0 - Verfasst am: Sa Jan 26, 2008 22:46 Titel: PDF zu Word |
 |
|
Hab hier mal ne richtig ernst gemeinte Frage:
Gibt es ein Programm welches aus einem per Fotokopie hergestelltem .PDF File wieder ein bearbeitbares Word-File erstellen kann ?
Die Textseiten sind teilweise schief kopiert worden oder auch "verwischt .....
Ausgangsfile ist ca. 100MB gross und besteht aus 106 Seiten mit Tabellen etc ..... _________________ Ach, macht doch was ihr wollt ..... aber machts wenigstens gut ...... |
|
 |
jofi 
Anmeldungsdatum: 23.09.2001 Beiträge: 277 Wohnort: Österreich
|
|
 |
HolgerS 
Anmeldungsdatum: 14.12.2001 Beiträge: 7062
|
Beitrag 2 - Verfasst am: So Jan 27, 2008 0:19 Titel: |
 |
|
Danke für die Links jofi.
So einfach ist es jedoch leider nicht ....
Es geht um einen über 100 Seiten langen Vertrag den irgendein "Hirni" mit nem "intelligenten" Kopierer als durchgängige PDF-Datei) gespeichert hat (kann das sensible Ergebnis hier nicht posten), besteht leider Seite für Seite aus Grafik ......... (schief eingelegt und verwischt sagte ich ja schon).
Ich stell mir hat einfach eine OCR SW vor, die Pdf-Dateien lesen kann .....
Wunschdenken ? _________________ Ach, macht doch was ihr wollt ..... aber machts wenigstens gut ...... |
|
 |
TomM  globaler Moderator

Anmeldungsdatum: 05.03.2002 Beiträge: 5354 Wohnort: Heilsbronn - meist Wanambi auf See
|
Beitrag 3 - Verfasst am: So Jan 27, 2008 2:29 Titel: |
 |
|
Moin,
nach meiner Erfahrung ist es Wunschdenken.
Selbst wenn Du 98% Erkennung hast, dann bleiben bei den 100 Seiten eben 2 Seiten unerkannt und die Buchstaben sind dann irgendwo verstreut. Bei Tabellen ist das dann sowieso Fummelei und die verwischen Buchstaben werden in anderer Schrift und Schriftgöße dargestellt - wenn sie erkannt werden.
Ist halt blöd, wenn es keine Grafik wär, dann gibt's einTool PDF -> Word aber so  _________________ so long -> Tom
Wissen ist Macht - macht nichts
(Heinz Erhardt) |
|
 |
HolgerS 
Anmeldungsdatum: 14.12.2001 Beiträge: 7062
|
Beitrag 4 - Verfasst am: So Jan 27, 2008 8:09 Titel: |
 |
|
Seh ich genauso.
Mit PDF2Word hab ich schon rumexperimentiert. Macht ein wunderbares Word.doc draus,halt nur (wie auch anders) alles Grafik. Bliebe nur, das Zeugs auszudrucken und mit OCR einlesen.
Ohne mich, muss mein Kollege halt selber machen.......
Trotzdem danke für die Meinungen. _________________ Ach, macht doch was ihr wollt ..... aber machts wenigstens gut ...... |
|
 |
videowahn  Gast
|
Beitrag 5 - Verfasst am: So Jan 27, 2008 9:07 Titel: |
 |
|
HolgerS hat folgendes geschrieben: | Bliebe nur, das Zeugs auszudrucken und mit OCR einlesen. |
Also das Ausdrucken ist nicht nötig. Alle neuen OCR-Programme können PDF-Dateien verarbeiten. Finereader ab Vers. 6, Omnipage ab Version 15. Nichts desto trotz wird die Erkennungsleistung bei einer schlechten PDF-Grafik auch nicht besser.
Sollte keine neuere OCR vorhanden sein, gibt es auch PDF-Tools (z.B. PDF-Xchange) die alle Grafiken aus dem PDF-Dokument exportieren, die können dann auch in ein nicht PDF-fähiges OCR übernommen werden. |
|
 |
BPHennek 

Anmeldungsdatum: 05.06.2001 Beiträge: 7473 Wohnort: EXSIS-Elegance
|
Beitrag 6 - Verfasst am: So Jan 27, 2008 10:55 Titel: |
 |
|
In dem Zusammenhang:
Wie/Womit kann ich eigentlich eine oder zwei Seiten aus einem vorh. PDF-Dokument herauslösen um diese Seiten anderweitig zu verwenden? _________________ Gier und Uneinsichtigkeit fressen den Verstand! |
|
 |
Tremmel 

Anmeldungsdatum: 02.06.2002 Beiträge: 566 Wohnort: Vorort von München
|
Beitrag 7 - Verfasst am: So Jan 27, 2008 13:17 Titel: |
 |
|
Zitat: | In dem Zusammenhang:
Wie/Womit kann ich eigentlich eine oder zwei Seiten aus einem vorh. PDF-Dokument herauslösen um diese Seiten anderweitig zu verwenden? |
Mit dem Adobe Acrobat geht das doch einwandfrei:
"Dokument ---> Seite entnehmen --->" Fertig.
MFG
J. Tremmel
 |
|
 |
BPHennek 

Anmeldungsdatum: 05.06.2001 Beiträge: 7473 Wohnort: EXSIS-Elegance
|
Beitrag 8 - Verfasst am: So Jan 27, 2008 18:23 Titel: |
 |
|
Habe ich nicht... _________________ Gier und Uneinsichtigkeit fressen den Verstand! |
|
 |
bergH  Moderator
Anmeldungsdatum: 14.06.2001 Beiträge: 13678 Wohnort: Am Kamener Kreuz
|
Beitrag 9 - Verfasst am: Mo Jan 28, 2008 9:14 Titel: |
 |
|
BTT
Adobe Acrobat hat doch eine sehr gute OCR eingebaut, wrum nutzt Du die nicht?
Paper Capture o.ä. nennt sich das. _________________ Gruß BergH |
|
 |
AnimalMother  Moderator

Anmeldungsdatum: 16.01.2003 Beiträge: 3724
|
Beitrag 10 - Verfasst am: Mo Jan 28, 2008 10:09 Titel: |
 |
|
wenn´s eh Grafiken sind kannst du mit Acrobat die reinen Bilddateien als jpg oder bmp extrahieren und neu abspeichern. Das geht verlustfrei und ohne OCR, weil nur das Drumherum entfernt wird. _________________ All the best,
Animal Mother
Nichts, was ein Mensch sich auszudenken in der Lage ist, kann so unwahrscheinlich, unlogisch oder hirnrissig sein, als dass es nicht doch ein anderer Mensch für bare Münze halten und diese vermeintliche Wahrheit notfalls mit allen ihm zur Verfügung stehenden Mitteln verteidigen wird. |
|
 |
|