Zitate erfassen nach erneutem OCR-Durchlauf

Alexander O. hinzugefügt 45 Tagen her
beantwortet

Hallo!

ich möchte Zitate in einem PDF-Dokument erfassen und markiere entsprechende Stellen in einem PDF-Dokument, in dem ich eine erneute OCR-Erkennung durchgeführt habe. Die OCR-Erkennung war nötig, weil der erkannte Text in der alten PDF unbrauchbar war (so etwa "C7>3?D;5" anstelle von "deontic").

Ich habe mich in einem PDF-Reader vergewissert, dass der neue Text richtig erkannt wurde, und wollte mit der Zitat-Markierung in C6 anfangen. Als erstes habe ich im internen C6-PDF-Viewer Schlüsselwörter wie deontic gesucht und einige gefunden. Wenn ich aber diese Stellen markiere und als C6-Zitate übernehme, sehe ich wieder den unbrauchbaren Text "67@?D;5 …".

Grüße, Alexander

/731c3fd1a5e04e9a7cc768a19b4c255b

Kommentare (5)

Foto
1

PS. Windows-Run-Dialog stellt den erkannten Text richtig dar (ich habe den in die Windows-Zwischenablage kopiert).

/b80c214d73a9a58015aaf30f8cfc78b4

Foto
1

Hallo Alexander

Um auf Nummer Sicher zu gehen: Wenn Sie aus dem PDF-Dokument mit Ihrem PDF-Viewer Text kopieren und in Word einfügen, kommt dort der "richtige" Text an?

Freundliche Grüsse

Peter

Foto
1

Hallo Peter,

danke, das Problem lag woanders und zwar an der OCR-Erkennung, die eine zusätzliche Textschicht hinzugefügt hat. Dabei spinnt mein PDF-Viewer auf die gleiche Art und Weise rum, wie C6: Es werden beim Suchen in meinem PDF-Viewer Suchwörter richtig hervorgehoben, aber wenn ich in meinem PDF-Viewer ein Wort kopiere und woanders hin paste, kommt unglaublicher Müll + Zeilenumbruch + zweimal das Suchwort zustande wie hier in Word:

b50a327ec730a44c46853a3e1a47a241

Wenn ich aber OCR durchführe, ohne eine zusätzliche Schicht hinzuzufügen, extrahiert mein PDF-Viewer den Text und C6 das Zitat richtig. Ich war etwas zu schnell :(

Viele Grüße, Alexander

Foto
1

Hallo Alexander,

ich finde es gut, wenn Sie solche Erfahrungen mit allen Citavisten teilen. Das ist immer lehrreich. Darum herzlichen Dank für Ihre Mühe!

Freundliche Grüsse

Peter

Foto
1

Gern geschehen ;-)