Error: PDF is not OCR compatible

Hier können Sie Fragen rund um unsere Produktfamilie CompuDMS (CompuDMS Free, CompuDMS Cloud, CompuDMS Professional) stellen.
Antworten
This
Beiträge: 2
Registriert: 23 Dez 2020 05:00

Error: PDF is not OCR compatible

Beitrag von This »

Hallo zusammen

Ich bin neu hier und bin da auf ein Problem gestossen das ich mit einigen Rechnungen und anderen Dokumenten habe.
Wenn ich bereits vorhandene .pdf Dokumente einlesen möchte (OCR) dann tritt immer der Fehler auf.

Error: PDF is not OCR compatible

Meine Frage ist nun wie muss ein .pdf aussehen damit ich diesen Fehler nicht kriege?

Danke für Euren Support.

Gruss
This


Auszug aus dem Log;
Date;Time;Host;User;ProcessId;ThreadId;Type;IP;Memory;SessionId;CallId;MessageId;Message
2020/12/23;05:39:22.5022;DESKTOP-VQ2G3B7;this;00001858;0000000D;"VERB";fe80::b9f7:7cbf:4fd8:7fa5%13;43 MB;f5ed1256-aaf3-4975-97a8-48f9b5f96513;00CFACE3;0EE78619;"CALL: WCFEntry.OcrFile(""7ec95fd2-5478-4d50-ae10-9d84163fc0c2"")"
2020/12/23;05:39:22.5747;DESKTOP-VQ2G3B7;this;00001858;0000000D;"VERB";fe80::b9f7:7cbf:4fd8:7fa5%13;43 MB;f5ed1256-aaf3-4975-97a8-48f9b5f96513;00CFACE3;2E6F688B;"Start of: C:\Program Files\CompuDMS Server\7.2.7.2\PdfOcr\PdfOcr.exe check ""C:\CompuDMS\Temp\\this\7ec95fd2-5478-4d50-ae10-9d84163fc0c2.ocrchk"" /size_tolerance 0.1"
2020/12/23;05:39:22.7270;DESKTOP-VQ2G3B7;this;00001858;00000027;"VERB";;44 MB;f5ed1256-aaf3-4975-97a8-48f9b5f96513;00000000;1CEC1488;"[PROCOUT]: "
2020/12/23;05:39:22.7270;DESKTOP-VQ2G3B7;this;00001858;00000027;"VERB";;44 MB;f5ed1256-aaf3-4975-97a8-48f9b5f96513;00000000;064ECA2E;"[PROCOUT]: PdfOcr"
2020/12/23;05:39:22.7270;DESKTOP-VQ2G3B7;this;00001858;00000027;"VERB";;44 MB;f5ed1256-aaf3-4975-97a8-48f9b5f96513;00000000;076136F8;"[PROCOUT]: c CompuK”ln Dokument Management GmbH 2020"
2020/12/23;05:39:22.7270;DESKTOP-VQ2G3B7;this;00001858;00000027;"VERB";;44 MB;f5ed1256-aaf3-4975-97a8-48f9b5f96513;00000000;2FD22902;"[PROCOUT]: Version : 7.2.7.2"
2020/12/23;05:39:22.7270;DESKTOP-VQ2G3B7;this;00001858;00000027;"VERB";;44 MB;f5ed1256-aaf3-4975-97a8-48f9b5f96513;00000000;267C0053;"[PROCOUT]: "
2020/12/23;05:39:22.9258;DESKTOP-VQ2G3B7;this;00001858;00000027;"VERB";;44 MB;f5ed1256-aaf3-4975-97a8-48f9b5f96513;00000000;200B0641;"[PROCOUT]: Page 1 is incompatible: Text on page found."
2020/12/23;05:39:22.9271;DESKTOP-VQ2G3B7;this;00001858;00000027;"VERB";;40 MB;f5ed1256-aaf3-4975-97a8-48f9b5f96513;00000000;2DDCEAC9;"[PROCOUT]: Incompatible pages: 1"
2020/12/23;05:39:22.9271;DESKTOP-VQ2G3B7;this;00001858;00000027;"VERB";;40 MB;f5ed1256-aaf3-4975-97a8-48f9b5f96513;00000000;0092BD6D;"[PROCOUT]: Compatible pages: 0"
2020/12/23;05:39:22.9271;DESKTOP-VQ2G3B7;this;00001858;00000027;"VERB";;40 MB;f5ed1256-aaf3-4975-97a8-48f9b5f96513;00000000;053C7EEA;"[PROCOUT]: Error: PDF is not OCR compatible."
2020/12/23;05:39:22.9358;DESKTOP-VQ2G3B7;this;00001858;0000000D;"ERR ";fe80::b9f7:7cbf:4fd8:7fa5%13;40 MB;f5ed1256-aaf3-4975-97a8-48f9b5f96513;00CFACE3;06A188EC;"CompuKoeln.DMS.Common.Types.RequestException in CompuKoeln.DMS.Service.Helper.#=q6ElYyIY46$AbW88nMcLVgw==<T>(Exception #=qWE3e3EfVuDGrw989Qr4n$A==): InvalidFile/100"
2020/12/23;05:39:22.9374;DESKTOP-VQ2G3B7;this;00001858;0000000D;"VERB";fe80::b9f7:7cbf:4fd8:7fa5%13;40 MB;f5ed1256-aaf3-4975-97a8-48f9b5f96513;00CFACE3;0DA04D1B;"CompuKoeln.DMS.Common.Types.RequestException HResult(0x80131500): InvalidFile/100"
2020/12/23;05:39:22.9374;DESKTOP-VQ2G3B7;this;00001858;0000000D;"VERB";fe80::b9f7:7cbf:4fd8:7fa5%13;40 MB;f5ed1256-aaf3-4975-97a8-48f9b5f96513;00CFACE3;0DA04D1B;" at CompuKoeln.DMS.Service.FileServiceFunctions.#=q3OfClrLZ_gS2xuRP20Zl$w==(IDMSSession #=qQA$oK_2gynlKMDeneppARw==, String #=qejtH7xttH4Ci2lQr6Oqw9A==) offset: 0x3B1 method: 0x60007CD (CompuKoeln.DMS.Service)"
2020/12/23;05:39:22.9374;DESKTOP-VQ2G3B7;this;00001858;0000000D;"VERB";fe80::b9f7:7cbf:4fd8:7fa5%13;40 MB;f5ed1256-aaf3-4975-97a8-48f9b5f96513;00CFACE3;0DA04D1B;" at CompuKoeln.DMS.Service.WCFEntry.OcrFile(OcrFileRequest #=q0ZNgZDTrFhhK5Cv4VRWZDQ==) offset: 0x26 method: 0x6000ADE (CompuKoeln.DMS.Service)"
2020/12/23;05:39:22.9397;DESKTOP-VQ2G3B7;this;00001858;0000000D;"VERB";fe80::b9f7:7cbf:4fd8:7fa5%13;40 MB;f5ed1256-aaf3-4975-97a8-48f9b5f96513;00CFACE3;153D1B21;"RETURN [43/100/InvalidFile]: {""Type"":43,""Code"":100,""Message"":"""",""CallId"":13610211}"
2020/12/23;05:39:22.9433;DESKTOP-VQ2G3B7;this;00001858;00000003;"VERB";fe80::b9f7:7cbf:4fd8:7fa5%13;40 MB;f5ed1256-aaf3-4975-97a8-48f9b5f96513;02E1B686;25BCFEA0;"CALL: WCFEntry.GetEntries({""Ids"":[""7ec95fd2-5478-4d50-ae10-9d84163fc0c2""],""SessionID"":""f5ed1256-aaf3-4975-97a8-48f9b5f96513""})"

greif76
Beiträge: 26
Registriert: 12 Aug 2016 12:28

Re: Error: PDF is not OCR compatible

Beitrag von greif76 »

Hallo This,

es scheint, dass der OCR zuerst prüft, ob Dein Dokument schon Text enthält. Daher auch die Meldung "Page 1 is incompatible: Text on page found.".
Nur wenn es eine gescannte Grafik enthält, läuft der OCR los und legt - zusätzlich zur Grafik - auch die Textinformation in der PDF ab.

Normalerweise solltest Du das selber probieren können: Kannst Du in Deinem PDF einzelne Wörter markieren und z.B. in die Zwischenablage kopieren? Dann enthält Dein Dokument schon Text und ein OCR ist nicht mehr nötig. (Heutzutage machen viele Scanner schon direkt beim Scannen OCR).

So war das zumindest bei mir...

Gruß
greif76

This
Beiträge: 2
Registriert: 23 Dez 2020 05:00

Re: Error: PDF is not OCR compatible

Beitrag von This »

Hallo

Die vielen .pdf die ich probiert habe sind verschiedene Sachen. Rechnungen die ich bereits als .pdf gekriegt habe, welche Text beeinhalten. Kann diesen sogar Kopieren und z.b ins Word einfügen. Aber ich hab auch solche ausprobiert mit Grafik und Text immer der gleiche Fehler.

Das ganze läuft bei mir in einer VM Windows 10 (2004) .Net4.8 alle updates drauf.

Danke.

Gruss
This

Antworten