Hallo zusammen
Ich bin neu hier und bin da auf ein Problem gestossen das ich mit einigen Rechnungen und anderen Dokumenten habe.
Wenn ich bereits vorhandene .pdf Dokumente einlesen möchte (OCR) dann tritt immer der Fehler auf.
Error: PDF is not OCR compatible
Meine Frage ist nun wie muss ein .pdf aussehen damit ich diesen Fehler nicht kriege?
Danke für Euren Support.
Gruss
This
Auszug aus dem Log;
Date;Time;Host;User;ProcessId;ThreadId;Type;IP;Memory;SessionId;CallId;MessageId;Message
2020/12/23;05:39:22.5022;DESKTOP-VQ2G3B7;this;00001858;0000000D;"VERB";fe80::b9f7:7cbf:4fd8:7fa5%13;43 MB;f5ed1256-aaf3-4975-97a8-48f9b5f96513;00CFACE3;0EE78619;"CALL: WCFEntry.OcrFile(""7ec95fd2-5478-4d50-ae10-9d84163fc0c2"")"
2020/12/23;05:39:22.5747;DESKTOP-VQ2G3B7;this;00001858;0000000D;"VERB";fe80::b9f7:7cbf:4fd8:7fa5%13;43 MB;f5ed1256-aaf3-4975-97a8-48f9b5f96513;00CFACE3;2E6F688B;"Start of: C:\Program Files\CompuDMS Server\7.2.7.2\PdfOcr\PdfOcr.exe check ""C:\CompuDMS\Temp\\this\7ec95fd2-5478-4d50-ae10-9d84163fc0c2.ocrchk"" /size_tolerance 0.1"
2020/12/23;05:39:22.7270;DESKTOP-VQ2G3B7;this;00001858;00000027;"VERB";;44 MB;f5ed1256-aaf3-4975-97a8-48f9b5f96513;00000000;1CEC1488;"[PROCOUT]: "
2020/12/23;05:39:22.7270;DESKTOP-VQ2G3B7;this;00001858;00000027;"VERB";;44 MB;f5ed1256-aaf3-4975-97a8-48f9b5f96513;00000000;064ECA2E;"[PROCOUT]: PdfOcr"
2020/12/23;05:39:22.7270;DESKTOP-VQ2G3B7;this;00001858;00000027;"VERB";;44 MB;f5ed1256-aaf3-4975-97a8-48f9b5f96513;00000000;076136F8;"[PROCOUT]: c CompuK”ln Dokument Management GmbH 2020"
2020/12/23;05:39:22.7270;DESKTOP-VQ2G3B7;this;00001858;00000027;"VERB";;44 MB;f5ed1256-aaf3-4975-97a8-48f9b5f96513;00000000;2FD22902;"[PROCOUT]: Version : 7.2.7.2"
2020/12/23;05:39:22.7270;DESKTOP-VQ2G3B7;this;00001858;00000027;"VERB";;44 MB;f5ed1256-aaf3-4975-97a8-48f9b5f96513;00000000;267C0053;"[PROCOUT]: "
2020/12/23;05:39:22.9258;DESKTOP-VQ2G3B7;this;00001858;00000027;"VERB";;44 MB;f5ed1256-aaf3-4975-97a8-48f9b5f96513;00000000;200B0641;"[PROCOUT]: Page 1 is incompatible: Text on page found."
2020/12/23;05:39:22.9271;DESKTOP-VQ2G3B7;this;00001858;00000027;"VERB";;40 MB;f5ed1256-aaf3-4975-97a8-48f9b5f96513;00000000;2DDCEAC9;"[PROCOUT]: Incompatible pages: 1"
2020/12/23;05:39:22.9271;DESKTOP-VQ2G3B7;this;00001858;00000027;"VERB";;40 MB;f5ed1256-aaf3-4975-97a8-48f9b5f96513;00000000;0092BD6D;"[PROCOUT]: Compatible pages: 0"
2020/12/23;05:39:22.9271;DESKTOP-VQ2G3B7;this;00001858;00000027;"VERB";;40 MB;f5ed1256-aaf3-4975-97a8-48f9b5f96513;00000000;053C7EEA;"[PROCOUT]: Error: PDF is not OCR compatible."
2020/12/23;05:39:22.9358;DESKTOP-VQ2G3B7;this;00001858;0000000D;"ERR ";fe80::b9f7:7cbf:4fd8:7fa5%13;40 MB;f5ed1256-aaf3-4975-97a8-48f9b5f96513;00CFACE3;06A188EC;"CompuKoeln.DMS.Common.Types.RequestException in CompuKoeln.DMS.Service.Helper.#=q6ElYyIY46$AbW88nMcLVgw==<T>(Exception #=qWE3e3EfVuDGrw989Qr4n$A==): InvalidFile/100"
2020/12/23;05:39:22.9374;DESKTOP-VQ2G3B7;this;00001858;0000000D;"VERB";fe80::b9f7:7cbf:4fd8:7fa5%13;40 MB;f5ed1256-aaf3-4975-97a8-48f9b5f96513;00CFACE3;0DA04D1B;"CompuKoeln.DMS.Common.Types.RequestException HResult(0x80131500): InvalidFile/100"
2020/12/23;05:39:22.9374;DESKTOP-VQ2G3B7;this;00001858;0000000D;"VERB";fe80::b9f7:7cbf:4fd8:7fa5%13;40 MB;f5ed1256-aaf3-4975-97a8-48f9b5f96513;00CFACE3;0DA04D1B;" at CompuKoeln.DMS.Service.FileServiceFunctions.#=q3OfClrLZ_gS2xuRP20Zl$w==(IDMSSession #=qQA$oK_2gynlKMDeneppARw==, String #=qejtH7xttH4Ci2lQr6Oqw9A==) offset: 0x3B1 method: 0x60007CD (CompuKoeln.DMS.Service)"
2020/12/23;05:39:22.9374;DESKTOP-VQ2G3B7;this;00001858;0000000D;"VERB";fe80::b9f7:7cbf:4fd8:7fa5%13;40 MB;f5ed1256-aaf3-4975-97a8-48f9b5f96513;00CFACE3;0DA04D1B;" at CompuKoeln.DMS.Service.WCFEntry.OcrFile(OcrFileRequest #=q0ZNgZDTrFhhK5Cv4VRWZDQ==) offset: 0x26 method: 0x6000ADE (CompuKoeln.DMS.Service)"
2020/12/23;05:39:22.9397;DESKTOP-VQ2G3B7;this;00001858;0000000D;"VERB";fe80::b9f7:7cbf:4fd8:7fa5%13;40 MB;f5ed1256-aaf3-4975-97a8-48f9b5f96513;00CFACE3;153D1B21;"RETURN [43/100/InvalidFile]: {""Type"":43,""Code"":100,""Message"":"""",""CallId"":13610211}"
2020/12/23;05:39:22.9433;DESKTOP-VQ2G3B7;this;00001858;00000003;"VERB";fe80::b9f7:7cbf:4fd8:7fa5%13;40 MB;f5ed1256-aaf3-4975-97a8-48f9b5f96513;02E1B686;25BCFEA0;"CALL: WCFEntry.GetEntries({""Ids"":[""7ec95fd2-5478-4d50-ae10-9d84163fc0c2""],""SessionID"":""f5ed1256-aaf3-4975-97a8-48f9b5f96513""})"
Error: PDF is not OCR compatible
Re: Error: PDF is not OCR compatible
Hallo This,
es scheint, dass der OCR zuerst prüft, ob Dein Dokument schon Text enthält. Daher auch die Meldung "Page 1 is incompatible: Text on page found.".
Nur wenn es eine gescannte Grafik enthält, läuft der OCR los und legt - zusätzlich zur Grafik - auch die Textinformation in der PDF ab.
Normalerweise solltest Du das selber probieren können: Kannst Du in Deinem PDF einzelne Wörter markieren und z.B. in die Zwischenablage kopieren? Dann enthält Dein Dokument schon Text und ein OCR ist nicht mehr nötig. (Heutzutage machen viele Scanner schon direkt beim Scannen OCR).
So war das zumindest bei mir...
Gruß
greif76
es scheint, dass der OCR zuerst prüft, ob Dein Dokument schon Text enthält. Daher auch die Meldung "Page 1 is incompatible: Text on page found.".
Nur wenn es eine gescannte Grafik enthält, läuft der OCR los und legt - zusätzlich zur Grafik - auch die Textinformation in der PDF ab.
Normalerweise solltest Du das selber probieren können: Kannst Du in Deinem PDF einzelne Wörter markieren und z.B. in die Zwischenablage kopieren? Dann enthält Dein Dokument schon Text und ein OCR ist nicht mehr nötig. (Heutzutage machen viele Scanner schon direkt beim Scannen OCR).
So war das zumindest bei mir...
Gruß
greif76
Re: Error: PDF is not OCR compatible
Hallo
Die vielen .pdf die ich probiert habe sind verschiedene Sachen. Rechnungen die ich bereits als .pdf gekriegt habe, welche Text beeinhalten. Kann diesen sogar Kopieren und z.b ins Word einfügen. Aber ich hab auch solche ausprobiert mit Grafik und Text immer der gleiche Fehler.
Das ganze läuft bei mir in einer VM Windows 10 (2004) .Net4.8 alle updates drauf.
Danke.
Gruss
This
Die vielen .pdf die ich probiert habe sind verschiedene Sachen. Rechnungen die ich bereits als .pdf gekriegt habe, welche Text beeinhalten. Kann diesen sogar Kopieren und z.b ins Word einfügen. Aber ich hab auch solche ausprobiert mit Grafik und Text immer der gleiche Fehler.
Das ganze läuft bei mir in einer VM Windows 10 (2004) .Net4.8 alle updates drauf.
Danke.
Gruss
This