Ghostscript 10.0.0 (Debian 12) blockiert OCR — skip_text + pdfa_level inkompatibel #3

Closed
opened 2026-04-09 07:21:25 +02:00 by clawdbot_dh · 2 comments
Member

Problem

Debian 12 liefert Ghostscript 10.0.0 aus. Diese Version hat einen bekannten Bug, der PDFs mit Text-Layer korrumpiert. ocrmypdf verweigert daher die Verarbeitung wenn skip_text=true (Standard-Config) und pdfa_level gesetzt ist.

Fehler:

MissingDependencyError: Ghostscript 10.0.0 through 10.02.0 contain serious regressions...

Auswirkung: Auf einer frischen Debian-12-Installation kann keine einzige PDF verarbeitet werden.

Lösungsoptionen

Option A (empfohlen): Ghostscript auf >=10.02.1 upgraden (backports oder manuell)

Option B: pdfa_level in config.example.toml auf leer setzen als Default

Option C: GS-Versions-Prüfung in install.sh einbauen mit Warnung

Empfehlung

Option B + C: pdfa_level= als sicheren Default + Versions-Warnung in install.sh

Umgebung

  • Debian 12, Ghostscript 10.0.0
  • ocrmypdf 17.4.1
  • Entdeckt bei: Volltest auf LXC 124 (pve-007), 2026-04-09
## Problem Debian 12 liefert Ghostscript 10.0.0 aus. Diese Version hat einen bekannten Bug, der PDFs mit Text-Layer korrumpiert. ocrmypdf verweigert daher die Verarbeitung wenn skip_text=true (Standard-Config) und pdfa_level gesetzt ist. **Fehler:** MissingDependencyError: Ghostscript 10.0.0 through 10.02.0 contain serious regressions... **Auswirkung:** Auf einer frischen Debian-12-Installation kann keine einzige PDF verarbeitet werden. ## Lösungsoptionen **Option A** (empfohlen): Ghostscript auf >=10.02.1 upgraden (backports oder manuell) **Option B**: pdfa_level in config.example.toml auf leer setzen als Default **Option C**: GS-Versions-Prüfung in install.sh einbauen mit Warnung ## Empfehlung Option B + C: pdfa_level= als sicheren Default + Versions-Warnung in install.sh ## Umgebung - Debian 12, Ghostscript 10.0.0 - ocrmypdf 17.4.1 - Entdeckt bei: Volltest auf LXC 124 (pve-007), 2026-04-09
Owner

Behoben in v0.2.2 (Commit 9cdc9ae).

  • config.example.toml: pdfa_level = "" als sicherer Default
  • Runtime-Preflight prüft gs-Version nur wenn pdfa_level gesetzt ist, bricht mit klarer Fehlermeldung ab
  • install.sh warnt bei 10.0.0–10.02.0 mit Upgrade-Hinweis
  • Tests in tests/test_ghostscript_version.py (19 Tests, parametrisiert über alle relevanten Versionen inkl. Debian 11 gs 9.56.1)
Behoben in v0.2.2 (Commit 9cdc9ae). - config.example.toml: `pdfa_level = ""` als sicherer Default - Runtime-Preflight prüft gs-Version nur wenn pdfa_level gesetzt ist, bricht mit klarer Fehlermeldung ab - install.sh warnt bei 10.0.0–10.02.0 mit Upgrade-Hinweis - Tests in `tests/test_ghostscript_version.py` (19 Tests, parametrisiert über alle relevanten Versionen inkl. Debian 11 gs 9.56.1)
Author
Member

Debian 13 Test — v0.2.2

Datum: 2026-04-09
System: LXC 125 (pve-007), Debian 13 (Trixie)

Versionen

  • Ghostscript: 10.05.1 (Bug behoben, >= 10.02.1)
  • Tesseract: 5.5.0
  • Python: 3.13.5

Ergebnis

Test Ergebnis
30/30 Unit Tests
OCR mit pdfa_level="2" + skip_text=true PDF/A-2b
OCR-Output text-durchsuchbar
Exit-Code bei Erfolg 0

Ghostscript-Bug (Issue #3) tritt auf Debian 13 nicht auf — dort ist GS 10.05.1 im Standardrepo enthalten.

Fazit

  • Debian 13: out-of-the-box kompatibel, Standard-Config funktioniert
  • Debian 12: Ghostscript-Workaround nötig (pdfa_level leer oder GS upgraden)
## Debian 13 Test — v0.2.2 ✅ **Datum:** 2026-04-09 **System:** LXC 125 (pve-007), Debian 13 (Trixie) ### Versionen - Ghostscript: **10.05.1** (Bug behoben, >= 10.02.1) - Tesseract: **5.5.0** - Python: **3.13.5** ### Ergebnis | Test | Ergebnis | |---|---| | 30/30 Unit Tests | ✅ | | OCR mit pdfa_level="2" + skip_text=true | ✅ PDF/A-2b | | OCR-Output text-durchsuchbar | ✅ | | Exit-Code bei Erfolg | ✅ 0 | **Ghostscript-Bug (Issue #3) tritt auf Debian 13 nicht auf** — dort ist GS 10.05.1 im Standardrepo enthalten. ### Fazit - Debian 13: out-of-the-box kompatibel, Standard-Config funktioniert - Debian 12: Ghostscript-Workaround nötig (pdfa_level leer oder GS upgraden)
Sign in to join this conversation.
No Label
2 Participants
Notifications
Due Date
No due date set.
Dependencies

No dependencies set.

Reference: sonith_ug/pdf-ocr-hotfolder#3