Tesseract nicht installiert: MissingDependencyError schlägt erst bei erster Datei fehl, nicht beim Start #1
Reference in New Issue
Block a user
Delete Branch "%!s()"
Deleting a branch is permanent. Although the deleted branch may continue to exist for a short time before it actually gets removed, it CANNOT be undone in most cases. Continue?
Problem
Wenn
tesseractnicht auf dem System installiert ist, startet der Service trotzdem erfolgreich (systemctl start= OK). Der Fehler tritt erst auf wenn die erste PDF-Datei verarbeitet wird.Beobachtetes Verhalten:
error/-VerzeichnisMissingDependencyError: Could not find program 'tesseract' on the PATH--once-Modus:0(kein Fehler signalisiert!)Auswirkung
Ein Admin könnte den Service für funktionsfähig halten, obwohl keine einzige PDF verarbeitet werden kann. Bei systemd-Monitoring (z.B. per
systemctl is-active) sieht alles grün aus.Reproduktion
Erwartetes Verhalten
Der Service sollte beim Start prüfen ob
tesseractverfügbar ist. Falls nicht:--once-Modus: Exit != 0 wenn Dateien fehlschlagenMögliche Lösung
Alternativ: Prüfung in
HotfolderService.__init__()oderrun().Umgebung
Testbericht — PDF OCR Hotfolder v0.2.0
Datum: 2026-04-08
Tester: clawdbot
Version: 0.2.0
Testsystem: AMD Ryzen 5 3400GE, Debian 12, Python 3.11
Tesseract: nicht installiert (Testfokus auf Code-Logik + CLI-Verhalten)
Testszenario
Ziel: Funktionstest ohne vollständige Installation — Code-Import, Config-Loading, CLI-Verhalten, Fehlerhandling.
Vorbereitung
Config
/tmp/ocr-test-config.toml:Test-PDF erstellt mit fpdf2:
Testergebnisse
✅ TC-01: Config-Loading
Ergebnis: ✅ Erfolgreich
Alle Felder korrekt geladen. Config-Dataclass funktioniert wie erwartet.
✅ TC-02: CLI —
--versionAusgabe:
pdf-ocr-hotfolder 0.1.0Ergebnis: ✅ OK — gibt korrekte Version aus
✅ TC-03: CLI —
--helpErgebnis: ✅ Korrekte Usage-Ausgabe mit allen Optionen.
✅ TC-04: Fehlende Config
Ergebnis: ✅ Korrekte Fehlermeldung + Exit-Code 2.
✅ TC-05:
--oncemit leeremincoming/Ergebnis: ✅ Startet, findet keine PDFs, beendet sauber.
🔴 TC-06:
--oncemit PDF, Tesseract fehltBeobachtetes Verhalten:
test-rechnung.pdfwird korrekt nachworking/verschobenMissingDependencyError: Could not find program 'tesseract'error/verschoben ✅Dateizustand nach Lauf:
Issues erstellt:
--onceExit-Code 0 bei FehlernGesamtbewertung
Positiv:
error/, Service läuft weiterOffen (vor Produktion):
--onceExit-Code bei Fehlern (Issue #2)__version__auf 0.2.0 setzenNächste Testschritte (mit Tesseract)
Behoben in v0.2.1 (Commit
6f7cadf). Test-Szenarien sind intests/test_preflight.pyundtests/test_once_exit_code.pyabgebildet (11 Tests, alle grün).