9cdc9ae443
- config.example.toml: pdfa_level="" als sicherer Default - check_preflight(pdfa_level) erkennt betroffene GS-Versionen und bricht ab - install.sh warnt bei betroffenen GS-Versionen - 19 neue Tests (parametrisiert über Versions-Matrix) Closes #3 Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
85 lines
2.4 KiB
TOML
85 lines
2.4 KiB
TOML
# PDF OCR Hotfolder — Konfiguration
|
|
# Speichern als /etc/pdf-ocr-hotfolder/config.toml
|
|
|
|
[paths]
|
|
# Eingangsverzeichnis: hier landen gescannte PDFs
|
|
incoming = "/var/lib/pdf-ocr-hotfolder/incoming"
|
|
# Ausgangsverzeichnis: fertige durchsuchbare PDFs
|
|
outgoing = "/var/lib/pdf-ocr-hotfolder/outgoing"
|
|
# Arbeitsverzeichnis (während Verarbeitung)
|
|
working = "/var/lib/pdf-ocr-hotfolder/working"
|
|
# Fehlerverzeichnis: PDFs, die nicht verarbeitet werden konnten
|
|
error = "/var/lib/pdf-ocr-hotfolder/error"
|
|
|
|
[ocr]
|
|
# Tesseract-Sprachen (z.B. "deu", "deu+eng")
|
|
languages = "deu+eng"
|
|
# Anzahl Threads pro PDF (ocrmypdf --jobs)
|
|
jobs = 4
|
|
# Bereits OCR-haltige Seiten überspringen statt neu zu OCRen
|
|
skip_text = true
|
|
# Auflösung für gerasterte Seiten
|
|
oversample = 300
|
|
# PDF/A-Konformitätsstufe ("1", "2", "3" oder leer für keinen PDF/A-Output)
|
|
# ACHTUNG: Ghostscript 10.0.0 bis 10.02.0 (Debian 12 default!) haben einen Bug,
|
|
# der mit pdfa_level + skip_text=true ocrmypdf komplett blockiert.
|
|
# Sicherer Default ist "" — nur auf "1"/"2"/"3" setzen, wenn gs >= 10.02.1 installiert ist.
|
|
pdfa_level = ""
|
|
# Schiefe Scans automatisch begradigen
|
|
deskew = true
|
|
# Hintergrund säubern
|
|
clean = false
|
|
# Maximale parallele PDFs (Hauptsystem hat selten mehr als 1-2 gleichzeitig)
|
|
max_workers = 2
|
|
# Timeout pro PDF in Sekunden
|
|
timeout = 1800
|
|
|
|
[verapdf]
|
|
# PDF/A-Validierung (optional)
|
|
enabled = false
|
|
binary = "/opt/verapdf/verapdf"
|
|
flavour = "1b"
|
|
|
|
# Upload-Ziele — beliebig viele aktivierbar.
|
|
# Wenn alle deaktiviert sind, bleibt das fertige PDF einfach im outgoing-Ordner.
|
|
|
|
[upload.folder]
|
|
enabled = true
|
|
# Wenn leer, wird [paths].outgoing verwendet
|
|
target = ""
|
|
|
|
[upload.nextcloud]
|
|
enabled = false
|
|
url = "https://cloud.example.com"
|
|
username = "scanuser"
|
|
password = "app-password"
|
|
# Zielpfad relativ zum User-Root, z.B. "Scans/Inbox"
|
|
remote_path = "Scans/Inbox"
|
|
verify_ssl = true
|
|
|
|
[upload.sftp]
|
|
enabled = false
|
|
host = "sftp.example.com"
|
|
port = 22
|
|
username = "scanuser"
|
|
# Entweder Key-Datei oder Passwort
|
|
key_file = "/etc/pdf-ocr-hotfolder/sftp_key"
|
|
password = ""
|
|
remote_path = "/uploads"
|
|
|
|
[notify.email]
|
|
enabled = false
|
|
smtp_host = "smtp.example.com"
|
|
smtp_port = 587
|
|
smtp_user = "alerts@example.com"
|
|
smtp_password = "secret"
|
|
use_starttls = true
|
|
from_addr = "PDF OCR Hotfolder <alerts@example.com>"
|
|
to_addrs = ["admin@example.com"]
|
|
# Wann benachrichtigen: "always" | "errors" | "never"
|
|
on = "errors"
|
|
|
|
[logging]
|
|
# DEBUG | INFO | WARNING | ERROR
|
|
level = "INFO"
|