Zum Inhalt

Add-Ons: Stirling PDF-Integration

Stirling PDF (https://stirlingpdf.io/) ist ein leistungsfähiges Open-Source-Werkzeug zur Arbeit mit PDF-Dokumenten. Es kann separat installiert und an j-lawyer.org angebunden werden, um serverseitige PDF-Konvertierungen und OCR-Funktionen zu ermöglichen.

Nutzen der Integration

Die Integration von Stirling PDF bietet folgende Vorteile:

  • Serverseitige PDF-Konvertierung: Office-Dokumente (Word, Excel, LibreOffice etc.) können automatisch in PDF umgewandelt werden

  • Automatisierung über API: Dokumente, die über die j-lawyer.org API erstellt werden, können direkt als PDF konvertiert und in Akten abgelegt werden

  • OCR-Funktionalität: PDF-Dokumente können mit Texterkennung versehen werden (Sprachen: Deutsch, Englisch)

  • Batch-Verarbeitung: Mehrere Dokumente können parallel verarbeitet werden

Installation von Stirling PDF

Stirling PDF wird als Docker-Container betrieben. Die Installation erfolgt auf dem Server, auf dem auch j-lawyer.org läuft, oder auf einem separaten Server im Netzwerk.

Docker-Container starten

Für die vollständige Funktionalität (inklusive zusätzlicher Schriftarten) wird die latest-fat-Variante empfohlen:

docker run -d \
  --name stirling-pdf \
  --restart unless-stopped \
  -p 127.0.0.1:6080:8080 \
  -v "$PWD/StirlingPDF/trainingData:/usr/share/tessdata" \
  -v "$PWD/StirlingPDF/extraConfigs:/configs" \
  -v "$PWD/StirlingPDF/customFiles:/customFiles/" \
  -v "$PWD/StirlingPDF/logs:/logs/" \
  -v "$PWD/StirlingPDF/pipeline:/pipeline/" \
  -e SECURITY_ENABLELOGIN=false \
  -e DISABLE_ADDITIONAL_FEATURES=false \
  docker.stirlingpdf.com/stirlingtools/stirling-pdf:latest-fat

Nur für Betrieb auf demselben Host geeignet

Der obige Befehl ist nur geeignet, wenn j-lawyer.org und Stirling PDF auf demselben Server betrieben werden. Stirling PDF ist mit diesen Parametern ohne Login nutzbar und über die Bindung an 127.0.0.1 nicht von außen erreichbar. Wenn Stirling PDF auf einem separaten Server betrieben oder von außen zugänglich gemacht werden soll, müssen die Parameter (insbesondere Port-Binding und SECURITY_ENABLELOGIN) entsprechend angepasst werden.

Parameter Beschreibung
--name stirling-pdf Name des Docker-Containers
--restart unless-stopped Container wird bei Neustart des Servers automatisch mitgestartet (außer bei manuellem Stop)
-p 127.0.0.1:6080:8080 Port-Mapping: Stirling PDF ist unter Port 6080 erreichbar, nur auf localhost gebunden (nicht von außen zugänglich)
-v .../trainingData:/usr/share/tessdata Verzeichnis für OCR-Sprachdaten (Tessdata)
-v .../extraConfigs:/configs Verzeichnis für Konfigurationsdateien
-v .../customFiles:/customFiles/ Verzeichnis für benutzerdefinierte Dateien
-v .../logs:/logs/ Verzeichnis für Log-Dateien
-v .../pipeline:/pipeline/ Verzeichnis für Pipeline-Konfigurationen
-e SECURITY_ENABLELOGIN=false Deaktiviert die Login-Seite von Stirling PDF
-e DISABLE_ADDITIONAL_FEATURES=false Zusätzliche Funktionen (z.B. OCR) bleiben aktiviert
latest-fat Image-Variante mit zusätzlichen Schriftarten und Funktionen

Systemanpassungen für Linux

Auf Linux-Systemen müssen ggf. die inotify-Limits angepasst werden. Fügen Sie folgende Zeilen in /etc/sysctl.conf hinzu:

fs.inotify.max_user_instances=8192
fs.inotify.max_user_watches=524288

Anschließend die Einstellungen aktivieren:

sudo sysctl -p

Erreichbarkeit prüfen

Nach dem Start ist Stirling PDF über einen Webbrowser erreichbar, z.B. unter http://localhost:6080/. Die Weboberfläche kann auch für manuelle PDF-Operationen genutzt werden.

Konfiguration in j-lawyer.org

Die Anbindung erfolgt über das Menü „Einstellungen" - „Dokumentoptionen" - „Stirling PDF".

Im Konfigurationsdialog wird der API-Endpunkt hinterlegt:

Einstellung Beschreibung Beispiel
API-Endpunkt URL der Stirling PDF-Installation http://localhost:6080/

Nach dem Speichern ist die Integration aktiv.

Unterstützte Funktionen

Konvertierung zu PDF

Folgende Dateiformate können zu PDF konvertiert werden:

  • Microsoft Word (.doc, .docx)

  • Microsoft Excel (.xls, .xlsx)

  • Microsoft PowerPoint (.ppt, .pptx)

  • LibreOffice/OpenOffice-Dokumente (.odt, .ods, .odp)

  • Bilder (.jpg, .png, .gif, .bmp, .tiff)

  • Textdateien (.txt, .rtf)

Die Konvertierung erfolgt über den API-Endpunkt /api/v1/convert/file/pdf.

OCR (Texterkennung)

PDF-Dokumente können mit Texterkennung versehen werden. Dabei werden folgende Sprachen unterstützt:

  • Deutsch (deu)

  • Englisch (eng)

Der OCR-Modus „skip-text" überspringt bereits vorhandenen Text und führt OCR nur auf Bildbereichen durch.

Nutzung über die j-lawyer.org API

Über die j-lawyer.org REST-API können Dokumente programmatisch konvertiert werden:

POST /v6/cases/document/{id}/to-pdf

Dies ermöglicht die automatische Konvertierung von Dokumenten in Workflows und Automatisierungen.

Fehlerbehebung

Verbindung nicht möglich

  • Prüfen Sie, ob der Stirling PDF-Container läuft: docker ps

  • Prüfen Sie die Erreichbarkeit im Browser

  • Stellen Sie sicher, dass der Port nicht durch eine Firewall blockiert wird

Konvertierung schlägt fehl

  • Prüfen Sie die Stirling PDF-Logs: docker logs stirling-pdf

  • Bei Speicherproblemen ggf. dem Container mehr RAM zuweisen

OCR-Qualität verbessern

  • Stellen Sie sicher, dass die Sprachdaten (tessdata) korrekt eingebunden sind

  • Verwenden Sie die latest-fat-Variante für bessere Schriftunterstützung