Stapelklassen-Eigenschaften

AttachmentBarcodePattern

RegEx zum Erkennen von Barcodenummern

AttachmentBarcodeType

Unter AttachmentBarcodeType versteht man die möglichen Barcode-Typen, die verwendet werden können um Anhänge zu erkennen. Z.B. : Typ CODE_128

Siehe Liste ~~der Barcodetypen:~~Barcodetypen.

~~AZTEC~~
~~CODABAR~~
~~CODE_39~~
~~CODE_93~~
~~CODE_128~~
~~COMPOSITE~~
~~DATABAR~~
~~DATA_MATRIX~~
~~DATABAR_EXP~~
~~EAN_2~~
~~EAN_5~~
~~EAN_8~~
~~EAN_13~~
~~ITF~~
~~ISBN_10~~
~~ISBN_13~~
~~MAXICODE~~
~~PDF_417~~
~~QR_CODE~~
~~RSS_14~~
~~RSS_EXPANDED~~
~~UPC_A~~
~~UPC_E~~
~~UPC_EAN_EXTENSION~~

~~Wichtig: Der Wert für den Barcode Typ ist case-sensitiv (Groß-Kleinschreibung beachten!).~~

BarcodeEngine

ZXING	Wird als Standard verwendet. Liefert aktuell die Besten Ergebnisse.
ZBAR	Kann als Alternative benutzt werden, falls ZXING kein Ergebnis liefert.
ALL	Es werden beide Engines nacheinander verwendet (führt zu längerer Laufzeit). Verfügbar ab Version 2.0

~~zxing und zbar~~

BarcodeImageColor

grayscale or black

EasAllowDocumentWithoutAttachment

ExportAfterExtraction

Hier kann festgelegt werden ob Dokumente in die Validierung gelangen oder direkt exportiert werden sollen. Für den direkten Export wird der Wert 1 eingetragen. Soll das nicht passieren tragen Sie den Wert 0 ein.

FilterDuplicateEmailAttachments

Beim Import wird für jedes Vorgangsdokument ein Hashwert erstellt und in folgende Datenbank geschrieben : emailattachmenthashes

Sollte in einer neuen Email das exakt gleiche Dokument erneut importiert werden, wird geprüft ob es diesen Hash bereits gibt. Wenn ja und die Stapelklasseneigenschaft ist gesetzt wird dieses Dokument nicht importiert.

Wert 1 für aktiviert und 0 für Deaktiviert.

FilterDublicateEmails

Beim Import wird für jede EML-Datei ein Hashwert erstellt und in folgende Datenbank geschrieben : emailhashes

Sollte eine neue exakt gleiche Email erneut importiert werden, wird geprüft ob es diesen Hash bereits gibt. Wenn ja und die Stapelklasseneigenschaft ist gesetzt, wird diese Email nicht importiert.

Wert 1 für aktiviert und 0 für Deaktiviert.

IgnoreMandatoryFieldCheckForExport

Wenn der Automatische Export konfiguriert worden ist ( ExportAfterExtraction ) und diese Stapelklasseneigenschaft ist gesetzt, dann wird beim automatischen Export die Pflichtfeldprüfung ignoriert.

Wert 1 für aktiviert und 0 für Deaktiviert.

OCRForce

Es soll in jedem Fall eine OCR durchgeführt werden.

Wert 1 für aktiviert und 0 für Deaktiviert.

OCRLanguage

Englisch und Deutsch miteinander kombinierbar. Müssen im Verzeichnis vorhanden sein. "D:\SQUEEZE\htdocs\lib\Tesseract-OCR-4\tessdata" . Es ist von Vorteil, wenn man sich die Bestdatensätze herunterlädt. https://github.com/tesseract-ocr/tessdata_best

OCRPageLimit

Maximale Anzahl an Seiten die per OCR ausgelesen werden sollen.

PDFA-Conversion

PDFProcessor

PSM-Modes

Im Project bietet es sich an, die Modi 3, 4, 6 und 11 zu verwenden. Dabei gilt 3 als Standard.

3	0Standardeinstellung liefert gute Ergebnisse.
4	Wortweise ~~Orientation~~Segmentierung. ~~and~~Es ~~script~~wird ~~detection~~nicht nach Zeilen geschaut sondern Worten. (~~OSD)~~verfügbar ~~only.~~ab Version 2.0)
6	Gut für Positionsdaten. Hat aber Probleme bei Linien die sehr dicht am Text sind.
11	Gut bei vielen Grafiken auf den Dokumenten.

1 ~~Automatic page segmentation with OSD.~~

2 ~~Automatic page segmentation, but no OSD, or OCR. (not implemented)~~

3 ~~Fully automatic page segmentation, but no OSD. (Default)~~

4 ~~Assume a single column of text of variable sizes.~~

5 ~~Assume a single uniform block of vertically aligned text.~~

6 ~~Assume a single uniform block of text.~~

7 ~~Treat the image as a single text line.~~

8 ~~Treat the image as a single word.~~

9 ~~Treat the image as a single word~~ in ~~a circle.~~

10 ~~Treat the image as a single character.~~

11 ~~Sparse text. Find as much text as possible~~ in ~~no particular order.~~

12 ~~Sparse text with OSD.~~

13 ~~Raw line. Treat the image as a single text line,~~

~~Zur weiteren Erklärung:~~

~~https://pyimagesearch.com/2021/11/15/tesseract-page-segmentation-modes-psms-explained-how-to-improve-your-ocr-accuracy/~~

SoapAllowIncomingDocumentWithoutAttachment

SoapIncomingFileTypeFilter

SpaceMaxWidth

Bis zu welcher Anzahl an Pixeln soll ein Leerzeichen erkannt werden. Ein Beispiel im Standard wären 35 Pixel. Als Wert ist hier die Anzahl an Pixeln einzutragen.

SplitBarcodePattern

RegEx zum Erkennen von Barcodenummern

SplitBarcodeType

Unter SplitBarcodeType versteht man die möglichen Barcode-Typen, die verwendet werden können um ein neues Dokument zu erkennen. Z.B. : Typ CODE_128

Siehe Liste Barcodetypen.

SplitFixPages

Hierbei wird eine fixe Seitentrennung nach der ~~Barcodetypen:~~angegebenen Seite konfiguriert.

Barcodetypen

AZTEC
CODABAR
CODE_39
CODE_93
CODE_128
COMPOSITE
DATABAR
DATA_MATRIX
DATABAR_EXP
EAN_2
EAN_5
EAN_8
EAN_13
ITF
ISBN_10
ISBN_13
MAXICODE
PDF_417
QR_CODE
RSS_14
RSS_EXPANDED
UPC_A
UPC_E
UPC_EAN_EXTENSION

Wichtig: Der Wert für den Barcode Typ ist case-sensitiv (Groß-Kleinschreibung beachten!).

~~SplitFixPages~~

~~Hierbei wird eine fixe Seitentrennung nach der angegebenen Seite konfiguriert.~~