Skip to main content

Erkennung/Extraktion

Für die Erkennung/Extraktion von Dokumenten, ist erforderlich, dass eine Dokumentenklasse für jedes Dokument bestimmt wurde. Das kann über Importparameter erfolgen oder über die Klassifikation von SQUEEZE. Die Bestimmung der Dokumentenklasse ist daher so wichtig, da die Dokumentenklasse den Feldkatalog bestimmt. Der Feldkatalog wiederum legt fest, welche Werte auf dem Dokument mit welchem Verfahren (Lokatoren) gesucht werden sollen. Die ermittelten Werte werden entsprechend der Felddefinition formatiert. Über den Feldkatalog wird außerdem bestimmt welche Felder Pflichtfelder sind oder ob der Wert eines Feldes durch einen Anwender bestätigt werden muss.

Da sich die Klassifikation des Systems auch mal irren kann, ist es natürlich während der Validierung der Dokumente möglich, die Dokumentenklasse anzupassen. Ein Änderung der Dokumentenklasse führt zu erneuten Erkennung des Dokuments mit dem Feldkatalog der neuen Dokumentenklasse.