Allgemein
Über
SQUEEZE Squeeze
Squeeze ist eine Input-Management-Lösungwird mit dem Ziel die dokumentenbasierten Prozesse eines Unternehmens zu bündeln/kanalisieren, um sie dann zu klassifizieren und die benötigten Daten zu extrahieren.
Eingangskanäle
Eingangskanäle für Dokumente sind in Unternehmen klassischerweise der Postweg sowie Emailübertragung, die in einem odervorkonfigurierten mehrerenInvoice PostfächernTemplate eingehen.ausgeliefert. DieDas DokumenteInvoice werdenTemplate erst typisiert und vereinheitlicht, umwurde in den folgendenvergangenen ProzessenProjekten gleichartigimmer behandeltweiterentwickelt werdenund verfeinert. Mittlerweile ist der Standard soweit ausgearbeitet, dass nach der Installation des SQUEEZE Systems nur noch die Stammdaten des Invoice Templates zu können.
Bildaufbereitung
sind. AlleSobald eingehendendie DokumenteStammdaten werdenim inInvoice einTemplate einheitlicheshinterlegt Formatsind, konvertiert, Dabei spieltsteht der Eingangskanal keine Rolle. Ob es sich um ein gescanntes Dokument oder um ein "gedrucktes" PDF handelt, wird erst in einemVerarbeitung der folgendenersten SchritteBelege geprüftnichts undentgegen. entsprechendInstallationen genutzt.
Texterkennung
einer Beiweniger derStunden Texterkennungsollten wird unterschieden, ob es sich um ein gescanntes Dokument oder um ein digital erstelltes Dokument handelt. Nur bei gescannten Dokumenten wird eine Texterkennung im klassischen Sinne durchgeführt. Die OCR (Optical Character Recognition) versucht aus jedem gescannten Zeichen einen entsprechenden Buchstaben zu ermitteln.
Bei digital erstellten PDFs (nicht gescannten PDFs) wird der enthaltene gedruckte Text verwendet. Dieses Verfahren hat natürlich den Vorteil, dass esdaher nicht zudie "Lesefehlern"Ausnahme in der OCR kommen kann. Die Verarbeitung von solchen "nativen" PDFs ist also in jedem Fall zu bevorzugen. sein.
Klassifikation