Hallo zusammen,
damit man möglichst wenig Arbeit und gleichzeitig den maximalen Nutzen mit gescannter Eingangskorrespondenz hat, sollte diese möglichst automatisch klassifiziert werden. Im Idealfall kann man dann den Absender sofort nach dem Eintreffen in der Listenansicht erkennen, so wie bei einer E-Mail. Darauf aufbauend kann man dann die Dokumente mit weiteren Regeln automatisch bestimmten Benutzern zuweisen, den Betreff in etwas aussagekräftiges abändern usw.
Bei Firmenkorrespondenz gibt es i.d.R. zwei Merkmale, die einen eindeutigen Bezug zu einem Kontakt ermöglichen: Die USt-IdNr. und die Registernummer. Beides ist eindeutig und ermöglicht aufgrund der festgelegten Schreibweise eine relativ leichte, automatische Erkennung. Wenn man also dem GH beibringt, diese beiden Merkmale möglichst fehlerfrei zu erkennen, so ist eine automatische Klassifizierung für einen Großteil von Firmenkorrespondenz möglich, die diese beide Merkmale als Pflichtangabe auf Ihrem Geschäftspapier haben.
Damit die automatische Klassifizierung auch klappt, sind 4 Voraussetzungen zu erfüllen:
- Das gescannte Dokument muss per OCR möglichst fehlerfrei in durchsuchbaren Text umgewandelt werden
- Es müssen entsprechende Benutzerdefinierte Felder angelegt werden in denen man Reguläre Ausdrücke hinterlegt, die den jeweiligen Eintrag finden und extrahieren können
- In den Kontakten müssen die jeweiligen Daten hinterlegt sein
- Der GH muss per Regel angewiesen werden eingehende Dokumente automatisch zu klassifizieren.
Schritt 1: Jedem der seine Briefpost im GH ablegen will sei dringend die einmalige Investition von etwa 90 EUR in die TOCR nahe gelegt. Die Ergebnisse sind um ein vielfaches besser als die Standard GH-OCR. Das schafft eine optimale Grundvoraussetzung für das Funktionieren der Erkennung. Details dazu kann man in diesem Beitrag nachlesen: Dokumentenmanagement - Wie geht das?
Schritt 2: In GH lassen sich Benutzerdefinierte Felder anlegen. Damit kann man dem GH auch Datenfelder beibringen, die er von Haus aus nicht kennt. Der folgende Screenshot zeigt, wie man mit "Einstellungen -> Benutzerdefinierte Felder -> neues Feld erstellen" einfach ein neues Feld "USt-IdNr." anlegt:
Nachdem man den Namen, die Beschreibung und die Verfügbarkeit wie oben angegeben ausgewählt hat, wechselt man zum Reiter "Automatische Klassifizierung/Zuordnung" und trägt dort bei "Regulärer Ausdruck" folgenden Ausdruck ein: " (DE)\s*([0-9]+)\s*([0-9]*)\s*([0-9]*)\s*([0-9]*) ". Bei Ergebnisformatierung hinterlegt man "$1$2$3$4$5". (Beides ohne Anführungszeichen.)
Ohne auf technische Details einzugehen sei gesagt: Der "Reguläre Ausdruck" findet die USt-IdNr. (auch wenn diese Leerzeichen enthält), und die "Ergebnisformatierung" setzt eine möglicherweise durch Leerzeichen getrennte Schreibweise zu einem lückenlosen Eintrag zusammen.
Bei der Registernummer geht man genauso vor. Dort hinterlegt man "(HRA|HRB)\s*([0-9]+)\s*([0-9]*)\s*([0-9]*)\s*([0-9]*)" und "$1$2$3$4$5".
Schritt 3: Nun hinterlegt man einfach noch die USt-IDNr. und die Registernummer in seinen Kontakten. Dabei sollte man unbedingt auf eine einheitliche Schreibweise achten! Die o.g. Regulären Ausdrücke liefern ein Ergebnis ohne Leerzeichen. Damit der entsprechende Kontakt gefunden wird, sollte man die Daten auch ohne Leerzeichen hinterlegen. Folgender Screenshot zeigt als Beispiel die nötigen Daten um ein Schreiben von E-Plus zuverlässig zu erkennen:
Schritt 4: Zuletzt legt man eine Regel wie folgt an:
Die Regel sorgt dafür, dass bei Briefen und Faxen der Absender automatisch anhand des klassifizierten Kontaktes geändert wird, Bei E-Mails jedoch nicht.
Lieben Gruß