Belegverwaltung Teil 1: Datum aus eingescannten Briefen und Faxen erkennen

  • Hallo zusammen,


    heute habe ich etwas für euch von dem ich hoffe das es einige spannend und hilfreich finden.


    Vorwort


    Wer im Greyhound seine gesamte Briefkorrespondenz und zudem eingehende Faxe verwaltet der wünscht sich mitunter zu wissen, wie der Brief oder das Fax datiert ist. Gerade bei Rechnungen und Lieferscheinen ist es von besonderer Wichtigkeit nicht nur das Erstelldatum zu kennen (also das Datum an dem der Beleg erhalten und im Greyhound eingescannt wurde), sondern auch das tatsächliche Rechnungs- oder Lieferscheindatum.


    Umsetzung


    Seit der aktuellen Stable-Version (4.0.8 b1404) gibt es eine neue, mächtige Funktion, die es erlaubt beliebige Texte aus Elementen mit Regulären Ausdrücken zu extrahieren und weiter zu verarbeiten: "FbmRegExExtract".


    Ich habe euch in der Filebase eine Quelltextregel hochgeladen, welche ihr über die Importfunktion in euren Greyhound importieren und mit dem Trigger "Nachrichteneingang" aktivieren könnt.



    Diese Regel erledigt im Wesentlichen zwei Dinge:

    • Sie sucht und extrahiert mit Hilfe einer entsprechenden RegEx (Regular Expression) Daten innerhalb eines Briefes oder eines Faxes
    • Sie wandelt das gefundene Datum so um das es im richtigen Format vorliegt um es als Startdatum (Datum von) im Greyhound zu hinterlegen.

    Die RegEx macht sich dabei zu nutze, dass das Belegdatum in nahezu allen Fällen das erste Datum ist, welches man auf einem Brief findet. Dieses Datum wird von der RegEx in etwa 95% unserer Briefkorrespondenz korrekt erkannt. Dabei berücksichtigt sie sowohl unterschiedliche Schreibweisen des Datums und zeigt auch eine gewisse Toleranz gegenüber typischen Fehlern der Texterkennung (OCR). Optimiert ist die RegEx auf deutsche Schreibweisen.


    Hier zwei Beispiele:



    Und hier eine Liste von Schreibweisen welche erkannt werden:

    • 15. Jan. 1974
    • 15. Jan 74
    • 1.7.74
    • 7.7.74
    • 02_06.11
    • 31_05-11
    • 16-06-11
    • 22. Juni 2011
    • 19. 11. 2010
    • 17. 05., 2011
    • 16,.05.2011
    • 08/04/2011
    • /09.02.2011
    • 26.Feb 2011
    • :02.12.2010

    Nutzen


    Bisher ist das Start- und Enddatum von gescannten Briefen nur wenig hilfreich, wenn nicht im Gegensatz zu E-Mail- oder Aufgaben-Elementen sogar komplett nutzlos. Schließlich sind beide Daten identisch mit dem Scandatum.


    Mit dem Belegdatum hingegen kann man jedoch nun tagesgenau Zahlungsziele oder Fristen einhalten. Bei Lieferscheinen ist eine Nachvollziehbarkeit über die Lieferzeit gegeben. Servicelevel bei Briefpost kann die Postlaufzeiten mit einbeziehen und und und... Ob man daran anknüpfend die Erinnerungs- oder Eskalationsfunktionen des Greyhound andockt oder anderweitig Nutzen daraus zieht ist jedem selbst überlassen.


    Wie man das gleiche Prinzip noch intensiver ausweiten kann und welche Möglichkeiten sich durch Kombination dieser Funktion mit andern ergeben will ich in einem kommenden Beitrag mitteilen. :)


    Lieben Gruß

  • Hey Wolfram, heyho Torsten,


    danke für die Rückmeldungen. Schön das die Regel funktioniert.


    Ich habe noch ein Update in der Filebase hinterlegt. Die sollte noch etwas besser funktionieren weil das Datum nun auch noch inhaltlich auf Gültigkeit geprüft wird. (näheres steht in der Beschreibung)


    Lieben Gruß