3.3.9. Speicherplatz-Management - die Datenbank-Größe im Griff behalten

Gerade wenn Speicherplatz technisch bedingt oder aus Kostengründen begrenzt ist, stellt sich zwangsläufig irgendwann die Frage, wie man diesem Umstand entgegen wirken kann. Je größer die Datenbasis, desto interessanter werden außerdem Backupstrategien etc.
In dieser Anleitung möchten wir einige Möglichkeiten aufzeigen, um ausuferndem Datenvolumen entgegenzuwirken.

Das von GREYHOUND zu verwaltende Datenvolumen hat architekturbedingt nur einen geringen Einfluss auf die Performance des Gesamt-Systems (entsprechende Hardware vorausgesetzt). GREYHOUND ist es also ziemlich egal, wie viele Elemente man mit ihm verwaltet.

Den größten Anteil am Gesamtdatenvolumen machen übrigens typischerweise nicht die Kommunikationsdaten (E-Mails, Briefe, Faxe etc.), sondern E-Mail-Anhänge (Bilder, Fotos, Dokumente, ...) aus. Typischerweise besteht ein Verhältnis von 20% zu 80 %, d. h. 20% des Gesamtdatenvolumens sind reine Kommunikationsdaten, die restlichen 80% verteilen sich auf die Anhänge. Um beim Eigenbetrieb zu erfahren, wie groß die Datenmenge tatsächlich ist, kann man aber die üblichen Windows-Werkzeuge benutzen, um den verfügbaren Festplattenspeicher im Auge zu behalten. Im einfachsten Fall also im Windows Explorer die Eigenschaften des Laufwerks anzeigen lassen.

Achtung: Vor jedem Löschen von Daten ist es empfehlenswert, immer ein Backup des Systems zu machen.

Nachfolgend sind einige Möglichkeiten beschrieben, wie man mit steigendem Gesamtdatenvolumen in GREYHOUND umgehen kann.

Perma LinkK(l)eine Kompromisse

Es ist sinnvoll, GREYHOUND ohne Ausnahmen als zentrales, volltextdurchsuchbares System zu nutzen, in dem immer alle Daten ich Echtzeit verfügbar sind. Denn: Je aufwendiger eine Suche nach Informationen ist, desto weniger sucht man wirklich überall und umso schlechter ist entsprechend auch die Datenbasis für die Entscheidung.
Die zentrale Frage, die man sich stellen muss: Welche Informationen benötige ich wirklich, welche sind "schön zu haben" und welche werden nach einer bestimmten Zeitspanne unnötig?
Nachfolgend einige beispielhafte Fälle, die nicht zwangsweise einer dauerhaften Archivierung bedürfen, da diese Informationen entweder schon in anderen Drittsystemen (ERP-System, Online-Shop etc.) gespeichert werden oder diese nur eine bestimmte Lebensdauer haben:
  • Automatisiert generierte Statusbenachrichtigungen wie Bestellbestätigungen des Onlineshops, Versandbestätigungen, Zahlungsbestätigungen, eBay Einstellbestätigungen etc.

  • Bild-Anhänge grösser X MB im Kundenservice oder Reklamationsordner, die Reklamationen betreffen

  • Produktfotos vom Hersteller/Lieferanten/aus der eigenen Produktfotoproduktion

  • Angebote, die inkl. Produktbroschüren etc. als E-Mail-Anhänge versendet werden

In den allermeisten Fällen reicht es in den oben genannten Fällen aus, die Nachrichten bzw. die Anhänge der Nachrichten (Bilder, Angebote, Excel Tabellen etc.) nur für einen bestimmten Zeitraum (beispielsweise 3 - 12 Monate je nach Typ) vorzuhalten. Danach können die Statusnachrichten eventuell komplett gelöscht werden und Anhänge grösser X MB könnten automatisiert gelöscht werden, wobei die dazugehörigen E-Mails erhalten bleiben können.
Möchte man bestimmte Nachrichten nach einem definierten Zeitraum löschen, lässt sich das am besten über eine zeitgesteuerte Regel einrichten.

Perma LinkElemente löschen

Das folgende Beispiel selektiert und löscht Elemente, z. B. der Kaufabwicklung, mit bestimmten Eigenschaften 180 Tage nach Nachrichteneingang bzw. der letzten Bearbeitung:
Das folgende Beispiel löscht alle Elemente mit einer definierten Anhangs-Größe nach 180 Tagen:
Die oben aufgeführten Beispiele lassen sich natürlich mit beliebig weiteren Bedingungen ergänzen, z. B. so, dass die Regel nur auf bestimmte Elementtypen, Themen, Gruppen, etc. angewandt werden soll.

Bei der Verwendung des Regelknotens/der Aktion "Element löschen" ist größte Sorgfalt geboten, die unüberlegte Anwendung in einer Regel kann schwerwiegende Auswirkungen haben - Die Elemente werden wirklich unwiderruflich gelöscht!

Diese Regel sollte keinesfalls auf alle Elemente angewendet werden. Es gilt die Devise: Erst filtern, dann Regeln anwenden. Das bedeutet, dass zunächst ein Filter zu erstellen ist, welcher die Anzahl der Elemente, beispielsweise über das Elementalter, vorab eingrenzt. Hier ein Beispiel für so einen Filter. Die feine Abstufung erfolgt dann innerhalb der Regel. Beim zweiten Beispiel sind beispielsweise nur Elemente relevant, welche die Eigenschaft "Anhang" gesetzt haben.

Original-EML-Datei löschen: GREYHOUND speichert jedes Element redundant, einmal in der Datenbank und einmal im Datei-System. Die doppelte Speicherung ist notwendig, um bei etwaigen Fehlern eine Diagnose-Möglichkeit zu schaffen, bzw. Elemente schnell und einfach zu exportieren. Für Elemente, welche fehlerfrei eingegangen sind oder bereits bearbeitet wurden, ist die Original-EML-Datei nicht mehr notwendig, aus diesem Grund kann diese optional gelöscht werden. Wir empfehlen eine entsprechende Regel anzulegen, alle EML-Dateien älter als 14 Tage zu löschen.
Anhänge löschen: Mit diesem Regelknoten besteht die Möglichkeit, Anhänge von Elementen aus dem Dateisystem zu löschen. Wird dieser Knoten angewandt, sind die Anhänge anschließend nicht mehr verfügbar. Das eigentliche Element bleibt aber erhalten. Innerhalb des Knotens lässt sich bestimmten, ab welcher Dateigröße Anhänge gelöscht werden sollen und ob bei Verwendung der Dateiverwaltung in GREYHOUND alle Datei-Revisionen gelöscht werden sollen, optional lässt sich die letzte Revision des Anhangs / der Datei erhalten.
Mit diesen beiden neuen Optionen ist es möglich, die Datenbank-Größe um bis zu 50% oder mehr zu reduzieren und somit ein möglicherweise notwendiges Upgrade des Hosting-Pakets oder einer Speicher-Erweiterung des eigenen Servers hinauszuzögern.
Wer die Möglichkeit nutzen möchte, EML-Dateien zu löschen, findet in der Dateiliste unten die entsprechende Regel. Diese bitte mit Ziel speichern unter als Datei mit der Endung .ghrule abspeichern und in GREYHOUND im Regeleditor über die Importfunktion importieren.
Datei
Dateigröße
Breite
Höhe
2013-04-04_15h10_44.png 139,79 KB 708px 1955px
Wartungsregel_Original-EML_Dateien_aelter_x_Tage_loeschen.ghRule 4,73 KB 0px 0px