Umstellung Domino-Server-Struktur

    • Offizieller Beitrag

    wegen personellen Einschränkungen (40% weniger) wollen/müssen wir unsere Dominoinfrastruktur verschlanken.
    Zur Zeit sieht unsere Mail-Domino-Struktur wie folgt aus:


    aktuelle Mail-Server-Struktur (V0)
    - 3 Standorte
    - pro Standort 3 Dominos im Cluster
    - 2 Dominos nur Zugriff per Notes
    - 1 Domino für DWA (Zugriff über Revers-Proxy)
    - größtes Cluster: ca. 5.000 User, ca. 2.000 aktive User, Summe Mail-DBs 1,5 TB
    - Summe 9 Dominos



    Wegen Wartung, Release wechsel usw. wollen wir die Anzahl der Dominos verringern und dies bei gleichbleibender Ausfallsicherheit und Performance. Dazu gibt es 2 Ansätze, die wir verfolgen.


    Mail-Server-Struktur (V1)
    - 3 Standorte
    - pro Standort 2 Dominos im Cluster
    - 2 Dominos für DWA und Notes (Zugriff über Reverse-Proxy inkl. Load Balancer)
    - größtes Cluster: ca. 5.000 User, ca. 2.000 aktive User, Summe Mail-DBs 1,5 TB
    - Summe 6 Dominos


    Mail-Server-Struktur (V2)
    - 3 Standorte
    - pro Standort 1 Domino
    - 2 zusätzliche Dominos für DWA (Zugriff über Reverse-Proxy inkl. Load Balancer)
    - alle 5 Dominos in einem Cluser
    - Daten: ca. 11.000 User, ca. 4.000 aktive User, Summe Mail-DBs 3,5 TB
    - Summe 5 Dominos


    BS im neuen System wird Win 2012 R2 64 und der Domino wird 9.0.1 FP2 64 sein.
    Es wird Hardware verwendet und keine virtuellen Maschinen.
    Hardware: 2 Sockel mit jeweils 4 Kernen, 2,5 GHz 32GB Speicher



    Folgendes haben wir schon in unsere Überlegungen einbezogen:
    - V2 alle Daten 5 fach vorhanden sind => größere Ausfallsicherheit
    - V1 schnell umgesetzt, da nur Logik geändert werden muss (keine Datenumzüge).


    Offene Fragen.
    - V2 reicht für ca. 2.000 aktive DWA-User die Performance (Antwortzeiten)?
    - V2 kommen bei der Datenmenge die Servertasks (updall, compact, design usw.) zeitlich durch? Eventuell würden wir die Tasks auch in mehreren Instanzen parallel laufen lassen.
    - Wie verhält sich ein Cluster mit 5 Dominos? Wie viel Performance zieht der Clusterreplikator?


    Hat schon jemand Erfahrung und welche mit ähnlicher Ausstattung (Hardware, User, Konstellation)?
    Welche der beiden Konstellationen würdet ihr bevorzugen und warum?
    Gibt es andere Argumente, die wir in unsere Betrachtungen einbeziehen sollten?


    Vielen Dank und viele Grüße
    Dirk



    Auch im atnotes nachgefragt.

    Rein logisches Denken verschafft uns keine Erkenntnis über die wirkliche Welt.
    Alle Erkenntnis der Wirklichkeit beginnt mit der Erfahrung und endet mit ihr.
    Alle Aussagen, zu denen man auf rein logischen Wegen kommt, sind, was die Realität angeht, vollkommen leer.
    Albert Einstein

  • Ich habe seit 2004 einen (doppelten) Cluster für 2500 User in die betreuung, und dort eigentlich keine probleme gesehen die sich auf den Cluster replicator beziehen. Anfänglich waren es 8 Server pro cluster, mittlerweile sind es noch 4.
    Deshalb habe ich mehrere Rückfragen.
    1. Wieso den neue Trennung mit DWA und Mail servern selber ?
    2. In V1 zähle ich 3 x 2 + 2 = 8 Server, oder verstehe ich da etwas falsch ?
    3. Verkleinern würde ich nur wenn es dafür HARDWARE grunde gibt, den Administrations Aufwand ist immer pro User, und weniger pro Server. Oder habt ihr andere erfahrungen ?
    4. Der aktuelle Umgebung hat 3 DWA server die nicht mit ein andere replizieren ? Sprich pro Cluster ist einer für DWA zuständig und sind alle 3 Domino server pro standort trotzdem in ein Cluster ?

  • Hi Dirk,


    zu 1) Von der Hardware her sollte das dicke langen. Für den 9er Server kann ich das nicht mit Bestimmtheit sagen, vom 8er Server her habe ich gute Erfahrungen gemacht, wenn täglich der http und einmal die Woche der Domino durchgerissen wird. Idealerweise auch gleich die OS-Basis.


    zu 2) Das neue 'dbmt' scheint ein guter Wurf von IBM zu sein. Derzeit läuft meiner auf 600 GB nicht ganz 2 Stunden, eher anderthalb. Blöderweise musste ich in "compact"- und "updall"-Läufe splitten; die anderthalb bis zwei Stunden sind kumulierte Laufzeiten. Jetzt ist die Frage, ob die 3.5 TB alle auf einem Server liegen, dann könnte es knapp werden. Stellt das die kumulierte Datenmenge über alle Server gerechnet dar, könnte das passen.
    Oder aber du lässt sie nicht jeden Tag laufen, sondern umeinander: den einen Tag wird compated, den anderen Tag sich um die Indizes gekümmert. Sowohl für compact- wie auch für die ftiThreads habe ich mal 4 angegeben, gut möglich dass man da noch etwas tweaken kann. Was habt ihr für einen Storage? Eingebaute Platten oder SAN/NAS?


    zu 3) 5 Server im Cluster stellen kein Problem dar. Gute Erfahrungen habe ich damit gemacht, wenn die einen eigenen Port spendiert bekommen, aber ich vermute dass ihr das eh einkalkuliert habt.



    Ich gehe mal davon aus, ihr werdet euch eine der Produktionsumgebung ähnelnde Testumgebung hinstellen?

    Life is not a journey to the grave with the intention of arriving safely in a pretty and well-preserved body, but rather to skid in broadside, thoroughly used up, totally worn out, and loudly proclaiming "Wow, what a ride!!! :evil:
    Beschleunigung ist, wenn die Tränen der Ergriffenheit waagrecht zum Ohr hin abfliessen - Walter Röhrl

    • Offizieller Beitrag

    Vielen Dank für die Infos.


    Zu euren Fragen:


    @rudi
    zu 1.:
    Bei V1 gibt es keine Trennung mehr zwischen Notes und DWA.
    Bei V2 gibt es die Trennung, weil es bedenken gibt, falls ein Sicherheitsproblem auftritt, können wir die beiden DWA-Dominos herunter fahren. Bei V1 kann aber auch der Reverse-Proxy oder der HTTP-Task herunter gefahren werden. Die Trennung DWA und Notes hatten wir bisher, deshalb auch dieser Ansatz.


    zu 2.:
    Es sind nur 2 Dominos pro Standort, die beide DWA und Notes bedienen. Sorry war von mir eventuell missverständlich ausgedrückt.


    zu 3.:
    Wir habe jetzt aktuell die Aufgabe vom Daten-Sicherheitsbeauftragten, alle Dominos auf 9.0.1 FP2 zu bringen. Derzeit steht auch ein HW-Tausch an (4-Jahres-Zyklus).
    Damit wir den Aufwand für den Rest der Manschaft minimieren können, wollten wir die Anzahl der DOminos reduzieren. Bei den Mail-Dominos ürden wir mind. 1/3 einsparen. Danach geht es noch bei den Datenbank-Servernund eventuell bei den Gateways oder Dominos mit anderer Funktionalität weiter.


    zu 4.:
    Alle 3 Dominos an einem Standort sind in einem Cluster. Nur auf einem davon ist http aktiviert und nur dieser stellt derzeit per Reverse-Proxy den DWA-Dienst zur Verfügung.


    @RockWilder
    zu 2.:
    Danke für den Hinweis mit dem splitten. Wir hätten mehrere Tasks gleichzeitig gestartet und diese auf einzelne Ordner los gelassen.
    Bei V1 sind es derzeit max. 1,5 TB pro Domino.
    Bei V2 sind es 3,5 TB auf jedem Domino. Dies sind derzeit unsere Bedenken, dass dabei die "Wartungs"-Tasks mit der Menge in angemessener Zeit nicht zurecht kommen.
    Der Storage ist eine SAN und ist über Fibrechannel angebunden.
    Die 3 Standorte liegen maximal 200 km auseinander und sind mit 850 MBit oder 1 GBit im Dreieck angebunden, d.h. über die Clusterreplikation mache ich mir wegen Latenzen und Beandbreit keine Gedanken, dies müsste passen.
    Ein Cluster zw. Deutschland und Brasilien über eine 100 MBit-Leitung lief auch problemlos mit ca. 300 Anwendern. Hier hat man beim Arbeiten im Client die Latenzen gemerkt aber der Clusterreplikator war immer aktuell.


    zu 3.:
    Die Clusterreplikation geht über eigene Netzkomponenten und ander Netzwerkkarten.


    Viele Grüße
    Dirk

  • Hi Dirk,


    ihr könnt das natürlich auch jeweils eigene Verzeichnisse loslassen, auch eine Möglichkeit. Muss halt im Vorfeld getestet werden, wie weit das SAN mitmacht.
    Bei anderthalb Tera auf dem einen Server würde ich mir eigentlich keine großen Sorgen machen, das sollte locker passen. Bei den dreieinhalb Tera müsste -denke ich- fundiert getestet werden, vor allem auch was mögliche geplante Downtimes zwecks Sicherung o.ä. angeht. Davon hängt dann auch ab, welche Zeiträume als "angemessen" definiert werden.


    Was das Herunterfahren der "DWA-Server" angeht: warum?
    Warum nicht einfach den http stoppen und gut ist? Das soll ja das Szenario V1 sein und das halte ich zum einen für ausreichend, zum anderen auch für insofern sinniger, als dass man sich Hardware und Lizenzen spart.

    Life is not a journey to the grave with the intention of arriving safely in a pretty and well-preserved body, but rather to skid in broadside, thoroughly used up, totally worn out, and loudly proclaiming "Wow, what a ride!!! :evil:
    Beschleunigung ist, wenn die Tränen der Ergriffenheit waagrecht zum Ohr hin abfliessen - Walter Röhrl

    • Offizieller Beitrag

    unserer Erfahrung ist, dass mehrere Prozesse, die eine Operation auf der SAN ausfüren, schneller sind, wie in ein Prozess, der genau die gleiche Aufgabe erfüllt.
    Stellt sich nur die Frage ob die Servertask dies auch unterstützen - hier tappen wir noch im Nebel, uns fehlen genau diese Erfahrungswerte.


    Danke und Gruß
    Dirk

  • Moijn!


    Ich hab das spaßeshalber für die Nacht mal so eingerichtet: ein dbmt-Task mit compact-Optionen aufs mail-Verzeichnis und einer auf 2 andere. Hat kein Problem gegeben, im Gegenteil: die waren in Summe sogar leicht schneller als der einzelne, der bisher eingerichtet war.
    Hätte ich so auch nicht erwartet...

    Life is not a journey to the grave with the intention of arriving safely in a pretty and well-preserved body, but rather to skid in broadside, thoroughly used up, totally worn out, and loudly proclaiming "Wow, what a ride!!! :evil:
    Beschleunigung ist, wenn die Tränen der Ergriffenheit waagrecht zum Ohr hin abfliessen - Walter Röhrl

    • Offizieller Beitrag

    ne weitere Optimierung wäre, die SAN über 2 Kanäle einzubinden (Mail-Standort1, Mail-Standort2).


    Gruß
    Dirk

  • Das -dachte ich- wäre ohnehin im Plan inbegriffen?
    Nicht allein der Performance wegen, sondern auch in Hinblick auf bspw. Ausfallsicherheit.

    Life is not a journey to the grave with the intention of arriving safely in a pretty and well-preserved body, but rather to skid in broadside, thoroughly used up, totally worn out, and loudly proclaiming "Wow, what a ride!!! :evil:
    Beschleunigung ist, wenn die Tränen der Ergriffenheit waagrecht zum Ohr hin abfliessen - Walter Röhrl

    • Offizieller Beitrag

    die Dominos hängen an mind. 3 verschiedenen SAN (pro Domino wird allerdings nur eine SAN verwendet). Pro Standort gibt es ein SAN-Cluster.



    Gruß
    Dirk

    • Offizieller Beitrag

    DAOS haben wir im Einsatz, da sehen wir eher keine Probleme, da die 3 Mails-Cluster derzeit auf ein Archiv-Cluster archiviert werden. Da ist läuft DAOS mit einer größeren Menge als im Prod.-System sehr zuverlässig.


    Danke und Gruß
    Dirk

    Rein logisches Denken verschafft uns keine Erkenntnis über die wirkliche Welt.
    Alle Erkenntnis der Wirklichkeit beginnt mit der Erfahrung und endet mit ihr.
    Alle Aussagen, zu denen man auf rein logischen Wegen kommt, sind, was die Realität angeht, vollkommen leer.
    Albert Einstein