Cluster replicator arbeitet nicht korrekt

  • Hallo,


    wir haben einen Cluster aus zwei Servern bestehend (win2008 64bit, DOMINO 8.5.3). Leider ist es bereits mehrfach vorgekommen, dass der Datenstand zwischen den beiden Servern nicht korrekt ist. Eine normals Replikation bringt den Stand wieder ins Lot. Nur der Clusterreplicator macht es nicht korrekt. Die Datenbanken sind auch in der cldbdir.nsf für den Cluster Replicator aktiviert. Nach einem -> Administrator Client\Dateien\Datenbank\Cluster...\In Betrieb ist der Cluster dann wieder brav gelaufen.
    Trotzdem haben wir nach wie vor eine Datenbank in welcher es laufend vorkommt, dass neuerstellte Dokumente zwischen den Servern einen unterschiedlichen Datenstand haben.
    Wir sind diesbzeüglich auch schon seit über einem Monat mit dem IBM Support in kontakt welcher allerdings leider auch nichts auf die Reihe bringt. Jetzt wollte ich mal fragen ob ihr solche ClusterReplikator Probleme kennt und vielleicht auch Lösungen dazu.


    lg
    k0Nr@d

  • Eine reine Clusterreplikation alleine reicht auch nicht aus. Ein bspw. stündlich eingestelltes Replikationsdokument sollte immer noch dabei sein. Zzgl. Dokumente für die DBs, die ggf. häufiger replizieren müssen.


    Weiters ist eben auch die Frage, wieviele Cluster Replikatoren parallel laufen bei euch.


    Wenn Daten scheinbar nicht sauber replizieren: habt ihr selektive Replizierformeln in den fraglichen DBs? Die werden durch die Cluster Replikatoren nicht beachtet.

    Life is not a journey to the grave with the intention of arriving safely in a pretty and well-preserved body, but rather to skid in broadside, thoroughly used up, totally worn out, and loudly proclaiming "Wow, what a ride!!! :evil:
    Beschleunigung ist, wenn die Tränen der Ergriffenheit waagrecht zum Ohr hin abfliessen - Walter Röhrl

  • Hallo Rockwilder,


    danke für die schnelle Antwort. Der Replikator läuft bei uns alle 30 Minuten. ClusterReplikatoren hatten wir 3 welche nach Empfehlung unseres externen Partners auf 2 reduziert wurden um unsere Problem in den Griff zu bekommen.
    Selektive Replikationen haben wir nur insofern, dass es Leserfelder in der Datenbank gibt. Wobei in allen Dokumenten in einem AuorenFeld "LocalDomainServers" drin steht, womit unsere Server in jedem Fall lesen dürfen.


    Für weiter Hinweise bin ich dankbar.


    lg
    k0Nr@d

  • Was verstehst du unter einer normalen Replikation: Die über den Server oder manuell über einen Client ?


    Wenn letzteres, dann wird es vermutlich an irgendwelchen Berechtigungen oder Replikationsformeln liegen.


    Wenn ihr einen normalen Replikator eingestellt habt, dann würde ich mal die Timeouts prüfen, vielleicht kommt er ja nie zu den entsprechenden DBs

  • Bei Problemen mit dem ClusterReplikator die Anzahl der Replikatoren zu verringern halte ich für einen komischenAnsatz.


    Was sagen den die Statistiken zum Cluster- Replikator: wie lange ist dei Queue zum Zeitpunkt des Fehlers, wie lange im Durchschnitt und wie lange maximal?


    Wie fixt Ihr das Problem: durch einen repl an der Konsole oder durch eine "rechte Maustaste- Replikation", denn so wie Du das schilderst dürfte die db, wenn es nur am ClusterRepIkator läge, ja maximal ne halbe Stunde alt sein...

  • Was sagen den die Statistiken zum Cluster- Replikator: wie lange ist dei Queue zum Zeitpunkt des Fehlers, wie lange im Durchschnitt und wie lange maximal?


    Wie fixt Ihr das Problem: durch einen repl an der Konsole oder durch eine "rechte Maustaste- Replikation", denn so wie Du das schilderst dürfte die db, wenn es nur am ClusterRepIkator läge, ja maximal ne halbe Stunde alt sein...

    Mit den Statistiken kenn ich mich nicht aus. Ich bin Entwickler und mag das Admin zeugs ganz ehrlich gar nicht so gern. Normalerweise braucht der DOMINO auch nicht viel AdminAufwand,d eshalb habe ich mich da auch nie rein gekniet. Unser externer Berater sowie auch der IBM Support haben nie nach Statistiken gefragt, vermutlich weil es nicht wirklich ein Queue Problem sein kann. Weil egal wie wenig dass der Server zu tun hat, die Felder auf keinen Fall repliziert werden.


    Fixen kann ich das Problem nur in dem ich jedes Feld das abweicht selbst ändere. Ich hab mri hierfür ein Programm geschrieben. Also einerseits habe ich ein Programm das jede Nacht in allen Dokumente überprüft über alle Felder vorhanden, gleicher Datentype, gleicher Dateninhalt sind/haben. Sollte es zu Abweichungen kommen erhalte ich ein Log. Dan muss ich entscheiden welcher Datenstand der korrekt ist (hierfür brauche ich dann die Benutzer, weil ich es selbst ja nicht wissen kann) und dann habe ich eine Funktion welche genau die falschen Felder durch die richtigen ersetzt. Dann stimmt das ganze wieder. Nach ein paar Tagen erscheint dann wiederum ein Dokument bei dem Felder nicht passen und das ganze geht von vorne los.


    lg
    k0Nr@d

  • Soweit ich gelesen habe, hat IBm mit Domino 8 die StreamingClusterReplication eingeführt welche dann aber zu Problemen geführt hat, woraufhin der ini Parameter DEBUG_SCR_DISABLED=1 genutzt wurde um die SCR wieder abzuschalten. In der Version 8.0.2 war dieser by default abgeschalten. Vielleicht hat ja 8.5.3 damit wieder irgendwo ein Problem.


    Hat jemand von euch Erfahrung was es heißt die Replikation auf Feldebene abzuschalten DEBUG_DISABLE_INCR_REPL=1. Der IBM Support ist leider so schleißig, dass er mir nie die Auswirkungen seiner Empfehlungen angibt. Auch nie irgendwelche Angaben bezüglich Anwendung der Parameter (braucht es einen Neustart oder nicht, auf was muss ich Rücksichtnehmen...)

  • Unser Cluster läuft nun wieder fehlerfrei. Geholfen hat dabei folgender ini Parameter Server_Cluster_Auxiliary_Ports=*
    Es scheint so als ob das private LAN welches wir für die ClusterReplizierung eingerichtet haben nicht so ganz durchlässig funktioniert. Dem müssenw ir erst noch auf den grund gehen.