Nach Serverneustart braucht der Domino-Servertask ewig zum starten

  • Moin!


    Habe Problem mit einem Domino-Server R6.5 auf Win2003 (für die Geno-Bankadmins: basis21-Domino):


    Die Sicherungsumgebung beendet den Domino Serverdienst (über net stop ...). der Dienst wird sauber beendet und nicht abgebrochen. Nach der Sicherung wird der Server wieder gestartet.


    Jetzt ist es bereits das zweite mal aufgetreten, dass das Starten des Dienstes ewig lange dauert (als ob ich den Server brutal abgebrochen hätte). Auf der Console steht dann für etwa 2 Stunden (!) "Server startet on physical node..."


    Der Server ist in der Zeit nicht ansprechbar.


    Irgendwann geht's dann weiter und der Server läuft wieder.



    Hat sonst vielleicht jemand schon dieses Problem gehabt? Wie kann man das vermeiden?

    ------------------------------------------------------------------------------
    Nun freilich starren Sinnes zu behaupten, daß das, was ich gesprochen habe, auch unbedingte Wahrheit sei, das schickt sich nicht für einen, der zu denken pflegt. - Platon

  • Hi,


    habe das Problem leider zum Glück nicht :)


    Mir fallen da aber erst einmal spontan 2 Sachen ein:


    1.) lege Dir einen Agent für Dein Backup-System zu, mit dem Du die Datenbanken online sichern kannst


    2.) Wenn Du den Hänger reproduzieren kannst, dann versuche mal noch folgendes: nach dem "net stop ..." kannst Du ja nochmal ein "x:\Domino-PRG-Verzeichnis\nsd -kill" hinterherjagen. Das ist die "Putzkolonne", die noch evtl. herumliegende Leichen beseitigt.


    PS: was macht eigentlich die CPU-Last während der Zeit

    Für jedes Problem gibt es eine einfache Lösung, die es noch schlimmer macht.

  • Zitat

    1.) lege Dir einen Agent für Dein Backup-System zu, mit dem Du die Datenbanken online sichern kannst


    Diese Agenten sind leider schweineteuer und normalerweise (bei den anderen Servern) geht das beenden und wieder starten des Serverdienstes ja prima, nur bei dieser Kiste nicht...



    Zitat

    ...kannst Du ja nochmal ein "x:\Domino-PRG-Verzeichnis\nsd -kill" hinterherjagen....


    Das werde ich mal ausprobieren, allerdings an einem Wochenende, damit nicht wieder die User ewig auf Notes verzichten müssen...


    Zitat

    PS: was macht eigentlich die CPU-Last während der Zeit


    Ist unten. Man sieht aber, dass die Platten (Raid) während der Zeit ziemlich am rumrödeln sind..



    Danke erstmal für den Tipp mit dem nsd -kill, den werde ich wie gesagt mal ausprobieren!

    ------------------------------------------------------------------------------
    Nun freilich starren Sinnes zu behaupten, daß das, was ich gesprochen habe, auch unbedingte Wahrheit sei, das schickt sich nicht für einen, der zu denken pflegt. - Platon

  • An diesem Wochenende ist es mal wieder passiert. Der Server ist weggebrochen und auf der Console habe ich folgendes entdeckt:


    [Blockierte Grafik: http://www.raibaol.de/images/002_1_1.gif]



    Ich habe dann mit nsd -ps geprüft, ob noch irgendwelche Notes-Tasks hängen, es kam aber die Meldung, dass keine mehr da sind. Sicherheitshalber habe ich auch nsd -kill ausgeführt, auch hier wurde mir bestätigt, dass es nix mehr zu killen gibt. Nachdem ich den Server dann neu gestartet habe, erschien diese Meldung:


    [Blockierte Grafik: http://www.raibaol.de/images/002_2_1.gif]



    Jetzt steht der Server wieder 'ne ganze Weile in dem Zustand, die Platten rattern, die CPU langweilt sich vor sich hin und irgendwann geht's dann wieder weiter.



    Hat irgendjemand aus dieser Runde schon mal solche Probleme gehabt bzw. weiss, wie man diese Probleme beheben kann?

    ------------------------------------------------------------------------------
    Nun freilich starren Sinnes zu behaupten, daß das, was ich gesprochen habe, auch unbedingte Wahrheit sei, das schickt sich nicht für einen, der zu denken pflegt. - Platon

  • Wie groß ist die log.nsf?
    Wir hatten das Problem auch mal, allerdings nur, wenn der Server eingefroren war.
    Wenn die log.nsf größer als 1 GB war, dann zeigte er solche Effekte beim Neustart.
    Haben dann die log.nsf vorm Neustart umbenannt (log_old.nsf) und den Server neu gestartet (dabei legt der Server ja ne neue log.nsf an, so er die Schablone hat ...), das ging dann pfeilschnell....


    Vielleicht ist das ja ein Ansatzpunkt.


    Gruß
    Sebastian

    [size=xx-small]...ich weiss, dass ich nichts weiss...[/size]

  • Hi,


    sieht irgendwie so aus, als ob Euer Virenscanner die mail.box anknabbert. Schau da mal nach einem Update.
    Das Gleiche gilt für den Notesserver selber. Aktuell aus dem 6.5er Stream ist die 6.5.5 mit Fixpack 4 (???). Schau doch einfach in der Fixlist-DB nach, was maittechnisch behoben wurde. Vielleicht ist ja was für Dich dabei :)

    Für jedes Problem gibt es eine einfache Lösung, die es noch schlimmer macht.

  • Zitat

    Wenn die log.nsf größer als 1 GB war, dann zeigte er solche Effekte beim Neustart.


    Die Log-Datei hat eine Größe von 32 Mb, daran kann's also nicht liegen ;)


    Zitat

    sieht irgendwie so aus, als ob Euer Virenscanner die mail.box anknabbert. Schau da mal nach einem Update.


    Der Virenscanner (Norman) ist aktuell, bzw. genau auf dem gleichen Stand wie bei den anderen Servern, die keine Probleme machen.


    Zitat

    Aktuell aus dem 6.5er Stream ist die 6.5.5 mit Fixpack 4 (???)


    Tja, wenn das so einfach wäre, aber wir sind Genossenschaftsbank und somit an die Vorgaben des Rechenzentrums gebunden, aber da habe ich auch schon einen Call laufen...


    Danke aber für die Tipps! Bin immer wieder begeistert, wie flott das hier geht!

    ------------------------------------------------------------------------------
    Nun freilich starren Sinnes zu behaupten, daß das, was ich gesprochen habe, auch unbedingte Wahrheit sei, das schickt sich nicht für einen, der zu denken pflegt. - Platon

  • Hallo Daddel,


    schalte doch als Erstes mal das TL für die mail.box aus.
    Das löst wahrscheinlich nicht die Ursache des Problems, vielleicht vermeidet es aber den Absturz.
    Da das TL ja einen Fehler gemeldet hat, bevor der Server in den Panic Fehler rannte.


    Wie ich sehe benutzt ihr noch eine ältere Version der 8er iQ.Suite.
    Wenn es Dir möglich ist solltest Du diese ggf. auf den aktuellen Stand bringen. Evtl. hilft auch ein Call bei Group selber die Ursache zu finden. Man kann ja innerhalb der iQ.Suite auch das Logging höher stellen (temporär) um ggf. eine bessere Fehleranalyse durchzuführen).


    Ich erinnere mich mit Grausen an einen ähnlichen Fehler mit einer 7.x Version. Dort hat der Grabber den Server weggerissen, wenn fehlerhafte E-Mails in der Mail.box auftauchten.


    Gruss,
    Kete

  • So, nun habe ich's rausgefunden. Es handelte sich offensichtlich um ein defektes Adressbuch. Gelöscht, neu angelegt, Problem behoben!


    Guten Rutsch ins neue Jahr!

    ------------------------------------------------------------------------------
    Nun freilich starren Sinnes zu behaupten, daß das, was ich gesprochen habe, auch unbedingte Wahrheit sei, das schickt sich nicht für einen, der zu denken pflegt. - Platon