Router down bei HTML zu MIME-Konvertierung Domino 8.0.1

  • Grüezi miteinand, ;o)


    Hat jemand Folgendes schon mit der neuen Version erlebt und kennt viell. den Stein der Weisen?


    Clusterverbund 4 Mailserver auf Windows 2003 R2 mit Domino 8.0.1, 64 bit. (frisch von Domino 6.5.)


    Server laufen (mehr oder weniger) gut aber bei der Konvertierung von HTML zu MIME haut es uns erst den Router kommentarlos (keine Fehlermeldung) weg und zieht den Server selbst mit nach unten.


    Ergebnis: Router down, Server down, MIME-Konvertierung geht nicht.


    Eine Idee?


    Danke im Voraus
    Wandler

  • Willkommen im Forum =)


    Zitat

    bei der Konvertierung von HTML zu MIME haut es uns erst den Router kommentarlos (keine Fehlermeldung) weg und zieht den Server selbst mit nach unten.


    Dann habt ihr aber Glück, denn HTML ist ja bereits ein MIME-Part. Ich weiß grad nicht was ihr da noch ein zweites Mal konvertieren wollt ^^


    (und mit an Sicherheit grenzender Wahrscheinlichkeit weiß es der Router ja auch nicht und sagt deshalb BÄH zu euch *g*)


    Sofern du Rich Text nach MIME konvertieren meinst - das übernimmt normalerweise der Client selbst, auf dem Server wird es nur dann gemacht, wenn es am Client unterdrückt wurde oder die Mail mit anderen Mitteln (Agents etc) erzeugt wurde.


    Etwas genauere (und technisch korrekte ^^) Infos bitte, dann gibts sicher auch mehr Output =)


    Carsten

  • *grins... Hi Carsten,


    Viell. hilft das hier:


    Auf unserem Mailserver läuft neben den normalen Tasks (Mail in, Mail out, Konvertierung von Mailformaten, etc.) im Moment auch die Konvertierung der ODS-Version von 43 auf 48.


    Das scheint den Router ziemlich zu belasten. Er crasht laut Fault Reports mit ACCESS_VIOLATION, was uns im Moment eher auf Probleme bei der Leistung bringt (wir testen das gerade).


    Ganz genau sieht es so aus, bevor er sich und den Mailserver verabschiedet:


    @[ 1] 0x103d2fd8 nnotes.HTDocDelete+20 (4bdf440;0;10008004;10090232)
    @[ 2] 0x103bfee9 nnotes.ConvertHTMLToRichText+457 (a0c020e;1039cf10;4bcdbd4;10047168)
    @[ 3] 0x103c0452 nnotes.cvsConvertHTMLListToRichText+762 (a07d868;30;40;a0730d8)
    @[ 4] 0x1039421c nnotes.ccCVSBodyPartListConvertToNoteItemList+1188 (30;40;a0730d8;f010404f)


    Eine Idee?


    Gruss
    Wandler

  • Äähm ... auf die Idee, dass es evtl. keine so wahnsinnig gute Idee ist, einen Router (der in eine DB schreibt, sie also verändert) laufen zu lassen, während ein anderer Task die internen Verwaltungsstrukturen einer DB verändert, seid ihr noch nicht gekommen? Und warum läuft der compact zur besten Hauptsendezeit, während ohnehin User die DBs im Zugriff haben?
    Sollte der compact auf einem nicht von Usern benutztem Server laufen, was hat dann der Router da zu suchen?


    Entschuldige bitte, aber was ihr da macht ist bestenfalls als mutig zu bezeichnen!

    Life is not a journey to the grave with the intention of arriving safely in a pretty and well-preserved body, but rather to skid in broadside, thoroughly used up, totally worn out, and loudly proclaiming "Wow, what a ride!!! :evil:
    Beschleunigung ist, wenn die Tränen der Ergriffenheit waagrecht zum Ohr hin abfliessen - Walter Röhrl

  • Zitat

    Äähm ... auf die Idee, dass es evtl. keine so wahnsinnig gute Idee ist, einen Router (der in eine DB schreibt, sie also verändert) laufen zu lassen, während ein anderer Task die internen Verwaltungsstrukturen einer DB verändert, seid ihr noch nicht gekommen?

    Die aller beste Idee ist es wahrlich nicht. Aber es spricht absolut nichts dagegen es zu machen. Der Router bekommt von unserem SMTP inbound die Mail über Notes RPC geliefert. Das landet dann in der mail.box und der lokale Router stellt dann diese Mail dem Benutzer zu. Wenn nun aus welchem Grund auch immer der Zugriff auf die Mail Datenbank des Benutzers gesperrt ist (weil wir einen Compact mit Copy-Style machen), dann wartet der Router mit der Zustellung und versucht es später wieder. Das ist absolut normales Verhalten.[/quote]


    Zitat

    Und warum läuft der compact zur besten Hauptsendezeit, während ohnehin User die DBs im Zugriff haben?

    Weil wir aus Zeitgründen und organisatorischen Gründen nicht alles am Wochenende erledigen konnten. Und weil der Mailserver genügend Power hat dass auch zur besten Hauptsendezeit zu machen. Das System ist ein Quad CPU System mit 16GB Memory und und und... unser Compact juckt den nicht die Bohne. DB's welche im Zugriff sind, werden vom Compact übersprungen. Die werden nicht konvertiert.


    Zitat

    Sollte der compact auf einem nicht von Usern benutztem Server laufen, was hat dann der Router da zu suchen?

    Was? Und wo gibt es so was? Auf dem Mail Server läuft zwangsläufig der Router. Er muss ja die Mails zustellen können. Ohne Router = keine Mailzustellung. Machst Du bei Dir den Compact auf einem anderen Server als dem Server wo die Benutzer drauf sind? Wie bringst Du dann die Daten wieder rüber auf den richtigen Server? Machst Du das mit OS File Copy? Oder mit Replikation? Mit Replikation bringt man nicht alles rüber. Da müsste schon File Copy passieren. Das ist aber nur sauber möglich, wenn man den Server runter fährt. Zwar kannst Du mit "drop all" und "dbcache flush" den Domino dazu bringen das offene File Handle zu kippen und dann schnell genug mit File Copy dem Domino Server was unterjubeln aber das ist mehr Glück und herumprobieren als ein richtig gangbarer Weg.


    Zitat

    Entschuldige bitte, aber was ihr da macht ist bestenfalls als mutig zu bezeichnen!

    Mutig? Warum? Compact auf einem Server laufen zu lassen wo der Router läuft ist alles andere als Mutig. Ist daily 0-8-15 Business mit Domino. Oder empfindest Du es auch als mutig wenn 5 Agent Manager, ein Indexer, ein UpdAll, einige Router, etc gleichzeitig laufen?


    Gruss
    Wandler

  • Zitat


    Der Router bekommt von unserem SMTP inbound die Mail über Notes RPC geliefert. Das landet dann in der mail.box und der lokale Router stellt dann diese Mail dem Benutzer zu. Wenn nun aus welchem Grund auch immer der Zugriff auf die Mail Datenbank des Benutzers gesperrt ist (weil wir einen Compact mit Copy-Style machen), dann wartet der Router mit der Zustellung und versucht es später wieder. Das ist absolut normales Verhalten.


    Mir ist klar, wie ein Router arbeitet. Aber dennoch: Danke für die Aufklärung.


    Zitat

    Weil wir aus Zeitgründen und organisatorischen Gründen nicht alles am Wochenende erledigen konnten.


    Aha.


    Zitat


    Und weil der Mailserver genügend Power hat dass auch zur besten Hauptsendezeit zu machen. Das System ist ein Quad CPU System mit 16GB Memory und und und...


    Hier widersprichst du dir selbst:

    Zitat


    Das scheint den Router ziemlich zu belasten. Er crasht laut Fault Reports mit ACCESS_VIOLATION, was uns im Moment eher auf Probleme bei der Leistung bringt (wir testen das gerade).


    Wie jetzt? Hast du nun ein super-duper System, oder nicht? Was nun allerdings die Anzahl der Prozessoren, die Hauptspeichergröße und das ominöse "und und und..." mit einer qualifizierten Aussage bezüglich Leistung des Servers zu tun hat, das musst du mir noch aufdröseln.


    Zitat


    unser Compact juckt den nicht die Bohne. DB's welche im Zugriff sind, werden vom Compact übersprungen. Die werden nicht konvertiert.


    Was im Endeffekt bedeutet, dass ihr zweimal ran müsst. Zweimal halb gearbeitet, ist einmal falsch gearbeitet.


    Zitat

    Was? Und wo gibt es so was? Auf dem Mail Server läuft zwangsläufig der Router. Er muss ja die Mails zustellen können. Ohne Router = keine Mailzustellung. Machst Du bei Dir den Compact auf einem anderen Server als dem Server wo die Benutzer drauf sind?


    Nein, selbstredend mache ich es dann, wenn überhaupt keine User drauf sind. Also am Wochenende. Und da stört es auch niemanden, wenn mal ein paar Stunden keine Mail ankommen. Vielleicht organisieren wir unsere Arbeit ... äähm ... anders?


    Zitat


    Wie bringst Du dann die Daten wieder rüber auf den richtigen Server? Machst Du das mit OS File Copy? Oder mit Replikation? Mit Replikation bringt man nicht alles rüber. Da müsste schon File Copy passieren.


    Das ist mir zwar neu. Aber da ich erst seit gestern vor einem Domino sitze, danke ich dir ein zweites Mal für die Aufklärung.


    Zitat


    aber das ist mehr Glück und herumprobieren als ein richtig gangbarer Weg.


    Nun, da sind wir uns ja mal einig.


    Zitat

    Mutig? Warum? Compact auf einem Server laufen zu lassen wo der Router läuft ist alles andere als Mutig. Ist daily 0-8-15 Business mit Domino.


    Bei mir nicht. Im Gegenteil. Ein compact -C bricht -wie du ja selbst festgestellt hast- ab, wenn wer auf die DB zugreift. Da das bei einem Mailserver -je nach Benutzer- alle paar Sekunden sein kann, ist es ziemlich sinnfrei. Bei mir heißt so etwas never-ever-08/15 Business.


    Zitat


    Oder empfindest Du es auch als mutig wenn 5 Agent Manager, ein Indexer, ein UpdAll, einige Router, etc gleichzeitig laufen?


    Is klar...

    Life is not a journey to the grave with the intention of arriving safely in a pretty and well-preserved body, but rather to skid in broadside, thoroughly used up, totally worn out, and loudly proclaiming "Wow, what a ride!!! :evil:
    Beschleunigung ist, wenn die Tränen der Ergriffenheit waagrecht zum Ohr hin abfliessen - Walter Röhrl

  • Zitat

    Mir ist klar, wie ein Router arbeitet. Aber dennoch: Danke für die Aufklärung.

    Die Aussage ist aber wichtig! Es zeigt klar, dass sich der Router durch einen laufenden Compact nicht stören lässt.


    Zitat

    Aha.

    So was gibt es öffters. Ich weiss, dass da eine Umstellung von 32Bit auf 64Bit gemacht wurde und die zwei absolut wichtigsten Punkte bei der Umstellung sind, dass der Full Text Index gelöscht werden muss und jeder View Index auch gelöscht werden muss. Der Full Text wurde gelöscht aber die View Indizes wurden nicht überall gelöscht. Das ist eines der Probleme.


    Zitat

    Hier widersprichst du dir selbst:

    Empfinde ich nicht so. Power hat das System genügend aber das ändert dennoch nichts daran, dass es Zeit braucht.


    Zitat

    Wie jetzt? Hast du nun ein super-duper System, oder nicht? Was nun allerdings die Anzahl der Prozessoren, die Hauptspeichergröße und das ominöse "und und und..." mit einer qualifizierten Aussage bezüglich Leistung des Servers zu tun hat, das musst du mir noch aufdröseln.

    Die Server (4 Stück) sind ein Dual CPU System mit Dual-Core AMD Opteron 2222 und 16GB Memory. Das System ist kaum über 30% ausgelastet (CPU-Technisch gesehen). Memory verbraucht es auch nicht viel. Im laufenden Betrieb ist kaum die Hälfte des Speichers benutzt. So gesehen hat das System genügend Leistungsreserven übrig. Die lokalen Disks sind in einem RAID Verbund und die Domino Daten und das Transaction Log sind im SAN. Ich persönlich hätte es gerne, wenn das Transaction Log auf einer lokalen Disk wäre aber dann wäre es nicht möglich das System in einen Microsoft Cluster zu fahren (obwohl zur Zeit das Ding nicht mit dem MSCS läuft).


    Zitat

    Was im Endeffekt bedeutet, dass ihr zweimal ran müsst. Zweimal halb gearbeitet, ist einmal falsch gearbeitet.

    Das ist uns absolut klar.


    Zitat

    Nein, selbstredend mache ich es dann, wenn überhaupt keine User drauf sind. Also am Wochenende. Und da stört es auch niemanden, wenn mal ein paar Stunden keine Mail ankommen. Vielleicht organisieren wir unsere Arbeit ... äähm ... anders?

    Das geht da nicht. Da sind immer User drauf. Egal zu welcher Zeit. Zudem hat diese Umgebung ein automatisches Quota Management. Darum ist es erforderlich, dass ein Compact jeden Tag abläuft ansonsten hätten die Benutzer ein Problem (nicht alle Benutzer. Hauptsächlich die, welche über dem Quota sind).


    Zitat

    Das ist mir zwar neu. Aber da ich erst seit gestern vor einem Domino sitze, danke ich dir ein zweites Mal für die Aufklärung.

    Es ist Dir neu, dass die ODS und der "white space" nicht über Replikation verteilt wird? Echt? Ich dachte so was sei allgemein bekannt. Vielleicht habe ich zu viel (bin dual PCLP) und schon zu lange (seit Notes 1.01) mit Notes/Domino zu tun?


    Zitat

    Nun, da sind wir uns ja mal einig.

    Und ich bin auch einig.


    Zitat

    Bei mir nicht. Im Gegenteil. Ein compact -C bricht -wie du ja selbst festgestellt hast- ab, wenn wer auf die DB zugreift. Da das bei einem Mailserver -je nach Benutzer- alle paar Sekunden sein kann, ist es ziemlich sinnfrei. Bei mir heißt so etwas never-ever-08/15 Business.

    In einem Domino Cluster ist das kein Problem. Und das Ding läuft in einem dual Cluster (4 Systeme: 1, 2, 3, 4. ( 1 + 2 ) und ( 3 + 4 ) werden mit MSCS geklustert, ( 1 + 3 ) und ( 2 + 4 ) werden mit Domino geklustert). Da ist ein copy-style Compact locker möglich.


    Zitat

    Is klar...


    Die ganze Diskussion mit und über Compact ist irrelevant. Der Punkt ist, dass der Router auf 64Bit scheinbar Probleme haben kann mit Konvertierung von HTML nach MIME oder CD. Es ist ja nicht so, dass der Domino Router noch nie solche Probleme hatte. Die gab es früher auch. Neu ist aber, dass die 64Bit Windows Version scheinbar vermehrt Probleme hat. Leider. Und NSD trappt die Exception und restartet den Server wenn man Fault Recovery aktiv hat. Wie dem auch sei. Seit Gestern ist ein Prio 1 Ticket bei IBM diesbezüglich offen. Mal schauen was dabei raus kommt.



    // Steve

    • Offizieller Beitrag

    habt Ihr Euch mal das nsd-log angesehen? Ist da etwas auffälliges drin (suche mal im nsd-Log nach FATAL, PAnIC, ERROR)?


    Gruß
    Dirk

    Rein logisches Denken verschafft uns keine Erkenntnis über die wirkliche Welt.
    Alle Erkenntnis der Wirklichkeit beginnt mit der Erfahrung und endet mit ihr.
    Alle Aussagen, zu denen man auf rein logischen Wegen kommt, sind, was die Realität angeht, vollkommen leer.
    Albert Einstein


  • Ich persönlich finde die Konstellation Part. Dominos + SAN + MS Cluster nicht wirklich berauschend und auf lange Sicht vermutlich zu problembehaftet aber das ist ein anderes Thema.


    Wie kommst du vom Router-Crash auf Performance-Probleme? Ok, ich sehe zwar auch massive potenzielle I/O-Probleme durch die ganze Art der Anbindung aber das würde ich dann weniger auf Performance als auf Zugriffsprobleme übers Netz zurückführen.


    Und nochmal die gleiche Frage wie bei meinem letzten Posting - wieso HTML zu MIME-Konvertierung?


    Selbst in dem geposteten Crash-Schnipsel sehe ich davon nichts, hier siehts eher nach MIME-zu-RichText Problemen aus (und ja, HTML ist auch nur ein MIME-Part, falls das nach meinem letzten Post noch nicht ganz klar war).


    Das kann aus meiner Sicht mehrere Ursachen haben aber, nachdem du ja schon den Router als Verursacher benannt hast (warum eigentlich? Ich sehe dafür keine Anhaltspunkte, aber ok, ich sehe auch nur 4 Zeilen des Logs) gibt es m.E. nur eine einzige Stelle, wo eine MIME-to-CD (= MIME-nach-Richtext) Konvertierung durch den Router selbst stattfindet, nämlich bei der Eingangsvermittlung von Mails. Genauer: auch dann nur, wenn jemand im/in Personendokument/en als bevorzugtes Format Richtext eingestellt hat. Simpel abschalten. Sollte das Problem , sofern du dir mit dem Router so sicher bist, schlagartig beseitigen.


    Carsten

  • Hi Carsten,
    "Zwei Dumme, ein Gedanke"... ohne, dass ich damit was sagen will. ;o)


    Spass beiseite: Wir haben testweise mal von "Prefers Rich Text" auf "Keep in sender's format" umgestellt und ja, nun crashen die Server nicht mehr.
    Das Problem ist aber, dass die Einstellung kein Zufall war, da wir Hostanwendungen haben, die mit der Einstellung arbeiten müssen,- Thema: automatische Mails.


    Als Workaround nicht schlecht aber eben nicht als Lösung anwendbar in dieser Umgebung.
    IBM hat ein Ticket offen... mal sehen, was die dazu sagen.


    Gruss
    Wandler

  • Hallo Leute,


    falls jemand mitgelesen hat und sich und seine Umgebung wiederfand, hier letzendlich die Lösung des Ganzen:


    Von der Domino-Seite:
    "keep in sender's format" kann/soll eingestellt sein und verursacht das Problem nicht primär.


    Von der Host-Seite:
    Die Mails, die zum Absturz führten, wurden von einer alten Version XMITIP generiert und (Achtung Mitbenutzer!!!) in dieser Version ist ein fehlerhafter Quellcode, der "type=plain/test" anstatt Attachement bzw. html angibt.


    Server vor Domino 8 waren scheinbar etwas fehlertoleranter und haben beim Quellcode mehr das angezeigt, was "gemeint" war als das, was tatsächlich im Code vorgegeben wurde.
    R8 liest aber nun genau und das ist es, was die Mails "vermurkst" und den Router runtergezogen hatte.


    Mit der aktuellen Version von XMITIP ist Alles wieder im Lot.


    Wer also ein ähnliche Problemchen hat...



    Liebe Grüsse
    Wandler