Plantage aléatoire sur la ferme

Bonjour,



je rencontre aléatoirement des reboots de mes 14 serveurs Citrix (lames HP), particulièrement le matin.

Je pensais au début à une trop forte charge sur mes serveurs, mais nada, le problème survient quand le serveur à une trentaine d’utilisateurs dessus (ça varie, ce n’est pas tjs le même nombre d’utilisateurs).



Config d’une lame :

32 Go

Bi-QuadCore @ 2 Ghz

W2K3 R2 SP2 Enterprise



Certains matins, je ne vais avoir que 2 ou 3 serveurs qui vont planter et rebooter et des fois (comme ce matin) je vais en avoir 10! :o

Pas moyen de consulter le journal des évènements, soit il est corrompu soit il m’indique que le serveur a rebooté sans que cela ne soit prévu.



J’ai ouvert un incident chez Citrix mais je n’ai pour l’instant aucune info de leur part qui pourrait m’aider à résoudre mon soucis.



De plus je ne rencontrais pas ce soucis quand j’utilisais des lames moins puissantes. Mes lames sont à jour au niveau des drivers et des firmwares … je m’en arrache les cheveux!



Si vous avez une petite idée … je suis preneur!!!



Merci d’avance!

Tu as regardé les log ilo des lames HP ?

j’ai ça à chaque fois que ça plante :



iLO 2 12/10/2009 08:41 12/10/2009 08:41 1 Server reset.

iLO 2 12/10/2009 08:41 12/10/2009 08:41 1 Server power restored.





::slight_smile:

Et dans le log iml (bios)

Severity Class Last Update Initial Update Count Description

Critical OS 12/10/2009 08:41 12/10/2009 08:41 1 Abnormal Program Termination (BugCheck, STOP: 0x0000000A (0x00000004, 0xD0000002, 0x00000001, 0x808445BA))

Est-ce que tu as activé le dump ?

eh bah voila la réponse… tu a fourni le dump mémoire à Citrix ? aie 32Gb de RAM… moins drole deja… au moins un kernel dump…

je me vois mal envoyer 32 Go :-[

Pour faciliter tes rechercher sur le net ou autre, il faut que tu détermines le le pilote ou autre qui fait rebooter tes serveurs.

car ce genre de recherche est assez vaste : http://www.google.fr/search?hl=fr&q=citrix+0x0000000A+4.5&start=0&sa=N

"MilkyWaii" wrote:
je me vois mal envoyer 32 Go :-[

c'est pour cela qu'il faut configurer différement la génération de dump et prendre un kernel memory dump
http://blogs.technet.com/askperf/archive/2008/01/08/understanding-crash-dump-files.aspx

ok, je vais le faire! :wink:



Ce matin, aucun serveur n’est tombé … ::slight_smile: