[Resolu] [CPS4x] Service IMA Down

Re-moi…



J’ai un truc bizarre sur des servs en 2003 sp1 avec le Rollup pack 3.



Le service IMA tombe (bien qu’il reste up dans les services), impossible de le relancer (message Erreur 1053 : le service n’a pas repondu assez vite à la demande de lancement ou de contrôle).



Cote CMC je vois le serv, mais dans RM je n’ai aucune count (logique), puis hop dans la CMC la j’ai le serv en error (serveur arrêté)



Je suis allez chez citrix.com, coté .net framework je suis bien à jour (il font une preco pour ce type de message, mettre à jour le .net framework pour le message 1053)



Le seul moyen de relancer le service est de rebooter (les servs impactés ne sont pas encore en prod et je ne vois aucunes différences avec les servs en prod).



Ce qui me parait strange c’est que c’est serv n’on aucunes activités cpu, mem et session, et qu’ils tombent sans laisser d’events dans les journaux d’évenements.



Une fois reboter les servs fonctionne nickel (j’ai publié notepad dessus pour vérifier que je pouvais attaquer une appli publié sur une des ces servs)



A partir de ces servs je n’ai pas de problème joindre le datastore (le tnsping repond bien).



Faut-il que je trace le service IMA ?



Avez-vous des retour en rollup pack 3 de ce type de problème ?

Hello



Moi en ce qui me concerne, pas eu de souci avec le Rollup 03 et le Service IMA.



Par contre j’ai mis en place une supervision du service sur tous les srv ctx.

comment je peut tracer le service IMA afin de savoir a partir de qu’elle moment et qu’elle action il plante ?

Avec ProcessExplorer… :wink:

"karl1403" wrote:
comment je peut tracer le service IMA afin de savoir a partir de qu'elle moment et qu'elle action il plante ?
Salut,

ça génére un DrWatson ?

Concernant, l'échec du redémarrage:

Quand tu le relances, regarde HKEY_LOCAL_MACHINESOFTWARECitrixIMARuntimeCurrentlyLoadingPlugin

Si c'est vide: pb de connexion au datastore ou cache local corrompu
Si il y a une valeur, ça te donne une piste sur le sous-système qui pose problème...

Sinon: http://support.citrix.com/article/CTX105292  Troubleshooting IMA Service Failure To Start
"Laurent FALGUIERE" wrote:
"karl1403" wrote:
comment je peut tracer le service IMA afin de savoir a partir de qu'elle moment et qu'elle action il plante ?
Salut,

ça génére un DrWatson ?

Concernant, l'échec du redémarrage:

Quand tu le relances, regarde HKEY_LOCAL_MACHINESOFTWARECitrixIMARuntimeCurrentlyLoadingPlugin

Si c'est vide: pb de connexion au datastore ou cache local corrompu
Si il y a une valeur, ça te donne une piste sur le sous-système qui pose problème...

Sinon: http://support.citrix.com/article/CTX105292  Troubleshooting IMA Service Failure To Start



Salut,

concernant Dr Watson j'ai aucunes erreur générés.

J'ai rebooter le serv depuis (je sais je sais :P), mais j'ai testé sur ce même serveur (sauf que le service IMA est Up la)

quand je relance le service IMA j'ai dans HKEY_LOCAL_MACHINESOFTWARECitrixIMARuntimeCurrentlyLoadingPlugin :
les valeurs suivantes (je rafraichis afin de les avoirs of course) :

Valeur vide puis :

MfBrowserSs.dll
ImaDistSs.dll
RMMonitorSs.dll

puis après la valeur redevient vide

Si les services est up et la clef vide, c’est qu’il n’y a pas d’erreur au démarrage du service.

"karl1403" wrote:
"Laurent FALGUIERE" wrote:
"karl1403" wrote:
comment je peut tracer le service IMA afin de savoir a partir de qu'elle moment et qu'elle action il plante ?
Salut,

ça génére un DrWatson ?

Concernant, l'échec du redémarrage:

Quand tu le relances, regarde HKEY_LOCAL_MACHINESOFTWARECitrixIMARuntimeCurrentlyLoadingPlugin

Si c'est vide: pb de connexion au datastore ou cache local corrompu
Si il y a une valeur, ça te donne une piste sur le sous-système qui pose problème...

Sinon: http://support.citrix.com/article/CTX105292  Troubleshooting IMA Service Failure To Start



Salut,

concernant Dr Watson j'ai aucunes erreur générés.

J'ai rebooter le serv depuis (je sais je sais :P), mais j'ai testé sur ce même serveur (sauf que le service IMA est Up la)

quand je relance le service IMA j'ai dans HKEY_LOCAL_MACHINESOFTWARECitrixIMARuntimeCurrentlyLoadingPlugin :
les valeurs suivantes (je rafraichis afin de les avoirs of course) :

Valeur vide puis :

MfBrowserSs.dll
ImaDistSs.dll
RMMonitorSs.dll

puis après la valeur redevient vide

Mais si le servive IMA démarre correctement (ce qui est le cas depuis le reboot), ça sert un peu à rien... faudrait voir quand quand tu rencontres le problème....

Ok ça marche je post ça dès qu’il que j’en est un qui tombe.

tu n’a pas un souci de start d’IMA mais un IMA qui fige (hang).





il faut capturer un dump d’IMA quand il est dans cet état et l’envoyer au support pour analyse :



http://support.citrix.com/article/ctx109097 => How to Enable Full Page Heap When Creating Dump Files for Citrix Technical Support



http://support.microsoft.com/default.aspx?scid=kb;en-us;286350 => How To Use ADPlus to Troubleshoot “Hangs” and “Crashes”

"ThinIsFat" wrote:
tu n'a pas un souci de start d'IMA mais un IMA qui fige (hang).

Honte à moi, chef... Je m'en vais chercher mon bonnet d'âne...

J’ai installé le Debugging Tools for Windows, puis passé la commande gflags /i ImaSrv.exe.



un gflags /p m’indique bien que :



imasrv.exe: page heap enabled with flags (full traces)

lmaSrv: page heap enabled with flags (full traces )



Je suppose que maintenant je dois attendre que le service soit a nouveau down ? pour que le dump se crée ?



bizarrement mon service dailleur lorsqu’il est down, après 2 heures je peu le relancer sans problème.

Hello,



Donc des news, depuis quelques jours tout est ok aucun des servs n’a le service IMA qui est tombé (dommage pour mon dump). Par contre je me demande si les services ne tombaient pas du fait que les servs en questions ont changés de zones et n’ont pas été rebootés ???

ah ça oui ya des chances…

mais un restart d’IMA doit suffire après un changement de zone

"ThinIsFat" wrote:
ah ça oui ya des chances...
mais un restart d'IMA doit suffire après un changement de zone

ouais c'est ce que je me suis dit aussi, mais l'IMA refuser de restarter.. sauf après une attente de 1 heure, bon pour l'instant j'en suis a une hypothèse.

je search encore ;D

en clair ton IMA est lent à démarrer.

quelques points à creuser :

quantité importante de drivers d’imprimante dans le datastore

quantité importante de jobs IM

quantité importante de TSCALs



tout cela se nettoie avec DSCHECK

Ok je vais voir de ce coté,



quand tu parles de quantité importante de TSCALs tu entend quoi :



le nombre utilisé pour ma ferme ?, sorry j’ai pas compris la

Ton datastore est sous quoi, sql, oracle, access, db2, mysql, csv?



Pas de probleme avec la database, ses log de transaction?

Peux tu nous donner la volumétrie de ta batterie:

Nombre de serveur, d’application publiée, de policies… et la taille physique de la database.

Pour info chez Calyon nous avons fait tombé un HP thunderdome lors d’une migration de datastore de 70 seveurs (access vers oracle). Car le DBA avait activé les traces sql sur la database :-

donc base oracle (480 Mo) , 20 servs pour 90 applis publiés et une seule policie.



aucune erreur avec le database.

Toujours pour info, la ou je suis aujourd’hui:

msSQL 2K:

35 applis

20 serveurs

4 policies

11 load evaluator

6 packs IM

  • la conf des WI et pnagent dans datastore

    Le tout fait 32 Mo de data et 80 Mo de log.



    tu as beaucoup d’applis en plus, mais bon… c’est pas extraordinaire.

    Quel version serveur et client Oracle ?