Avant d’attaquer mon problème, voici une petite description de ma config :
4 serveurs Web Interface (physique) derrière une VIP distribué par un load balancer matériel (en attendant un Netscaler ^^).
Pour le moment, je me suis contenté de configurer la batterie en indiquant les deux serveurs DataCollector pour répondre.
2 Data Collector donc
1 serveurs de licences Citrix virtuel
1 Data Store actif / 1 en attente “au cas où”
40 serveurs distribuant des appli. Serveurs identiques (seules la puissance des serveurs changent, certains peuvent accueillir une vingtaine de users, d’autres 60).
Entre 700 et 800 utilisateurs simultané le jour et 150 la nuit.
Citrix PS 4.5 / Password Manager 4.6 / Edgesight 5.2 (qui ne voit rien pour mon erreur-ci).
Windows server 2003 R2 SP2
1er point :
Tout ça est fonctionnel depuis mi 2009. La seule différence depuis c’est l’ajout de serveurs d’applications, nous sommes passé de 25/30 à 40 en peu de temps, sachant que nous avons surtout ajouté des serveurs à forte capacité d’utilisateurs.
Depuis quelques semaines je rencontre un problème nouveau, un des deux data collector “plante”, il indique un problème mémoire sur le processus IMA, il s’agit du data collector prioritaire de la zone (unique), le deuxième DC prend bien le relais (qfarm /online l’indique bien comme étant le DC ayant le rôle actif). Seulement, le premier DC n’est pas totalement planté, le serveur est toujours vu par la ferme, et le service XML réponds comme il peut…
Le problème côté utilisateur : la web interface est accessible mais on ne passe pas l’authentification.
Hors puisque la web interface est configuré pour voir les deux DC et que l’un ne répond plus, je ne comprends pas pourquoi le mécanisme continue à vouloir passer par le DC en “panne”.
La seule solution étant de redémarrer le serveur en cause ou bien de l’enlever de la configuration de la WI.
Avez-vous déjà vu ça ?
Deuxième point :
N’ayant enfin de compte que peu de formation, pouvez vous répondre à mes quelques questions :
Est-il judicieux de passer par les deux DC pour la config de la WI ?
Pourquoi alors que je suis en profil errant, des profils locaux se créés systématiquement sur les deux DC ? Les profils errants sur les serveurs de publication fonctionnement normalement.
Que puis-je faire pour optimiser au mieux mes serveurs DC ou autres pour absorber l’augmentation de charge, puisque mes deux problèmes récents semblent dû à la charge récente des serveurs (et l’ajout de nombreux serveurs).
(Pour rappel, mon premier problème récent était dû au test HMR XML qui provoquait la sortie de serveurs du load balancing alors qu’ils étaient fonctionnels, la modification des règles HMR ayant réglé le problème semble-t-il).
Merci d’avance pour vos réponses et/ou pistes de reflexions.
Peux tu nous donner la configuration matérielle de tes ZDC?
En ce qui concerne les autres questions :
Est-il judicieux de passer par les deux DC pour la config de la WI ?
Le plus propre serait d’avoir une VIP sur un netscaler mais la plupart des fermes utilisent le failover sur la WI qui marche plutôt pas mal…
Pourquoi alors que je suis en profil errant, des profils locaux se créés systématiquement sur les deux DC ? Les profils errants sur les serveurs de publication fonctionnement normalement.
Si tes ZDC sont utilisé en tant que XML Broker, chaque changement de mot de passe depuis la WI déclenche une “connexion” sur le broker XML et donc création d’un profil… Il y a une CTX là dessus : http://support.citrix.com/article/ctx106533
Que puis-je faire pour optimiser au mieux mes serveurs DC ou autres pour absorber l’augmentation de charge, puisque mes deux problèmes récents semblent dû à la charge récente des serveurs (et l’ajout de nombreux serveurs).
Voici la configuration matérielle de mes deux ZDC (c’est la même configuration matériel pour les 4 WebInterface) :
Intel Xeon 5130 2Ghz (2 processeurs double coeur)
4 Go RAM
Teaming réseau 1 Gb
Par contre, quand je parle des deux ZDC, c’est effectivement eux qui sont configuré dans les 4 WI, donc ce sont eux les brokers XML.
J’ai du mal à comprendre ta phrase sur Netscaler. Si j’ai bien compris pour Netscaler, il embarque les WI (donc avec loadbalancing), mais au sein de la configuration des WI il faut bien indiqué la batterie Citrix à attaquer. Hors c’est sur ce point que j’ai un soucis.
Si je résume pour qu’on se comprenne bien, j’ai :
4 Web Interface matérielle derrière une VIP matériel aussi (mais ce n’est pas du netscaler).
Dans la configuration des web interface, j’ai indiqué mes deux ZDC comme broker XML.
Un de mes deux ZDC (le plus fort niveau de priorité) “plante” de temps en temps.
Lorsque ce serveur plante, les web interface ne répondent plus aux demandes d’authentification… après la saisi du nom d’utilisateur et du mot de passe, ça n’affiche jamais les applications publiées. Si j’enlève ce serveur dans la config des 4 WI, c’est ok (pour le moment je redémarre le ZDC quand ça arrive mais c’est pas une solution).
Sur le serveur planté, j’ai une erreur mémoire sur le processus IMA, puis assez vite derrière une erreur XML. Le ZDC “secondaire” prend le rôle de ZDC, mais quand je lis le journal d’évènement du primaire, j’ai l’impression qu’il cherche à reprendre la main.
En fait, Netscaler est capable de faire de la vérification de bout en bout (WI, XML broker…). La WI n’est d’ailleurs pas forcément sur le Netscaler. C’est d’ailleurs plus simple d’avoir la WI sur des Windows pour la gestion des logs de connexion.
Pour ton problème, je trouve que 4 giga de RAM c’est un peu léger vu le nombre de serveur / user (et on n’a pas le nombre d’applis…).
Il parle de grosse infra mais les chiffres commencent à 1 serveurs XenApp…
Essaye de pousser un peu la conf de ton ZDC pour voir si le problème se représente, si c’est le cas, il va falloir faire des captures CDF et/ou un dump pour trouver l’origine du blocage…