Création d'un cluster de serveurs ESX/ESXi 4.1: VMware High Availability (HA)

 

1. Création d'un cluster de serveurs ESX/ESXi 4.1: VMware High Availability (HA)

Tout bon administrateur doit penser à une chose très importante quand on parle de virtualisation: la haute disponibilité. Dans ce guide, nous allons donc installer un cluster de serveur ESX/ESXi en utilisant VMware High Availability.

Avant toute chose, voyons les pré-requis pour mettre en place ce cluster:
- Toutes les machines virtuelles et leurs fichiers doivent être stockés sur un disque partagé. Les serveurs hôtes doivent bien entendu avoir accès à ce disque.
- Les serveurs hôtes doivent avoir une IP fixe associée à chaque carte réseau.
- Les serveurs hôtes doivent avoir accès au réseau virtuel des VM. - VMware recommande aussi d'avoir un réseau Management Network (ESXi) ou Service Console (ESX) redondant.

2. Rendre le réseau Management Network (pour ESXi) ou Service Console (pour ESX) redondant

Pour commencer ce guide, nous allons rendre le réseau de gestion redondant.

Note: Pour le débutants, pensez à lire le tuto suivant avant de faire cette partie: Configuration des réseaux virtuels sous Vmware ESX/ESXi

Si vous n'avez pas encore touché aux réseaux virtuels de vos serveurs, vos vNetworks devraient ressemblés à ça:

Pour rendre le Management Network/Service Console redondant, il faut ajouter une deuxième carte réseau sur le switch virtuel relié sur ce réseau (ici, ce vSwitch est vSwitch0). Dans les propriétés du switch, dans l'onglet Network Adapters, ajoutez une deuxième NIC:

Vos réseaux virtuels devraient alors ressembler à ça:

Répétez l'opération sur chaque serveur hôte.

3. Création du cluster

Passons maitenant à la création du cluster. Allez dans "Home->Inventory->Host and Clusters", puis faites un clic droit sur votre datacenter et cliquez sur New Cluster.

Entrez le nom de votre cluster. Vous pouvez ensuite choisir d'activer HA et/ou DRS.
- Nécessaire pour faire de la tolérance de fautes, HA surveille vos serveurs et vos VM afin de détecter les problèmes au plus vite. Si un de vos serveurs tombe, HA bascule automatiquement ses VM sur un autre serveur en état de marche.
- DRS permet lui d'optimiser l'utilisation de vos serveurs hôtes: il peut répartir les VM sur ces serveurs en fonction de l'utilisation de leurs ressources.

Si vous avez choisi d'activer DRS, vous devez préciser son niveau d'automatisation:
- Manual: DRS surveille les ressources de vos serveurs, et vous conseille seulement comment répartir aux mieux vos VM.
- Partially automated: DRS va répartir au mieux les VM à leur démarrage sur vos serveurs. Pour celle déjà en marche, DRS conseille seulement comment répartir aux mieux vos VM.
- Fully automated: DRS va répartir au mieux les VM sur vos serveurs hôtes (même celle déjà en marche). Vous pouvez aussi régler le niveau de sensibilité de DRS.

Vous pouvez maintenant configurer la gestion de vos serveurs hôtes via DRS. Si vous activer cette option, DRS arrêtera et allumera vos serveurs en fonction des ressources utilisées par vos VM.
Prenons un exemple. Vous avez trois serveurs ESX, qui tournent à 40% de leurs capacités. DRS va alors arrêter un des serveurs, en basculant ses VM sur les deux autres. Ainsi vous aurez deux serveurs ESX allumés tournant à 60% de leurs capacités (vous économisez donc en électricité, et c'est plus écologique). Si par la suite vous démarrez de nouvelles VM, et que la charge devient trop importante pour vos deux serveurs, DRS rallumera automatiquement le troisième serveur.
Vous avez trois configurations possibles pour cette fonctionnalité: Off, Manual (DRS vous fait seulement des recommandations) et Automatic ( DRS s'occupe de tout, vous pouvez bien sûr régler le niveau de sensibilité).

Passons maintenant aux option de VMware HA.
- Host Monitoring Status: laissez cette option activée pour utiliser HA (à désactiver en cas de maintenance dans votre datacenter).
- Adminssion Control: si cette option est activée, seuls les VM qui respectent certaines contraintes propre à la haute disponibilité pourrons être allumée. Cela permet de réduire les défaillances sur votre cluster.
- Adminssion Control Policy: vous permet de contrôler si les machines virtuelles doivent être redémarrées après le crash d'un serveur hôte, en fonction des ressources disponibles dans le cluster. Vous pouvez utiliser une des trois politiques suivantes: en fonctions des serveurs hôtes fonctionnels, en fonctions des ressources du cluster ou en fonction d'un serveur hôte désigné comme serveur de basculement.

Vous devez maintenant choisir les options par défaut des machines virtuelles du cluster. Ces options seront appliquées sur les nouvelles VM créée dans ce cluster.
- VM restart priority: Permet de spécifier l'ordre dans lequel les VM redémarreront en cas de crash du serveur hôte (les VM avec une priorité en High seront démarrées avant celle en Medium).
- Host Isolation response: Action à effectuer sur les VM si le serveur hôte ne peut plus être contacté. Par défaut, l'action est d'éteindre ces VM, afin que d'autres serveurs puissent avoir accès à leurs fichiers et puissent ainsi les redémarrer.

Vous pouvez ensuite choisir d'activer le monitoring des VM. Si vous activez ce monitoring, VMware HA redémarrera automatiquement les VM dont il ne reçoit plus de battements de coeur. Les battements de coeurs sont envoyés automatiquement au serveur par les VMware Tools chaque secondes.

Activez EVC pour être sûr que les CPU des serveurs hôtes ajoutés sur ce cluster soit compatibles, notamment pour l'utilisation de vMotion.

Choisissez ensuite où stocker les fichiers de SWAP des VM: dans le même dossier que ces VM (recommandé) ou dans un datastore sélectionné.

Vérifiez les informations affichées, et cliquez sur Finish. Votre cluster devrait apparaitre dans votre inventaire, sous votre datacenter.

Dans l'inventaire sur la gauche, glisser-déposer vos serveurs dans le cluster pour les ajouter à celui-ci. Un assistant s'ouvre alors et vous demande quoi faire des ressources et machines virtuelles gérées par ce serveur:
- Copiez toute ces ressources dans le cluster, et supprimer ensuite les resource pools du serveur.
- Ou créer un nouveau resouce pool pour stocker les ressources de ce serveur (afin de garder la hiérarchie de ce resource pool).

Félicitation, votre serveur est à présent créé et fonctionnel!

4. Activation de la tolérance de panne (Fault Tolerance)

VMware Fault Tolerance (FT) protège vos VM en créant une seconde copie des VM et en migrant cette copie sur un autre serveur hôte. VMware vLockstep s'occupe ensuite de synchroniser les VM et leurs copies, afin qu'elles soient toujours identiques. Si le serveur hôte de la machine virtuelle principale venait à cracher, la copie de cette VM (stockée sur un autre serveur donc) prendrait le relais, sans aucune interruption.

Pour commencer, créez un nouveau réseau virtuel de type VMkernel sur un nouveau vSwitch.

Et sélectionnez l'option "Use this port group for Fault Tolerance logging.

Une fois la création de ce vNetwork terminée, créez un deuxième réseau virtuel, lui aussi sur un nouveau vSwitch. Mais cette fois, cochez la case "Use this port group for vMotion.

Ces deux réseaux doivent être connectés sur des cartes réseaux physiques dédiées. Pour vérifier si votre serveur est prêt pour utiliser Fault Tolerance, allez dans le "Summary" de ce serveur.

Si tout est correctement configuré, vous devriez voir la ligne "Fault Tolerance Enabled: Yes" dans l'onglet "General", comme ci-dessous.

Répétez l'opération sur vos autres serveurs.

Une fois tous vos serveurs configurés, il faut activer Fault Tolerance sur les VM pour lesquelles vous voulez utiliser cette fonctionnalité. Pour cela, faites un clic droit sur la VM désirée, et cliquez sur "Fault Tolerance" puis "Turn on Fault Tolerance".

Lisez l'avertissement et acceptez d'activer Fault Tolerance. Les disques durs "Thin-provisioned" de la VM seront alors convertis en thick-provisioned disk (le disque virtuel occupera une taille fixe sur l'espace disque physique). La VM aura aussi la totalité de sa RAM de réservée sur le serveur hôte.

Vos VM sont à présent prêtes pour Fault Tolerance. Vous pouvez vérifier quelles VM sont en mode FT en allant dans les propriétés du cluster, dans la partie Virtual Machines. Les VM où Fault Tolerance est activé seront en double (la copie sera marquée "Secondary").