how-to-install-and-manage Help

Risque lié aux différents services

Samba

Si le service samba n'est plus actif, il n'est plus possible de faire l'authentification des utilisateurs.

Résolution

Restaurer depuis des backup

Verifier l'intégralité des fichiers.

Pour vérifier l'intégralité des fichiers liée à la base de donnée de samba, il faut utiliser la commande suivante :

samba-tool dbcheck --cross-ncs --fix

Pour vérifier l'intégralité des fichiers du disque dur, il faut utiliser la commande suivante :

fsck -f /dev/sdX

Verifier que le service est en cours d'exécution

systemctl status samba

Si le service n'est plus actif

Il faut le redémarrer avec la commande suivante :

systemctl restart samba

Verifier la connectivité entre les AD

Faire un ping entre tous les contrôleurs de domaine pour vérifier la connectivité.

Garage

L'état du cluster peut être dégradé ou inaccessible, dans le cas où le cluster est dégradé, le cluster peut continuer à fonctionner, mais il peut y avoir des problèmes de performance ou de disponibilité.

Restauration de l'état du cluster

Pour restaurer l'état du cluster, il faut s'assurer que tous les nœuds sont en ligne et fonctionnels. Et que plus de 51% des nœuds peuvent se joindre entre eux.

Il se peut qu'un noeud ait sont service de non démarré il est possible de le redémarrer avec la commande suivante :

systemctl restart garage

Retirer un noeud du cluster

Si un nœud est défectueux ou ne peut pas être réparé, il faut le retirer du cluster. Afin de ne pas bloquer le cluster.

Pour retirer un nœud du cluster, il faut utiliser la commande suivante :

garage layout show garage layout remove "node id"

Corruption de la base de donnée

Si la base de donnée de garage est corrompue, il faut restaurer la base de donnée à partir d'une sauvegarde. Cela va causer la perte des toutes les données qui ont été ajoutées depuis la dernière sauvegarde. Donc un rollback d'environ 3h.

Voici les commandes pour restaurer la base de donnée :

systemctl stop garage cd /var/lib/garage/meta cp db.lmdb db.lmdb.bak cp ../snapshots/dernieresnapshot db.squlite systemctl start garage garage repair -a --yes tables

Corruption d'un disque dur

Si un disque dur est corrompu il faut remplacer le disque dur sur le noeud

Voici les étapes à suivre pour remplacer un disque dur corrompu :

  1. Identifier le disque dur corrompu avec la commande lsblk ou fdisk -l.

  2. Arrêter le service garage sur le nœud avec la commande :

    systemctl stop garage
  3. Remplacer le disque dur corrompu par un nouveau disque dur.

  4. Formater le nouveau disque dur avec la commande :

    mkfs.ext4 /dev/sdX
  5. Redémarrer le nœud pour que le nouveau disque soit bien monté

  6. Et ensuite il faut attendre que les tache de restauration de la base de donnée soient terminées. C'est possible de vérifier l'état de la restauration avec la commande :

garage worker list

Corruption du système de fichiers

Si il y a de la corruption sur le systeme de fichiers de garage. Il est possible de le réparer avec la commande suivante :

garage repair -a --yes

NTP

Il est possible qu'un déclagage horaire entre les machines provoque des problèmes de synchronisation. Pour vérifier l'état de la synchronisation NTP, il faut utiliser la commande suivante :

timedatectl

Résolution

Pour forcer la resynchronisation NTP, il faut utiliser la commande suivante :

systemctl restart chronyd
Last modified: 22 July 2025