Citation
Bonsoir,
L'un des disques durs du serveur ftp1 a crashé, ce serveur étant en RAID5 les données qui le composent ont été simulées par la carte RAID à partir des 2 autres disques durs.
Cependant, le résultat ayant été plutôt médiocre, nous avons pris la décision de connecter tous les serveurs web du cluster1 sur le serveur de sauvegardes afin que l'affichage de vos sites ne soit pas, ou peu, perturbé (risque d'affichage de fichiers anciens présents dans la sauvegarde incrémentielle mais plus sur votre compte ftp). Vous ne pouvez donc pas uploader vos données sur ce serveur à l'heure actuelle.
Nous avons remplacé le disque endommagé par un disque neuf, la carte RAID5 construit donc ce disque à l'identique du précédent. Cette opération risque d'être assez longue (plusieurs heures), nous vous tiendrons informés via ce même billet de l'infocenter.
22/05/2005
#11h45-12h15 : sites inaccessible temporairement sur le cluster 1
# 13:27
La simulation de ce disque par le RAID5 fonctionnant correctement nous avons reconnecté les serveurs web sur le ftp1. Le temps de recalcul implique des lenteurs du cluster 1.
Cependant le disque qui aurait dû être reconstruit cette nuit annonce un statut "failed", nous avons remis un nouveau disque en place (le dernier du lot de dépannage) et la reconstruction a repris.
Nous disposons d'un serveur ftp inutilisé en baie, nous allons donc procéder à un remplacement complet de ftp1 par sécurité. Cela implique le transfert de plusieurs centaines de Go entre les 2 machines soit 8 à 10 heures dans le meilleur des cas.
#15:15
Le changement de serveur ftp est annulé du fait d'un taux de transfert extrêmement lent dû à la construction du nouveau disque. Il ne reste qu'à attendre que l'opération se termine.
#15:42
Nous venons de réouvrir l'accès aux comptes ftp de ftp1.celeonet.fr. Evitez les transferts de fichiers aujourd'hui si cela est possible.. Le temps du recalcul, vous pouvez rencontrer des lenteurs sur vos sites.
#19:35
Reconstruction toujours en cours.
Précision : Nous indiquerons dans cette news la fin de la reconstruction. Nous ne pouvons pas accélérer ce processus qui ralentit l'affichage des sites sauf en ne rendant plus aucun site accessible, ce qui n'est pas envisageable. Il n'est donc pas nécessaire de nous demander quand cette opération prendra fin.
La reconstruction d'un disque est un processus long et demandant énormément de ressources. Son accomplissement est variable suivant le volume de données, les uploads du jour et le flux de visites.
#23/05
#00:17
Reconstruction toujours en cours. Nous avons quelque peu modifié le programme de surveillance de ce cluster afin que les serveurs web du cluster 1 réagissent plus rapidement aux blocages de fichiers en provenance de ftp1.
En parallèle nous préparons un serveur ftp dont les données proviennent du serveur de sauvegardes. En cas de mise en ligne le contenu en serait complété par ftp1.
Dans le même temps nous avons préparé un serveur ftp de remplacement à partir des données du serveur de sauvegardes.
#6:50
Le serveur ftp a planté pendant que nous effectuions un check-up de la machine. L'ensemble des serveurs web du cluster 1 ont été connecté à la machine que nous préparions en vu de son remplacement.
#9:21 Précision suite aux différentes réflexions dans le support, lorsque vous vous connectez au webftp ou par un client ftp, vous voyez les fichiers sur le serveur ftp1 mais les fichiers visibles actuellement sont sur un autre serveur. Il est donc pour l'instant impossible de modifier en direct votre site.
#13:00
Force est de constater que l'opération de reconstruction du disque sur ftp1 échoue, afin que vos sites ne souffrent pas de lenteur ils utilisent un serveur ftp annexe. Certains indicateurs sur cette machine nous oblige a rester prudent quant à une mise en production définitive.
#22:27
L'ancien ftp1 est déracké et se trouve dans nos locaux pour que nous puissions agir plus facilement avec les outils Adaptec. Si cela ne fonctionne pas nous nous résoudrons à copier les données de ce dernier vers un support externe pour réimplantation sur une nouvelle machine commandée aujourd'hui, livrée mercredi.
N.B. : N'utilisez pas le support pour ce problème, toutes les informations sont ici et postées au fur et à mesure.
La loi de Murphy semble être la référence à prendre en compte.
#24/05
#12:50
Impossible de reconstruire le disque, nous allons récupérer les données présentes depuis une installation de Linux sur un autre disque puis réinstaller la machine avec des disques neufs.
#19:20
Enfin une bonne nouvelle, les données de l'ex-ftp1 sont en cours de récupération sur un disque externe.
A suivre...










