Jamais les disques durs ne durent
Amis de la statistique, bonjour. Bianca Schroeder et Garth Gibson, de l'Université de Carnegie Mellon, se sont penché sur la naissance, la vie et la mort des disques durs. Et, sans le moindre a priori, ont mélangé tout, ou presque, ce qui pouvait actuellement porter le nom de Winchester : unités haut de gamme SCSI « Ultra Wide différentielles haut de gamme », Fiber Channel, SATA pour monsieur tout le monde, périphériques firewire et autres procédés d'interfaçage électronique. Et les résultats sont contraires aux idées généralement émises :
Les meilleurs disques ne sont pas ceux dépendant d'une technologie couteuse. Bien au contraire, certains tests prouvent que les plus résistants furent de simples SATA d'entrée de gamme, alors que les plus élitistes des SCSI professionnels rendaient l'âme dans de déchirantes pertes de données.
Les pannes sont nettement plus fréquentes que ne le prétendent les constructeurs-d'autres études s'étaient déjà penchées sur ce sujet- .Le taux de panne réel frise les 3%, chiffre à comparer aux 0,5 à 0,9 % indiqués par les fabricants. Cette différence d'appréciation serait le fruit d'une modélisation inadaptée lors du passage des disques dans les unités de déverminage*.
Le fait d'acheter un « lot » de disque n'est pas une garantie d'homogénéité dans la qualité... cela risquerait même d'être la preuve qu'il existe surtout une homogénéité dans les catastrophes. Sur une baie Raid, la perte d'une première unité tendrait à prouver que la prochaine panne affectant un autre disque surviendra dans les deux ans à venir... un délais relativement court comparé à la durée de vie moyenne de 5 à 7 ans d'autres disques pris au hasard.
S'ajoute à ce danger le fameux problème des « défauts de jeunesse », statistiquement très probables durant la première année. Passée cette période de rodage, les Winchesters vivent entre 5 et 7 ans sans le moindre problème avant que le nombre d'incidents n'augmente brutalement
Lorsqu'un disque tombe en panne, les signes avant-coureurs sont totalement invisible dans 30 % des cas. Bruits suspects, table SMART en train de se remplir, messages d'alerte ou problèmes d'accès sporadiques sont une bénédiction pour les professionnels de la maintenance.... Mais il est très fréquent, insistent les chercheurs de Carnegie Mellon, que les « gamelles s'en prenne une sans crier gare ».
Le disque dur demeure la pièce la plus fragile d'un système. Au hit parade des remplacements, ce sont les unités fixes qui prennent la première place, avec, dans le cadre d'un protocole de test, 30% des interventions nécessitant un échange standard de la pièce. Devant les barrettes mémoire (28,5 %), les processeurs (12,4%), les cartes mères (4,9%) ou les alimentations (1,6%) **.
Un autre protocole tend à prouver que les accidents nécessitant remplacement de la pièce concernent les disques dans 49,1% des cas.
* ndlc Note de la correctrice : dans le monde du soft, on « debug », chez les électroniciens, on « dévermine » ou l'on se lance dans une « campagne de test destructif », sous atmosphère saline, bac vibrant, alimentations fantaisistes et variations de températures extrêmes (+90°C/ -55°C). La difficulté de toute cette science est de trouver un modèle mathématique qui permette d'associer ces mauvais traitements supposés « vieillir » prématurément les composants, et la « vraie vie ». En d'autres termes, bien que rigoureuses, les procédures de déverminage n'ont de valeur que dans « Second Life ».
** Sur le chapitre des alimentations, on constate avec plaisir que le courant secteur de l'Université de Carnegie Mellon passe par un câblage souterrain. En pays de montagne, là ou l'on réintroduit le loup, le gypaète barbu et le remonte-pente sauvage, les lignes électrique y son aériennes, et la durée de vie d'une alimentation à découpage dépasse rarement 2 ans sur 20 % d'un parc. C'est essentiellement pour cette raison que l'on trouve peu d'ingénieurs informaticiens auprès des caprins d'altitude et des bovins de race Abondance.