L'illusion des tests SMART
Les outils de surveillance SMART peuvent vous dire si votre SSD est à 100 % ou s'il descend en dessous, mais ils ne peuvent pas prouver que les fichiers déjà stockés sur votre NAS sont toujours corrects. C'est ainsi que vous vous retrouvez avec un tableau apparemment sain et des dossiers sur des dossiers de fichiers endommagés.
Étant donné que vous utilisez probablement votre NAS principalement pour servir de sauvegarde sécurisée, la perte de fichiers due à la corruption va à l'encontre de l'objectif même de votre stockage. Heureusement, il existe une réponse à ce problème qui permet de maintenir vos sauvegardes en bon état : le nettoyage des données.
Sommaire
Les tests SMART vérifient l'état du disque, pas vos données
Cela vaut toujours la peine d’être fait, mais ils ne donnent pas une image complète.
Les tests SMART (Self-Monitoring, Analysis, and Reporting Technology) sont des diagnostics de disque intégrés qui surveillent de près les compteurs d'état de santé internes d'un disque. Ils exécutent des routines d’auto-vérification pour rechercher les premiers signes de défaillance, ce qui les rend très importantes. S'il est vrai que les disques peuvent tomber en panne même à 100 % de leur état de santé, les outils SMART restent utiles lorsque vous vous souciez de vos données.
La plupart des boîtiers NAS pré-construits vous permettent de planifier un test court ou un test étendu. Ils présentent ensuite les résultats sous la forme d'un état de santé ainsi que d'un ensemble d'attributs, notamment des éléments tels que des erreurs de lecture, des secteurs réaffectés, la température, etc.
Ils sont terriblement utiles. Il ne s’agit cependant pas d’un outil de surveillance universel.
SMART est meilleur dans un seul travail, et dans un seul travail. Il vous dira si un disque (dont votre NAS peut en avoir plusieurs) se comporte normalement et s'il commence à montrer des signes de panne. Mais cela ne veut pas dire qu’il n’y a pas de problèmes d’intégrité des données qui se cachent sous la surface.
Même un rapport SMART clair sur votre NAS ne garantit pas l'intégrité du début à la fin. Il fonctionne au niveau du périphérique, il ne peut donc pas vraiment valider ce que votre système de fichiers pense être correct, ce qu'attend votre couche RAID ou si les blocs stockés sont toujours cohérents lorsque vous essayez d'exécuter un fichier particulier.
Pendant ce temps, la corruption des données peut vous frapper depuis des endroits où SMART n’aura même jamais jeté un coup d’œil. Mauvaise RAM, contrôleur ou HBA défectueux, câblage marginal, alimentation instable, problèmes de firmware… Je pourrais continuer. Vous pourriez avoir des cas de fichiers corrompus sans même le savoir.
Ce qu'un gommage vérifie réellement (et quand il peut aider)
Ce n’est pas la chose la plus amusante à faire, mais c’est la meilleure façon de procéder dans certaines situations.
Un nettoyage des données est une transmission délibérée et systématique des données stockées sur votre NAS. Au lieu d'attendre que vous ouvriez un fichier un jour, le NAS lit volontairement les blocs stockés afin de pouvoir vérifier si le contenu du disque correspond toujours à ce qui a été écrit à l'origine. Les nettoyages peuvent faire apparaître toutes sortes de problèmes, tels que des erreurs de lecture latentes, des incohérences qui n'apparaissent que lors de lectures prolongées et des problèmes qui autrement passeraient inaperçus.
Il s'agit d'une passe beaucoup plus détaillée au niveau des fichiers qui vérifie si vos fichiers fonctionnent correctement ou non.
La raison pour laquelle cela est important, ce sont les sommes de contrôle. Sur les systèmes de fichiers qui les prennent en charge, votre NAS peut stocker une petite empreinte digitale pour chaque bloc de données, puis comparer cette empreinte digitale à ce qu'il lit. S'il y a quelque chose qui ne va pas dans la somme de contrôle, cela indique des données corrompues, même si le lecteur lui-même a continué à fonctionner normalement.
C’est également là que le nettoyage peut passer de la détection à la réparation. Si votre configuration de stockage est redondante et que votre système de fichiers peut en profiter, un nettoyage peut souvent extraire une copie correcte ailleurs dans le pool et réparer automatiquement le bloc défectueux. Si vous ne disposez pas de redondance, un nettoyage peut toujours détecter le problème plus tôt, mais il ne peut pas recréer comme par magie les données manquantes ou endommagées.
Les gommages sont particulièrement adaptés aux données froides ; des choses que vous laissez intactes pendant des mois, ce qui signifie que vous ne rencontrerez pas ces blocs endommagés pendant longtemps. Cependant, le nettoyage force ces lectures à se produire selon un calendrier, donc même si vous n'utilisez pas vos fichiers pendant des lustres, votre NAS vérifiera toujours ce qui se passe.
L'analyse des données ne peut pas tout résoudre
Cela dépend en quelque sorte de votre NAS.
Alors, les nettoyages de données sont-ils des solutions magiques pour tout ce qui pourrait mal se passer avec votre NAS ? Ah, si seulement. Malheureusement, il existe certaines limites.
Un gommage ne peut vérifier que ce que votre NAS peut vérifier (duh). Si votre configuration ne stocke pas les sommes de contrôle des données, ou si la fonction de nettoyage de votre NAS ressemble davantage à un contrôle de cohérence de parité, vous n'obtiendrez peut-être pas grand-chose d'autre qu'une confirmation que la structure du tableau a du sens. Il ne s'agira pas d'une vérification ponctuelle.
L’autre limite stricte est la redondance. Votre NAS doit disposer d'un emplacement d'où extraire une copie connue, dont vous savez qu'elle est bonne à 100 %, car c'est le seul moyen de découvrir une corruption. Sur un NAS à disque unique, une configuration JBOD ou tout autre élément sans véritable duplication, un nettoyage peut toujours détecter les blocs défectueux, mais il ne peut pas les réparer, car il n'aura nulle part où extraire des données.
Et même avec redondance, un gommage n’est pas un bouclier magique. Si la corruption s'est produite avant que les données n'arrivent sur le disque, ou si elle est introduite systématiquement par un matériel défectueux, le nettoyage continuera simplement à détecter les problèmes jusqu'à ce que vous corrigiez la cause première.
La manière optimale de gérer le nettoyage des données
La mise en place d’une routine assurera la sécurité de vos fichiers.
Le nettoyage est un excellent moyen de garder un œil sur vos fichiers et de vous assurer qu'ils sont en bon état. Ce n’est cependant pas vraiment une solution d’urgence. C'est pourquoi cela fonctionne mieux lorsque vous le traitez dans le cadre de votre routine de maintenance NAS.
Il doit être suffisamment fréquent pour détecter les problèmes liés aux données froides, mais également suffisamment espacé pour que votre NAS ne lise pas constamment d'énormes quantités de données en arrière-plan. (Cela pourrait le rendre très bruyant.)
Pour la plupart des configurations domestiques, cela revient à effectuer un nettoyage à une cadence mensuelle, puis à laisser SMART combler les lacunes avec des contrôles de santé plus légers, plus fréquents et plus généraux.
Conseil rapide : essayez de vous assurer que ces tâches ne se chevauchent pas. Un nettoyage est déjà une charge de travail de lecture soutenue, et l'empiler avec de longs tests SMART, des contrôles de parité, des sauvegardes ou une indexation de médias va rendre votre NAS à la limite inutilisable. Je suppose qu'un NAS entièrement SSD peut le gérer, mais même dans ce cas, vous le ralentirez sans raison.
Enfin, considérez ces nettoyages de données comme une simple couche d’un filet de sécurité plus vaste. Pour les fichiers qui vous intéressent le plus, respectez la règle 3-2-1 (ou même niveau 3-2-1-1-0), effectuez des vérifications fréquentes et gardez votre NAS en bon état pour vous assurer que votre risque de corruption des données est aussi faible que possible.
