Aller au contenu

Bien programmer les vérifications SMART des disques sur le NAS


Messages recommandés

@oracle7 @maxou56 @.Shad. @MilesTEG1

Bonjour les amis,

Après avoir bien vérifié et installé mes disques dans le NAS, voici le moment de planifier des tests SMART réguliers pour vérifier dans le temps que tout va bien.

Je vous ai mis des captures d'écran de ce que j'avais mis en place avec mon 412+ et je voulais avoir votre avis dessus:

 

Ici c'est mon planificateur de tests : 4 tests étendus hebdomadaires et 1 quick test quotidien

J'ai mis un exemple en image pour le disque 1 (test étendu hebdomadaire) et la capture aussi du quick test

Après j'avoue ne pas regarder souvent les résultats de ces tests 😳

 

Cotp

 

 

planificateur de tests 412+.JPG

planificateur de tests 412+ all disks - 1 of 2.JPG

planificateur de tests 412+ all disks - 2 of 2.JPG

planificateur de tests 412+ disque 1  - 1 of 2.JPG

planificateur de tests 412+ disque 1  - 2 of 2.JPG

Modifié par cotp
Lien vers le commentaire
Partager sur d’autres sites

@cotp

Bonjour,

Personnellement, je me contente du test rapide régulier (mensuel) sur tous les disques, ce qui me semble bien suffisant.

Cela n'engage que moi, mais le test approfondi/étendu me paraît du coup superflu car je pense qu'il n'est pas utile de solliciter plus que besoin les disques avec ce type de test afin de préserver leur longévité.

Si je peux me permettre, ta fréquence de test approfondi/étendu est bien trop grande. Une périodicité semestrielle (trimestrielle en cas de très grosse activité de L/E) me semblerait plus raisonnable. Éventuellement à faire seulement après 4 à 5 années d'utilisation pour surveiller la fin de vie de ceux-ci et quoique ... Mais c'est toi qui voit midi à ta porte ...

Cordialement

oracle7😉

 

Lien vers le commentaire
Partager sur d’autres sites

 @cotp

Bonjour,

il y a 45 minutes, cotp a dit :

Et du coté de l'interprétation du résultat des tests, est-ce que vous savez comme je peux faire ?

Pas besoin d'être un expert.

Il faut savoir que quand le disque dur est en parfait état, les valeurs SMART ("Value") sont à 100. Quand il y a un problème : elle s'affiche en rouge !

La colonne 'Theshold" correspond au palier d'alerte définit par le constructeur. Donc quand la valeur SMART s'approche de ce palier, il est temps de commencer à surveiller de plus prés le disque voire à s'inquiéter si on a atteint ce seuil rapidement (changement > de 5 à 10) et de prendre les dispositions nécessaires à commencer a minima par sauvegarder les données.

La valeur "WORST" indique la pire valeur enregistrée pour le critère jusqu'à maintenant (car, tu l'auras compris, ça peut remonter un peu).

Donc, Comme tu le vois, les données SMART sont très faciles à interpréter (tu as aussi notre ami Google pour t'aider en cela). Il suffit de les regarder régulièrement ! Ni plus ni moins.

Cordialement

oracle7😉


 

Modifié par oracle7
Lien vers le commentaire
Partager sur d’autres sites

Le 19/09/2020 à 16:27, MilesTEG1 a dit :

Faut espacer les tests approfondis. Un test rapide par semaine pourquoi pas, et encore, toutes les 2 semaines je pense serais mieux.
Et un test approfondi tous les 2 mois.

Salut @MilesTEG1

J'essaye de modifier ma planification de test mais j'ai un peu de mal.

Pour le test rapide j'ai réussi à mettre 1 fois par semaine mais je ne sais pas le réglage que je dois faire pour que ce soit 1 fois toutes les 2 semaines.

Pour le test étendu j'ai mis la prochaine execution dans 3 mois puis répéter trimestriellement. En revanche pas sur de ce que veut dire en dessous première heure fréquence et dernière heure...

Cotp

 

planification synology.JPG

planification synology2.JPG

Lien vers le commentaire
Partager sur d’autres sites

Rebonjour

Désolé de reposter , mais sur le 420+ je n'arrive pas à planifier ma tache de test étendu.

En fait dans le planificateur de tache j'ai le choix entre:

Créer > Tache planifier > Script Défini par l'utilisateur ou Corbeille ou Controle du Bip ou Service

Comment je fais pour planifier mon test smart ??

Cotp

 

Edit:  lu sur reddit dans une conversation sur un forum (en anglais):

 

Citation

There is no reason to run smart tests at all. Quick test is not useful and while extended test could be, you will achieve the better effect running volume scrub — which also results in surface scan among other things. Then replace drive when scrub detects issues. Sowing it so often as you do is massive overkill. The performance is degraded during surface scan. Monthly or bimonthly scrub is more appropriate.

Traduction: Il n'y a aucune raison d'exécuter des SMART test. Le test rapide n'est pas utile et bien que le test étendu puisse l'être, vous obtiendrez le meilleur effet avec le nettoyage du volume en cours d'exécution - ce qui entraîne également un balayage de surface, entre autres. Remplacez ensuite le lecteur lorsque le nettoyage détecte des problèmes. Le faire aussi souvent que vous le faites est excessif. Les performances sont dégradées lors du scan de surface. Un gommage mensuel ou bimensuel est plus approprié.

 

Citation

 

You cannot avoid doing scrub. Drives can silently fail and start lying. Scrub will detect that, by comparing with parity and verifying checksums. SMART Surface scan will not. Hence, SMART surface scan alone is a waste of time.

Scrub runs longer than it could intentionally to minimize impact on performance. And it is still faster than several consecutive disk scans.

Why do you want to do smart tests so much? There is literals no benefits in doing that. None.

 

Traduction

Vous ne pouvez pas éviter de faire des tests scrub. Les lecteurs peuvent échouer silencieusement et commencer à mentir. Scrub détectera cela, en comparant avec la parité et en vérifiant les sommes de contrôle. Le scan SMART Surface ne le sera pas. Par conséquent, le scan de surface SMART seul est une perte de temps.

Scrub s'exécute plus longtemps qu'il ne le pourrait intentionnellement pour minimiser l'impact sur les performances. Et il est toujours plus rapide que plusieurs analyses de disque consécutives.

Pourquoi voulez-vous tant faire des SMART test? Il n'y a littéralement aucun avantage à faire cela. Aucun.

Source : https://www.reddit.com/r/synology/comments/bggz8u/smart_test_schedule/elrf8b7/?context=8&depth=9

 
Modifié par cotp
Lien vers le commentaire
Partager sur d’autres sites

il y a 18 minutes, oracle7 a dit :

Cela me paraît évident, non ? Tu donnes la réponse tout seul ...

@oracle7

ah ah oui désolé 😇

C'est seulement du coup je me suis aperçu que j'ai loupé des tests comme ça avec une machine que j'éteins plus souvent alors qu'avant elle restait en permanence allumée...

J'ai trouvé ce liens qui parle des tests SMART sur Synology

https://www.synology.com/fr-fr/knowledgebase/DSM/tutorial/Storage/How_to_diagnose_drives_health_status_when_receiving_bad_sector_warning

Citation

Lorsque vous recevez des avertissements concernant des secteurs défectueux de vos disques ou d'autres problèmes, vous pouvez accéder à Gestionnaire de stockage > HDD / SSD et cliquer sur Infos sur la santé du disque pour afficher des informations plus détaillées dans l'onglet SMART . Vos disques peuvent être endommagés si vous voyez la valeur des données brutes n'est pas 0 pour ID 1 (disques de WD et Samsung) et ID 5, 197 et 198 (disques de tous les fabricants).

Du coup si je regarde le rang 1 ; 5 ; 197 et 198 et que je vois 0 ça va, c'est ça ?

Je crois que tu m'avais expliqué dans un autre post ce qu'il fallait que je regarde mais je ne le retrouve plus 😞

J'ai fait pas mal de captures d'écrans de tous les tests SMART de mes disques mais franchement c'est difficile à suivre par ce que je ne semble pas pouvoir exporter ces tests (du coup je fais des captures d'écran en jpg)

Dommage qu'il n'y ait pas un paquet synology pour évaluer les tests SMART 😛

Cotp

PS: exemple ici avec disque 1 de mon 412+

412+disque1_smart.JPG

Lien vers le commentaire
Partager sur d’autres sites

Bonsoir @oracle7

Non ce n'est pas un nouveau disque (il date je crois de 2016 ou 2017 donc sans doute plus sous garantie)

Le test SMART n'est pas terminé et a indiqué 90% toute la journée 😳

Dans les journaux du disque il y a marqué pas mal de fois "une erreur d'E/S s'est produite" sur disque 3 mais aussi 2 fois sur "disque 2" !

Le disque 3 en Raw Read Error Rate indique 50  dans données brutes (test rapide  du 24/09), les autres indiquent 0

Faut que je remplace le disque 3 ?

Ahlala 😨

Lien vers le commentaire
Partager sur d’autres sites

@cotp

Bonjour,

Il y a 13 heures, cotp a dit :

Le disque 3 en Raw Read Error Rate indique 50  dans données brutes (test rapide  du 24/09), les autres indiquent 0

Faut que je remplace le disque 3 ?

Tant que tu es au dessus du seuil constructeur, cela reste bon mais il faut surveiller la baisse de la valeur et son gradient. Si ce dernier devient > à entre 5 et 10, alors cela vite devenir problématique ... et il te faudra envisager rapidement le remplacement mais surtout la sauvegarde de tes données.

Cordialement

oracle7😉

 

Lien vers le commentaire
Partager sur d’autres sites

@oracle7

merci de prendre le temps de me répondre. 

Donc c'est si les données brut de Raw Read Error State passe à entre 5 et 10 c'est ça ?

Est-ce que ça veut dire aussi que certaines données de mon disques ne sont déjà plus accessible selon toi quand je vais sauvegarder mes données ? Ais-je interet à le remplacer avant de lancer ma sauvegarde ?

En fait je suis "partagé". Je compte bien sauvegarder mes données mais comme j'avais tu le sais testé mes nouveaux disques sur le 420+ je me suis retrouvé avec DSM sur le disque 1 et 3 disques vierges et 1 volume équivalent à la taille du disque 1.

Du coup j'ai fait augmentation de volume en sélectionnant tous les disques. Et j'en suis à 59% sauf que j'attends depuis 3-4 jours je crois... et je perds un peu patience.

J'ai bien voulu arrêter la machine en me disant que je reformaterai tous les disques et recommencerai l'installation de DSM mais je n'ai pas réussi à l'arrêter ni dans DSM ni physiquement. (bon aussi j'ai pas testé d'enlever la prise ahaha🙂 )

Alors en attendant mon 415+ (là où il y a ce disque defecteux) reste éteint et je ne peux sauvegarder aucune donnée.

Du côté de la future sauvegarde j'ai envisagé plusieurs pistes (rsync, ftp en SSH, Hyperbacjup, Migration Assistant) mais comme cela me semblait compliqué pour moi avec des risques d'erreurs, 'jai pensé monter les 2 syno avec Synology Assistant en puis faire simplement des copié-collé ou alors avec un logiciel de comparaison de dossier.

Voilà,

Cotp

 

Lien vers le commentaire
Partager sur d’autres sites

@cotp

Pas de soucis ...

il y a 31 minutes, cotp a dit :

Donc c'est si les données brut de Raw Read Error State passe à entre 5 et 10 c'est ça ?

OUI, à partir d'un tel gradient il y a de quoi sérieusement s'inquiéter et commencer à prendre les dispositions adéquates. Mais une augmentation de 1  n'est pas en soit alarmante, tout dépend de tous les combien de temps elle intervient.

il y a 31 minutes, cotp a dit :

Est-ce que ça veut dire aussi que certaines données de mon disques ne sont déjà plus accessible selon toi quand je vais sauvegarder mes données ?

Ne paniques pas ce ne sont pas toutes tes données, tout au plus quelques fichiers (je m'avance peut-être mais je dirai 2 à 3 selon le nombre de secteurs défectueux). De toutes façons tu ne le sauras que lorsque tu feras la sauvegarde.

 

il y a 31 minutes, cotp a dit :

Et j'en suis à 59% sauf que j'attends depuis 3-4 jours je crois... et je perds un peu patience.

Je crains qu'il ne te faille quand même prendre un peu patience surtout si tu as de "gros" disques .... Difficile de te dire mieux.

Cordialement

oracle7😉

Modifié par oracle7
Lien vers le commentaire
Partager sur d’autres sites

@oracle7

bonjour,

je comprends pas ça fait 2 fois que la vérification de cohérence de la parité repart à 0 ! J'étais à 85% et ce matin suis à 7% 😕

Est-ce que j'ai un moyen d'arrêter tout ça ???

En plus je ne comprends pas pourquoi ça me dit que tout l'espace est utilisé vu qu'il n'y a pas encore de fichiers a part les log 

Cotp

problemecoherence420.JPG

Est-ce qu'il n'y a pas un service que je peux arrêter pour pouvoir arrêter l'appareil ?

 

Cotp

moniteur ressources.JPG

Modifié par cotp
Lien vers le commentaire
Partager sur d’autres sites

@cotp

Bonjour,

Il y a 4 heures, cotp a dit :

Est-ce que j'ai un moyen d'arrêter tout ça ???

Désolé je ne connais pas la réponse à cette question.

Il y a 4 heures, cotp a dit :

En plus je ne comprends pas pourquoi ça me dit que tout l'espace est utilisé vu qu'il n'y a pas encore de fichiers a part les log

Je penses que tu t'affoles pour rien, attends la fin du processus, cet affichage n'est sûrement pas représentatif tant que ce n'est pas fini. Enfin ce n'est que mon avis, je peux me tromper ...

il y a 18 minutes, cotp a dit :

Peut etre que la vérification de parité se fait sur chaque nouveau disque et comme j'en ai mis 3 elle doit se faire 3 fois ?

Là non plus je ne sais te répondre.

Je sais c'est rageant, mais attends au moins la fin pour tirer des conclusions. Difficile de te dire mieux pour l'instant.

Cordialement

oracle7😉

Lien vers le commentaire
Partager sur d’autres sites

Je comprends votre message @oracle7 et @Kramlech, je dois être patient...

C'est juste que je me suis dit que j'aurais pu:

1) formater les 4 disques

2) installer DSM en insérant les 4 disques dans le Syno

3) Créer un volume global de la totalité 

4) Commencer à transférer mes fichiers pendant la vérification de "la cohérence"...

Là je suis bloqué depuis plusieurs jours car le volume reste à la taille du premier disque et pendant ce process d'augmentation , ça arrive à 100% et hop ça recommence à 0% plusieurs fois maintenant.

Pendant ce temps là je n'ose pas commencer à transférer mes données ...

Je vais attendre encore un coup (pour l'instant ça mouline à 23% 🥺 )

Lien vers le commentaire
Partager sur d’autres sites

Rejoindre la conversation

Vous pouvez publier maintenant et vous inscrire plus tard. Si vous avez un compte, connectez-vous maintenant pour publier avec votre compte.

Invité
Répondre à ce sujet…

×   Collé en tant que texte enrichi.   Coller en tant que texte brut à la place

  Seulement 75 émoticônes maximum sont autorisées.

×   Votre lien a été automatiquement intégré.   Afficher plutôt comme un lien

×   Votre contenu précédent a été rétabli.   Vider l’éditeur

×   Vous ne pouvez pas directement coller des images. Envoyez-les depuis votre ordinateur ou insérez-les depuis une URL.

×
×
  • Créer...

Information importante

Nous avons placé des cookies sur votre appareil pour aider à améliorer ce site. Vous pouvez choisir d’ajuster vos paramètres de cookie, sinon nous supposerons que vous êtes d’accord pour continuer.