Windows Server 2012 R2: Déduplication de données


Bonsoir à tous,



La déduplication des données implique la recherche et la suppression de données dupliquées sans compromettre leur fidélité ni leur intégrité. L’objectif vise à stocker davantage de données dans moins d’espace en segmentant les fichiers en blocs de taille variable (32 à 128 Ko), en identifiant les blocs dupliqués et en conservant une copie unique de chaque bloc. Les copies redondantes du bloc sont remplacées par une référence à la copie unique. Les blocs sont compressés, puis organisés en fichiers de conteneur spéciaux dans le dossier System Volume Information.



Une fois que la déduplication est activée pour un volume et que les données sont optimisées, le volume contient les éléments suivants :



  • Fichiers non optimisés. Les fichiers non optimisés peuvent inclure par exemple les fichiers qui ne respectent pas le paramètre de stratégie d’âge du fichier sélectionné, les fichiers d’état du système, les autres flux de données, les fichiers chiffrés, les fichiers avec des attributs étendus, les fichiers dont la taille est inférieure à 32 Ko, les autres fichiers de point d’analyse ou les fichiers utilisés par d’autres applications.
  • Fichiers optimisés. Fichiers stockés en tant que points d’analyse qui contiennent des pointeurs vers un mappage des blocs respectifs dans le magasin de blocs nécessaires pour restaurer le fichier sur demande.
  • Magasin de blocs. Emplacement des données de fichiers optimisés.
  • Espace libre supplémentaire. Les fichiers optimisés et le magasin de blocs occupent moins d’espace qu’avant l’optimisation.


Pour accompagner la croissance du stockage de données dans l’entreprise, les administrateurs consolident les serveurs et définissent comme objectifs clés l’optimisation des données et l’adaptabilité de la capacité. La déduplication des données offre des moyens pratiques d’atteindre ces objectifs, notamment :



  • Optimisation de la capacité. La déduplication des données dans Windows Server 2012 permet de stocker davantage de données dans un espace physique inférieur. Elle augmente nettement l’efficacité de stockage à l’aide de fonctionnalités, telles que le stockage d’instance simple (SIS, Single Instance Storage) ou la compression NTFS (New Technology File System). La déduplication des données repose sur la segmentation à taille variable en sous-fichier et la compression. Utilisées ensemble, ces technologies permettent de diviser le stockage par 2 pour les serveurs de fichiers généraux et par 20 (au maximum) pour les données de virtualisation.
  • Échelle et performance. Dans Windows Server 2012 la déduplication des données est hautement évolutive, efficace en termes d’utilisation des ressources et non intrusive. Elle peut traiter environ 20 Mo de données par seconde et être exécutée sur plusieurs volumes simultanément sans affecter les autres charges de travail sur le serveur. Pour garantir un faible impact sur les charges de travail serveur, des limites sont appliquées aux ressources de l’unité centrale et de la mémoire consommées. Si le serveur devient très occupé, la déduplication peut s’arrêter complètement. En outre, les administrateurs ont la flexibilité d’exécuter les travaux de déduplication des données à tout moment, de définir les planifications d’exécution de la déduplication des données et d’établir les stratégies de sélection de fichiers.
  • Fiabilité et intégrité des données. Lorsque la déduplication des données est appliquée, leur intégrité est conservée. Windows Server 2012 utilise la somme de contrôle, la cohérence et la validation d’identité pour garantir l’intégrité des données. Dans le cas de toutes les métadonnées et des données les plus souvent référencées, la déduplication des données assure la redondance afin de garantir la récupération de ces dernières en cas d’endommagement.
  • Efficacité de la bande passante en association avec BranchCache. Par le biais de l’intégration à BranchCache, les mêmes techniques d’optimisation sont appliquées aux données transférées via le réseau étendu (WAN) à une filiale. Il en résulte des téléchargements de fichiers plus rapides et une réduction de la consommation de la bande passante.
  • Gestion de l’optimisation avec des outils familiers. Windows Server 2012 dispose d’une fonctionnalité d’optimisation intégrée au Gestionnaire de serveur et à Windows PowerShell. Les paramètres par défaut peuvent se traduire par des économies immédiates. Leur réglage par les administrateurs peut encore améliorer ces gains. Un utilisateur peut aisément employer les applets de commande Windows PowerShell afin de démarrer une tâche d’optimisation ou de la planifier ultérieurement. L’installation de la fonctionnalité Déduplication des données et son activation sur des volumes sélectionnés peuvent également être accomplies à l’aide d’un fichier Unattend.xml. Ce dernier appelle un script Windows PowerShell et peut être utilisé avec Sysprep pour déployer la déduplication lorsqu’un système démarre pour la première fois.

Évaluer les économies réalisées
Après que la fonctionnalité de déduplication des données ait été installée, l’outil DDPEval.exe, dans \Windows\System32\ peut déterminer les économies que vous pourriez réaliser si la déduplication était activée sur un volume particulier. Vous pouvez copier ce fichier et tester les économies d’espace disque à réaliser sur une autre machine (Windows Server 2012 ou Windows 8.1).

DDPEval.exe prend en charge les lecteurs locaux ainsi que l’évaluation de partages distants mappés ou non comme dans l’exemple suivant :

DDPEval <VolumePath:>

C:\> DDPEVAL.EXE \\MonServer\MonPartage
C:\> DDPEVAL.EXE K:\MonDossier\
C:\> DDPEVAL.EXE K:

La sortie produite est semblable à ce qui suit :

Data Deduplication Savings Evaluation Tool
Copyright 2011-2012 Microsoft Corporation.  All Rights Reserved.

Evaluated folder: K:\MonDossier
Processed files: 34
Processed files size: 12.03MB
Optimized files size: 4.02MB
Space savings: 8.01MB
Space savings percent: 66
Optimized files size (no compression): 11.47MB
Space savings (no compression): 571.53KB
Space savings percent (no compression): 4
Files with duplication: 2
Files excluded by policy: 20
Files excluded by error: 0

Une fois la prévision d’économie d’espace calculé, vous pouvez décider d’installer ou non la déduplication de données sur la machine considérée.



Plus d’informations
http://technet.microsoft.com/fr-fr/library/hh831434.aspx 
http://www.system-center.fr/?p=3783

  1. No comments yet.
(will not be published)
*


(c) 2014 - Patrice A. BONNEFOY - Microsoft MVP Windows Expert IT-Pro since 2005.