Maksym Yemelyanov - Fotolia
Métodos de reducción de datos para ambientes virtualizados
La compresión y la deduplicación son métodos de reducción de datos comunes que se usan en entornos de almacenamiento virtual, pero las tecnologías trabajan en diferentes niveles de almacenamiento.
Los términos compresión y deduplicación se usan por lo general indistintamente, pero son diferentes métodos de reducción de datos que son muy similares entre sí.
La compresión ha existido por décadas en una forma u otra. Una forma de compresión que ha existido desde la década de 1980 son los archivos zip, que combinan varios archivos en un solo archivo y elimina las copias redundantes de cadenas de texto y datos binarios. Cuando se extraen los contenidos de un archivo zip, los datos se rehidratan por un proceso que inserta los datos que se han eliminado.
La compresión también puede ser utilizada de otras maneras. Los archivos multimedia como JPEG y MPEG son formatos de archivo comprimidos de forma nativa que se han diseñado para consumir el menor espacio posible.
Al igual que la compresión, la deduplicación existe en muchas formas diferentes. Muchas de las ofertas de deduplicación en uso hoy eliminan la redundancia a nivel de bloques de almacenamiento.
Las máquinas virtuales y los métodos de reducción de datos
Cuando se trata de métodos de reducción de datos para los servidores virtuales, tanto la deduplicación, como la compresión tienen su lugar. La compresión en general funciona a nivel de archivo, mientras que la deduplicación tiende a trabajar a nivel de bloque.
La compresión es, probablemente, el más adecuado para su uso en servidores de archivos que contienen datos a los que rara vez se accede, tales como datos archivados. Debido a la forma en que trabaja la compresión, comprimir todo generalmente no es una opción.
Otro uso común para la compresión en un entorno virtualizado es la compresión de sistema de archivos NTFS, que algunos administradores utilizan para reducir la huella de los datos en el volumen de almacenamiento físico subyacente. Pero la compresión NTFS es un rasgo heredado que está empezando a caer fuera de moda, ya que consume ciclos de CPU. Como tal, la compresión es una mala elección para el uso en máquinas virtuales (VM) que ejecutan cargas de trabajo intensivas en CPU. Más importante aún, algunas características de Windows Server, como la disponibilidad continua, no son compatibles con la compresión NTFS.
La deduplicación se puede implementar en el nivel de almacenamiento si el hardware de almacenamiento soporta deduplicación nativa, y puede trabajar desde fuera de la máquina virtual. Lo bueno de este tipo de deduplicación es que puede ayudar a eliminar la redundancia que existe a través de las máquinas virtuales. Por ejemplo, las máquinas virtuales que ejecutan el mismo sistema operativo tienen archivos de sistema idénticos. La deduplicación puede ayudar a eliminar esta redundancia, reduciendo la cantidad de almacenamiento físico requerido por las VMs. La deduplicación es actualmente uno de los principales métodos de reducción de datos elegidos para entornos virtualizados, con compresión a nivel de volumen utilizándose con menos frecuencia.