|

Copias de seguridad en Linux con tar

Copias de seguridad en Linux con tar: tipos, estrategias y automatización paso a paso

Introducción

Las copias de seguridad son uno de los pilares fundamentales de cualquier política de seguridad informática. Saber qué tipos existen, cuándo aplicar cada uno y cómo automatizarlos en un sistema Linux es una competencia esencial para cualquier técnico de sistemas. En esta guía se explican los conceptos teóricos clave y se documenta la práctica completa: creación de backups con tar, automatización con crontab y transferencia remota mediante SCP/SSH.

1. Tipos de copias de seguridad

Existen tres modalidades principales de copia de seguridad, cada una con un alcance y una frecuencia de uso diferente:

Copia total (completa)

Realiza una copia de todos los archivos incluidos en los directorios seleccionados, sin excepción. Es la más completa y la base sobre la que se construyen las demás estrategias, aunque también la que más tiempo y espacio de almacenamiento requiere.

Copia incremental

Copia únicamente los archivos que han cambiado o han sido creados desde la última copia realizada, ya sea total o incremental. Ocupa mucho menos espacio que la copia total y es más rápida de ejecutar, pero la recuperación requiere disponer de la copia total más todas las incrementales sucesivas.

Copia diferencial

Realiza una copia de todos los cambios producidos desde la última copia total, acumulando las diferencias con respecto a ella. A diferencia de la incremental, la recuperación solo requiere la copia total más la última diferencial, lo que simplifica el proceso de restauración.

2. Diferencia entre copia diferencial e incremental en la recuperación de datos

La copia diferencial mantiene siempre actualizadas todas las modificaciones respecto a la última copia total, por lo que para restaurar solo se necesitan dos elementos: la copia total y la diferencial más reciente.

La copia incremental, en cambio, solo guarda los archivos que han cambiado desde la copia anterior (total o incremental). Esto implica que para una restauración completa es necesario contar con la copia total más todas y cada una de las copias incrementales realizadas desde entonces, en orden cronológico.

3. ¿Qué tipo de copia utilizar según el volumen de datos?

Base de datos de 35 GB

Para volúmenes moderados como este se recomienda la combinación de copia total + copia diferencial. Ofrece un buen equilibrio entre velocidad de recuperación y espacio consumido, ya que la restauración solo requiere dos copias.

Base de datos de 355 GB

Cuando el volumen de datos es muy elevado, la estrategia más adecuada es copia total + copia incremental. Aunque la recuperación es más compleja, el espacio de almacenamiento necesario para las copias periódicas se reduce considerablemente.

4. Soportes físicos para copias de seguridad: ventajas e inconvenientes

A continuación se analiza cada soporte físico habitual, con la estrategia de copia recomendada y sus ventajas e inconvenientes, basándose en la guía del Instituto Nacional de Ciberseguridad (INCIBE).

NAS (Network Attached Storage)

Estrategia recomendada: Copia total + Copia diferencial

Ventajas:

  • Gestión centralizada y simplificada.
  • Permite copias de seguridad en red y desde dispositivos móviles.
  • Soporte para copias por versiones de archivos.
  • Recuperación facilitada.
  • Confidencialidad de los datos.

Inconvenientes:

  • Dependencia de la conexión a Internet.

Discos duros externos

Estrategia recomendada: Copia total

Ventajas:

  • Permiten realizar copias periódicas de forma sencilla.
  • Precio económico.

Inconvenientes:

  • Vulnerables a daños físicos, robos o pérdidas si no se guardan en un lugar seguro.

DVD / Blu-ray

Estrategia recomendada: Copia total + Copia incremental

Ventajas:

  • Precio económico.
  • Protección frente a ransomware (los datos grabados no pueden ser modificados).
  • No requiere gran espacio de almacenamiento por copia individual.
  • Las grabaciones no pueden ser alteradas una vez escritas.

Inconvenientes:

  • Deterioro a medio o largo plazo, lo que puede imposibilitar la recuperación de los datos.

Cintas magnéticas

Estrategia recomendada: Copia total + Copia diferencial

Ventajas:

  • Permiten copias periódicas de grandes volúmenes de datos.
  • Posibilitan almacenar la copia fuera de las instalaciones de la empresa.
  • Disponibilidad de los datos en cualquier momento.
  • Protección frente a cualquier incidente físico en las instalaciones.
  • Confidencialidad garantizada.

Inconvenientes:

  • Dependencia de la conexión a Internet para la gestión remota.
  • Requiere un ancho de banda de subida elevado.

Nube (Cloud)

Estrategia recomendada: Copia total + Copia diferencial

Ventajas:

  • Copia de seguridad almacenada fuera de la empresa.
  • Disponibilidad de los datos desde cualquier lugar y en cualquier momento.
  • Protección frente a cualquier tipo de incidente físico local.
  • Confidencialidad de los datos.

Inconvenientes:

  • Dependencia total de la conexión a Internet.
  • Requiere un ancho de banda de subida elevado para volúmenes grandes.

5. Método mixto C2C (Cloud to Cloud)

El método C2C (Cloud to Cloud) consiste en que una aplicación realiza una copia de los datos alojados en un servicio en la nube y los guarda en otro servicio de red diferente. De este modo, en caso de pérdida o fallo del servicio original, es posible restaurar los datos desde la segunda copia en la nube. Cabe tener en cuenta que este tipo de aplicaciones no garantizan al 100% la recuperación total de todos los datos en todos los escenarios posibles.

6. Estrategia 3-2-1

La estrategia 3-2-1 es una de las reglas de oro de la gestión de copias de seguridad. Su nombre resume los tres principios que la definen:

  • 3 — Mantener 3 copias de cualquier archivo importante: el archivo original y 2 copias de seguridad.
  • 2 — Almacenar las copias en 2 soportes de almacenamiento distintos, para protegerlas frente a diferentes tipos de riesgos (fallo de hardware, incendio, robo, etc.).
  • 1 — Guardar 1 copia fuera de las instalaciones de la empresa (copia en la nube o en un centro de datos externo).

7. Copia de seguridad completa con tar y automatización con crontab

Comprimir un directorio con tar de forma local

El comando tar permite crear archivos comprimidos de uno o varios directorios de forma sencilla. Para comprimir un directorio completo se utiliza la siguiente sintaxis:

tar -czf nomdirectori.tar.gz  directorio1 directorio2 directorio3

Donde -c crea el archivo, -z aplica compresión gzip y -f especifica el nombre del archivo de salida.


Automatizar la ejecución del script con crontab

Para que el script de copia de seguridad se ejecute automáticamente cada 2 minutos, es necesario modificar el archivo crontab. Se accede a él con el siguiente comando:

sudo crontab -e

Una vez dentro, se añade la línea correspondiente con la frecuencia deseada. La sintaxis de crontab sigue el formato minuto hora día-mes mes día-semana comando; para ejecutar cada 2 minutos se utiliza */2 en el campo de minutos.



Programar la copia hacia un repositorio remoto mediante SSH

Para enviar la copia de seguridad a un host remoto que actúe como repositorio externo, se programa una tarea que conecta via SSH y transfiere el archivo generado.




Copiar archivos de forma remota con SCP

El comando SCP (Secure Copy Protocol) permite copiar archivos entre máquinas a través de una conexión SSH cifrada. Su sintaxis básica es la siguiente:

scp directorio/archivo ip_servidor:/home/usuario/destino/

Ejecutando este comando, el archivo se transfiere de forma segura desde la máquina local al host remoto especificado, sin necesidad de pasos adicionales.


8. Copia de seguridad incremental con tar

Para realizar una copia incremental con tar, se añade una nueva línea de comandos al script que comprime únicamente los archivos modificados desde la última copia, los añade al archivo comprimido del directorio de destino y elimina la copia anterior. De este modo, el repositorio de backups siempre contiene la versión más reciente sin acumular copias obsoletas.


Conclusión y siguientes pasos

A lo largo de esta guía se han cubierto los fundamentos teóricos y prácticos de las copias de seguridad en entornos Linux: los tres tipos de backup, los soportes más comunes con sus pros y contras, la estrategia 3-2-1 y la implementación técnica completa con tarcrontab y SCP/SSH.

Como próximos pasos se recomienda explorar:

  • El uso de rsync como alternativa a tar para copias incrementales más eficientes.
  • La encriptación de los archivos tar con GPG antes de transferirlos al servidor remoto.
  • La implantación de una política de retención de copias que elimine automáticamente las más antiguas para optimizar el espacio.
  • La verificación periódica de la integridad de las copias mediante checksums (md5sum o sha256sum).