martes 13 de marzo de 2007

Cuidado con el tiempo en un server de MRTG/RRDTool

A veces se comete un error al realizar una actividad al parecer no riesgoza, que resultó en toda una catástrofe; peor aún es cometer el error nuevamente... he aquí un post para recordar esto. El caso es que tenga mucho cuidado en variar el tiempo del sistema en un servidor donde esté corriendo el servicio de MRTG/RRDTool

Es común que el reloj de un server se vaya corriendo poco a poco, cosa que en algunos meses, sea necesario realizar el ajuste correspondiente para volver a sincronizar el reloj. En el caso de un server corriendo MRTG resulta muy fastidioso tener gráficas que o están adelantadas, o están atrazadas en el tiempo. Es muy riesgozo variar el reloj del sistema mientras los demonios de MRTG/RRDTool están corriendo, porque un error de varias horas puede hacer que se pierda datos en los archivos .rrd irrecuperables.

La otra vez detecté un error de 15 minutos que ameritaba pues una pronta corrección. Al ejecutar el comando date -s STRING cometí un error en el formato de STRING y se cambió el tiempo al año 2021, lo que provocó que las bases de datos RRD se blanquearan. Afortunadamente, tuve tiempo de matar los demonios poco después de la actualización de la primera interfaz en todos los equipos que se estaban monitoreando, por lo que pude recuperar el resto de las interfaces.

Mi recomendación es la siguiente:
  1. Elimine todos los demonios del MRTG
  2. Haga un respaldo de los archivos .rrd
  3. Realice los cambios del reloj que correspondan
  4. Levante nuevamente los demonios MRTG

Este sencillo orden de trabajo evitará la catástrofe de perder las gráficas de monitoreo de varios meses y hasta años.