Checklist para un Administrador de Base de Datos

Una mañana antes de ir al trabajo, te llaman para decirte que no pueden ingresar al sistema o que se cuelga repetidamente por que la base de datos parece demorar en responder. ¿Algo familiar? Si te encargas de manejar la red de una empresa, y en especial de administrar la base de datos corporativa, esto podría repetirse varias veces.

Algunas cosas no se pueden evitar o preveer, pero otras si, si tenemos una lista de acciones a comprobar y realizar durante nuestro trabajo. No todas las ocurrencias desapareceran, pero podremos minimizarlas, al asegurarnos que nuestro servidor (o servidores) y nuestra base de datos están trabajando corectamente.

Podemos dividir a ese proceso en dos: un checklist de acciones y aspectos a revisar y un registro de lo chequeado y como se solucionó, de modo que tengamos una base para resolver un problema similar en el futuro.

Digamos que para tener una idea de lo que vamos a chequear es encontrar las respuestas a estas preguntas:

  • ¿Que debo chequear en la mañana?
  • ¿Como realizo ese chequeo?
  • ¿Que se debe hacer en caso encontrar un problema o fallo?
  • ¿Hay alguien a quien avisar si hay una falla o problema?

Claro que si ya desempeñas el mismo trabajo por un lapso de tiempo regular, ya tenemos una lista "mental" de chequeo a nuestra base de datos y servidor. Pero seguramente la mayoría no lo tienen escrito en un documento, que podría servir a un asistente o en caso extremo a un reemplazo nuestro. Hay que pensar que no somos eternos ni nunca nos vamos a enfermar.



Sigue leyendo...




Empecemos a ver cual sería una lista básica de chequeo:

-Copias de Seguridad o Backups: Verificar que las copias de seguridad se realicen correctamente y que se completen. Anotar o indicar a quien se le comunica en caso esto falle. Revisar la causa de porque no se completo el backup o porque se convirtió en un backup corrupto. También es necesario verificar que el tiempo que demora en realizarse un backup es el necesario y no se extiende más allá de lo debido. Si el tiempo aumenta, investigar el porqué y documentar tal incidencia. Y lo más importante es verificar que todas las bases de datos a las cuales hay que realizar una copia de seguridad las tengan actualizadas. Podría ser importante tener una solución automatizada para las copias de seguridad, y en su defecto una hecha a mano, como la copia de seguridad que realizo con Winrar.

-Espacio en disco: hay que verificar el espacio libre de cada disco duro de los servidores. Si hay una reducción significativa del espacio en disco se debe averiguar la razón.

-Fallos en los trabajos programados. Chequear, si es que tenemos trabajos programados, la razón porque fallan.

-Chequeo del Sistema: revisar el registro de cada servidor y resolver en caso se detecte un error grave. A la vez chequear en el Visor de Sucesos (Windows) el registro de Aplicación.

-Desempeño: chequear estadisticas para los servidores y investigar para resolver cualquier caso. Que las estadisticas se encuentren dentro de lo normal.

-Conectividad: que los clientes se conecten a la base de datos y puedan consultar los datos correctamente y a una velocidad aceptable.

-Replicación: en caso se tenga bases de datos replicadas, verificar que el distribuidor replique correctamente a cada suscriptor. Y que cualquier cambio en el proceso una detención, un reinicio, sea notificado al administrador.

Esa sería una lista básica, que aseguraría un desempeño fiable de un servidor y una base de datos. Luego del chequeo viene el registro (escrito o en la computadora), marcando con fecha y nombre de quien resolvió el problema si hubiera ocurrido.

0 comentarios: