A las 12.33 del lunes, 28 de abril, la Península Ibérica se apagaba. Una serie de fallos, que al parecer se habrían localizado en subestaciones de Granada, Badajoz y Sevilla, habrían provocado la caída del sistema eléctrico y su desconexión del sistema europeo, en un mecanismo diseñado para evitar que se extendiese el apagón al resto de Europa continental. El suceso dejaba España en cero energético, según explicaba en el Congreso de los Diputados la vicepresidenta tercera y ministra para la Transición Ecológica y el Reto Demográfico del Gobierno de España, Sara Aagesen, en su comparecencia del 14 de mayo. Los motivos que llevaron al apagón están aún siendo investigados por diversas comisiones a nivel estatal y comunitario.
En menos de 18 horas, Red Eléctrica había conseguido recuperar la tensión en prácticamente todo el territorio. Un periodo de tiempo que servía para que las organizaciones pusiesen en práctica lo que hasta ahora solo se había diseñado y puesto a prueba en planes de contingencia y simulacros. Infraestructuras críticas, transportes, telecomunicaciones, hospitales, administraciones y empresas salían adelante, bien con generadores propios, bien esperando a que volviera el suministro eléctrico. Para las personas responsables de la parte de TI, un nuevo reto superado. Varios CIO cuentan sus experiencias.

IDG-Owned
“Si esto nos ocurre durante un periodo de días o semanas, hubiera sido un problema muy importante, impactando fuertemente nuestra capacidad operativa y de desarrollo”
Manuel Tarrasa, CIO de TuringDream
Para Manuel Tarrasa, CIO de la organización de desarrollo TuringDream, el corte eléctrico tuvo un impacto muy asimétrico: “Mientras nuestra infraestructura —100 % en la nube— siguió funcionando con total normalidad, el eslabón débil fueron las conexiones domésticas de nuestro equipo en España”. TuringDream funciona 100% en teletrabajo, con una plantilla repartida por dos continentes; en España, en varias provincias. En relación al impacto operativo inmediato, Tarrasa cita cero incidencias en los sistemas de IA, repositorios y pipelines vinculados a la nube. “No registramos ni un solo fallo de servicio”. El hecho de que toda su plantilla cuente con equipos portátiles para el trabajo, con baterías de más de cinco horas, hizo que se pudiese avanzar en tareas locales (coding, tests o documentación, ejemplifica Tarrasa), aunque sin sincronizar. Con esto, el equipo de desarrolladores pudo seguir trabajando, “por lo que el impacto total en términos de horas de trabajo se limitó bastante”.
Por la parte de ese eslabón débil cita la parte de las comunicaciones domésticas; al teletrabajar, el funcionamiento de la organización depende de los sistemas eléctricos de cada domicilio, además de en las redes de comunicaciones de datos y llamadas que, dice, no estaban preparadas para un apagón de estas dimensiones. “Al agotarse las baterías de routers y antenas, perdimos videoconferencias, chat y correo casi al instante. El trabajo colaborativo se redujo a mínimos; únicamente quienes tenían cobertura 4G residual pudieron enviar mensajes esporádicos tipo Signal o WhatsApp”, recuerda. “Si esto nos ocurre durante un periodo de días o semanas, hubiera sido un problema muy importante, impactando fuertemente nuestra capacidad operativa y de desarrollo”.
“A nivel empresa hemos aprendido bastantes cosas que, aunque suenan obvias, antes del apagón no parecían tan importantes”, evalúa. En el sentido de la continuidad del negocio, la principal conclusión que extrae es que “la nube es necesaria, pero no suficiente: la cadena se rompe en el último kilómetro”, explica, refiriéndose a la cadena router-casa-ISP. De resultas de esto, la firma está planteándose medidas como la instalación en las casas del personal de SAIs —sistemas de alimentación ininterrumpida—, que garanticen al menos 48 horas de trabajo con los portátiles, y de antenas de conexión a internet vía satélite tipo Starlink. Otra de las enseñanzas es la necesidad de evitar parálisis: “El equipo que sabe qué hacer sin internet aprovecha la batería; el que no, se paraliza”. Para esto están trabajando en guías y pautas para el desempeño offline.

Carlos Garriga, CIO de IE University.
“Estos momentos de crisis son inmejorables para identificar áreas de mejora, procesos que podemos perfeccionar y capacidades que debemos reforzar”
Carlos Garriga, CIO de IE University
“Desde el primer momento, los equipos de IT, Operaciones, Facilities y Seguridad se movilizaron para garantizar la seguridad de la comunidad universitaria y preparar la recuperación de la actividad”, explica Carlos Garriga. Al CIO de IE University, con centros en Madrid y Segovia, el apagón le pilló en un espacio con suministro eléctrico y conectividad, lo que le permitió estar al pie del cañón en todo momento. No sucedió así en todas las organizaciones. “La gestión de esta crisis se vio especialmente complicada por la caída casi total de las redes públicas de comunicaciones: telefonía móvil, redes de fibra óptica y servicios de datos estuvieron inoperativos durante horas”, recuerda. “La gran mayoría de las personas estaban incomunicadas, lo que dificultó enormemente la coordinación y la toma de decisiones”.
En ese contexto, hasta gestionar con quién se debe hablar y dónde supone un reto. “Formar un comité de crisis aproximadamente dos horas después del inicio del apagón supuso un desafío logístico y operativo mayúsculo”. En su caso, se optó por convocar físicamente a los equipos clave en un espacio de la IE Tower de Madrid, la sala de control, “diseñada precisamente para gestionar este tipo de situaciones”. Mantener el flujo de información y coordinación obligó a habilitar canales alternativos para el contacto directo con las personas críticas, aunque estas respuestas se vieron en muchas ocasiones demoradas por el propio estado de las comunicaciones. Esta situación “obligó a replantear planes de contingencia en tiempo real, adaptándonos a los recursos y personal disponibles en cada momento”. Un escenario de total adaptabilidad y de continua actualización, pendientes del retorno del suministro eléctrico en cada localización. Así, hacia la medianoche pudieron comunicar la reapertura de los campus de Madrid para el martes 29, mientras que el de Segovia se demoró algo más, hasta las 7 horas de la mañana del propio martes, dado que en la ciudad castellana la luz no volvió hasta las 4 de la madrugada. Al día siguiente, las operaciones pudieron desenvolverse con total normalidad.
“Hemos aprovechado esta situación como una oportunidad para aprender y seguir mejorando”, destaca. “Estos momentos de crisis son inmejorables para identificar áreas de mejora, procesos que podemos perfeccionar y capacidades que debemos reforzar”.
Continuidad en el servicio
En ese lunes negro hubo también organizaciones que siguieron con su operativa con relativa normalidad. Es el caso de PRISA. José Girón, su director adjunto global de información y tecnología, valora el suceso como una “espectacular ocasión para comprobar que los planes de continuidad de negocio están bien definidos. En nuestro caso todo salió de 10”, comenta. “Nosotros dependemos de las comunicaciones tanto para emisión de la radio (Telefónica/Colt y Axion principalmente) y de las clouds (los tres) y CDN [redes de entrega de contenido] para el resto de los negocios digitales y prensa. Y salvo algunos problemas puntuales regionales con Telefónica y centros emisores de Axion, todo funcionó muy bien”, sintetiza.
También desde AENA confirman que no hubo grandes problemas en la jornada del lunes. Fuentes de la empresa gestora de los aeropuertos de España indican que todas las instalaciones permanecieron operativas durante todo el día, “gracias a los sistemas eléctricos de contingencia de que disponen las infraestructuras, que se activaron de manera inmediata cuando se perdió la conexión con la red”. Según explican, estos sistemas de contingencia se contemplan en protocolos internos de máxima seguridad para situaciones de estas características.
Read More from This Article: Una ocasión para probar planes de contingencia: así gestionaron el apagón estos CIO
Source: News