¿Qué información necesitaría un modelo de inteligencia artificial (IA) para comprender verdaderamente la Tierra? Esa es la pregunta a la que pretende dar respuesta una iniciativa liderada por la Agencia Espacial Europea (ESA, por sus siglas en inglés) para mejorar el acceso a los modelos fundacionales dentro de la comunidad de observación del planeta. En este contexto, la ESA e IBM han impulsado un nuevo modelo de código abierto basado en IA generativa de observación terrestre. Lanzado en Hugging Face, este fue preentrenado en TerraMesh, el mayor conjunto de datos geoespaciales disponible, desarrollado por investigadores del gigante azul, la ESA, KP Labs, el Centro de Supercomputación de Jülich (JSC) y la Agencia Espacial Alemana (DLR).
“Con la ciencia, la tecnología y la colaboración internacional de observación de la Tierra, estamos liberando todo el potencial de los datos espaciales para proteger nuestro planeta”
Nicolas Longepe, científico de datos de observación de la Tierra en la ESA
Referente en rendimiento de modelos geoespaciales
TerraMind cuenta con una arquitectura única de codificador-decodificador basada en transformadores simétricos, diseñada para funcionar con entradas basadas en píxeles, tokens y secuencias, y capaz de aprender correlaciones entre modalidades. A pesar de entrenarse con 500.000 millones de tokens, TerraMind es un modelo pequeño y ligero que consume 10 veces menos recursos computacionales que los modelos estándar para cada modalidad. Esto implica que los usuarios pueden implementarlo a escala a un menor coste, a la vez que reducen el consumo energético total en el momento de la inferencia.
“Para mí, lo que distingue a TerraMind es su capacidad de ir más allá del simple procesamiento de observaciones terrestres con algoritmos de visión artificial. Ofrece una comprensión intuitiva de los datos geoespaciales y de nuestro planeta”, sostiene Juan Bernabé-Moreno, director de IBM Research UK e Irlanda, y responsable de Descubrimiento Acelerado de IBM para clima y sostenibilidad. “Actualmente, TerraMind es el modelo de base de IA con mejor rendimiento para la observación de la Tierra, según referencias comunitarias consolidadas”, añadió Bernabé-Moreno.
En una evaluación de la ESA, TerraMind se comparó con 12 modelos populares de la Fundación para la Observación de la Tierra en PANGAEA, un punto de referencia estándar de la comunidad, con el fin de medir su rendimiento en tareas del mundo real, como la clasificación de la cobertura terrestre, la detección de cambios, la monitorización ambiental y el análisis multisensorial y multitemporal. El punto de referencia demostró que TerraMind superó a otros modelos en estas tareas en un 8% o más.
“TerraMind combina la información de diversas modalidades de datos de entrenamiento para aumentar la precisión de sus resultados”, afirmó Simonetta Cheli, directora de Programas de Observación de la Tierra de la ESA y jefa de ESRIN. “La capacidad de incorporar información contextual intuitivamente y generar escenarios inéditos es fundamental para aprovechar al máximo el valor de los datos de la ESA. En comparación con los modelos de la competencia, puede proporcionar una comprensión más profunda de la Tierra tanto para investigadores como para empresas”.
En la práctica, para predecir el riesgo de escasez de agua, los investigadores deben considerar diversos factores, como el uso del suelo, el clima, la vegetación, las actividades agrícolas y la ubicación. Antes de TerraMind, todos estos datos se almacenaban en lugares separados. Reunir esta información permite a los usuarios predecir el riesgo potencial de escasez de agua con base en una visión más amplia y precisa de las condiciones en la Tierra.
Nueve millones de puntos de datos, nueve modalidades diferentes
Durante la creación del conjunto de datos, los investigadores incluyeron datos de todos los biomas, tipos de uso/cobertura terrestre y regiones, lo que permitió que el modelo fuera igualmente aplicable a cualquier caso de uso en todo el mundo, con un sesgo limitado.
El conjunto de datos incluye 9 millones de muestras de datos distribuidos globalmente y alineados espaciotemporalmente en nueve modalidades de datos fundamentales, incluidas observaciones realizadas por sensores en satélites, la geomorfología de la superficie de la Tierra, características de la superficie que son importantes para la vida en la Tierra (vegetación y uso de la tierra) y los conceptos básicos de cómo describir ubicaciones y características (latitud, longitud y descripciones de texto simples).
Autoajuste para crear datos artificiales
Desde una perspectiva técnica, TerraMind presenta un carácter innovador incluso más allá del ámbito de la observación de la Tierra. Esto implica que puede generar automáticamente datos de entrenamiento adicionales a partir de otras modalidades, una técnica que los investigadores de IBM han bautizado como Aajuste de Pensamiento en Modalidades (TiM, por sus siglas en inglés). Se trata de un enfoque novedoso para modelos de visión artificial similar a la cadena de pensamiento en modelos de lenguaje. La evidencia empírica demuestra que el ajuste de TiM puede mejorar el rendimiento del modelo más allá del ajuste fino normal.
En concreto, el ajuste de TiM mejora la eficiencia de los datos al generar automáticamente datos de entrenamiento adicionales relevantes para el problema que se aborda; por ejemplo, indicando al modelo que “considere” la cobertura terrestre al mapear masas de agua. Este avance puede lograr una precisión óptima al especializar TerraMind para casos de uso específicos, afirmó Johannes Jakubik, científico de IBM Research.
Construyendo sobre una base sólida
La aplicación de técnicas de IA y aprendizaje automático a datos relacionados con la Tierra, como satélites y patrones de uso del suelo, no es nueva. Los modelos geoespaciales básicos existentes, como los desarrollados por IBM y la NASA, permiten a los científicos interpretar estos datos, lo que les ayuda a abordar mejor los casos de uso en agricultura de alta precisión, gestión de desastres naturales, monitoreo ambiental (a través del agua, el calor y la sequía), planificación urbana y regional, monitoreo de infraestructuras críticas, monitoreo forestal y de la biodiversidad, etcétera.
Sin embargo, estos modelos actuales procesan datos de fuentes que, en ocasiones, no pueden captar la rica realidad de las condiciones de nuestro planeta. Mientras los satélites orbitan el planeta, proporcionando datos time-lapse sobre fenómenos naturales, vuelven a visitar el mismo lugar cada cinco días. Para analizar los fenómenos climáticos a largo plazo, esto proporciona datos suficientes para predecir y analizar tendencias. Al monitorear fenómenos a corto plazo, como incendios forestales e inundaciones, cada día cuenta, y los investigadores necesitan los datos más recientes para realizar predicciones o evaluar el riesgo mediante modelos de IA.
Para resolver este desafío, los investigadores de IBM combinaron sus conocimientos técnicos en la preparación de datos y la creación de modelos de base con los valiosos datos de observación de la Tierra de la ESA y su experiencia en evaluación de modelos para desarrollar un nuevo modelo de base de IA multimodal para la observación de la Tierra. Este modelo se entrenó utilizando la infraestructura y la experiencia del Centro de Supercomputación de Jülich.
Read More from This Article: TerraMind, el proyecto de código abierto basado en IA generativa para la observación de la Tierra
Source: News