Logotipo de Zephyrnet

El aprendizaje profundo subyace al conjunto de datos geográficos utilizados en la respuesta a huracanes

Fecha:

imagen

Cuando el huracán Fiona tocó tierra como tormenta de categoría 1 en Puerto Rico el 18 de septiembre de 2022, algunas áreas de la isla se inundaron con casi 30 pulgadas de lluvia y cientos de miles de hogares quedaron sin electricidad. Sólo 10 días después, huracan ian, una tormenta de categoría 4 y una de las tormentas más fuertes y dañinas registradas, aterrizó en el condado de Lee, Florida, arrasó casas e inundó ciudades antes de avanzar por la costa y tocar tierra nuevamente como tormenta de categoría 1 en Carolina del Sur.

El clima extremo y los desastres naturales están ocurriendo con una frecuencia cada vez mayor en los Estados Unidos y sus territorios. Los mapas precisos y detallados son fundamentales en la respuesta y recuperación ante emergencias.

Incluso antes de que los huracanes tocaran tierra, la Agencia Federal para el Manejo de Emergencias estaba trabajando con la investigadora Lexie Yang y su equipo en el Laboratorio Nacional Oak Ridge del Departamento de Energía para pronosticar daños potenciales y acelerar la respuesta en el terreno utilizando USA Structures, un conjunto de datos masivo de contornos y atributos de edificios que cubren más de 125 millones de estructuras.

Durante los últimos siete años, los investigadores de ORNL Geoespacial La División de Ciencia y Seguridad Humana ha mapeado y caracterizado todas las estructuras dentro de los Estados Unidos y sus territorios para ayudar a FEMA en su respuesta a los desastres. Este conjunto de datos proporciona una contabilidad uniforme a nivel nacional de los edificios donde residen y trabajan las personas.

La agencia solicitó dos nuevos atributos para los datos el mismo día que Fiona tocó tierra: tipos de ocupación y direcciones, información crítica para acelerar los fondos federales de emergencia para hogares y empresas.

“Encontramos algunas barreras del idioma cuando estábamos agregando los nuevos datos. La información limitada que estaba disponible para nosotros estaba en español. Además, hay muchas formas diferentes de documentar las direcciones de Puerto Rico. Tener que unificar esos datos y validar la información de atribución fue un desafío único para nosotros”, dijo Yang.

Incluso con ese desafío, el equipo de Yang pudo traducir, validar y fusionar los nuevos atributos con los datos de USA Structures en unas 50 horas. Este es el resultado de contar con una canalización de información escalable y una base de datos creada a partir de años de esfuerzo. FEMA comenzó a planificar su respuesta utilizando los mapas de referencia de USA Structures de las áreas que probablemente se verán afectadas. El personal de FEMA agregó capas de datos a medida que se desarrollaban los desastres, lo que le permitió a la agencia priorizar la respuesta a las áreas más afectadas.

"FEMA cuenta con analistas GIS [sistemas de información geográfica] que toman nuestros datos y los integran con imágenes satelitales posteriores al desastre, imágenes aéreas e información que los socorristas recopilan en el campo", dijo Carter Christopher de ORNL, jefe de sección de Dinámica Humana en el División de Ciencias Geoespaciales y Seguridad Humana.

El conjunto de datos existente, junto con la información de impacto en tiempo real, puede acelerar la recuperación al respaldar las evaluaciones de daños que los propietarios necesitan para recibir fondos para la reconstrucción en días en lugar de semanas o meses.

“Nuestro equipo está extremadamente orgulloso de ser parte de este proyecto”, dijo Yang. “Vemos cómo nuestras capacidades y conocimientos técnicos pueden transformar el conjunto de datos utilizado por FEMA y las partes interesadas locales”.

USA Structures comenzó en 2015, cuando los ex investigadores de ORNL Mark Tuttle y Melanie Laverdiere estaban trabajando en un proyecto de FEMA para mapear parques de casas móviles en los EE. UU. Las casas móviles son particularmente vulnerables a los desastres naturales, y existían pocos datos que identificaran la ubicación de estos en -estructuras de riesgo.

El equipo utilizó el aprendizaje profundo, un subconjunto del aprendizaje automático, para procesar imágenes y compilar los datos. Aprendizaje automático usa computadoras para detectar patrones en cantidades masivas de datos, luego hace predicciones basadas en lo que la computadora aprende de esos patrones. En el aprendizaje profundo, el sistema informático crea sus propios algoritmos en lugar de utilizar algoritmos desarrollados e introducidos por un ser humano.

Una vez que el  base de datos nacional de parques de casas móviles fue compilado, FEMA solicitó una base de datos de estructuras más completa.

El proceso comenzó con un flujo de imágenes de alta resolución de un proveedor comercial de imágenes satelitales y algunos preprocesamientos. Las imágenes sin procesar debían coincidir con las variaciones reales del terreno, un proceso llamado ortorrectificación, y agudizarse para mejorar la resolución. Ese proceso tomó la imagen de una resolución espacial de 2 a 3 metros a los 0.3 metros necesarios para la extracción de características.

La resolución espacial es similar a la que se ve en Google Maps; los artículos que tienen unos pocos metros de tamaño son reconocibles para el ojo humano. Una vez preparadas, las imágenes ingresaron a una canalización de extracción de características alojada en un clúster de GPU dentro del entorno de computación y datos para la ciencia de ORNL, o CADES, que ofrece servicios de datos de alto rendimiento para investigadores de todo el laboratorio.

Para poner en marcha el modelo de aprendizaje profundo, los científicos le dieron al sistema una variedad de imágenes marcadas o datos de entrenamiento para estudiar. Al funcionar como una red neuronal profunda, el modelo de aprendizaje automático se entrenó para analizar entradas similares.

Hasta la fecha, se han incorporado al modelo de USA Structures más de 59,000 XNUMX ejemplos de capacitación que representan una amplia y diversa gama de características geográficas. A medida que el equipo comenzó a trabajar en un nuevo estado, prepararon el conjunto de capacitación con nuevos ejemplos específicos de la región, además de los datos de capacitación acumulativos para los estados anteriores.

Las ganancias en la producción en los últimos años provinieron del hardware y la potencia de cómputo continuamente mejorados de ORNL, los avances realizados en el aprendizaje profundo y un volumen creciente de datos de entrenamiento que informan el modelo basado en inteligencia artificial. A medida que avanzaba el proyecto, los mapas se volvieron más precisos, requirieron menos intervención humana, y el tiempo que se tardó en procesar las imágenes se hizo cada vez más corto.

Las redes neuronales convolucionales comprimieron en minutos un proceso que habría tomado muchos años por mano humana. Hasta la fecha, el equipo ha procesado 1.1 petabytes de imágenes, uniendo y describiendo el equivalente a mil millones de fotografías digitales.

Una vez completada la extracción de características, los investigadores recurrieron a proveedores comerciales de datos de parcelas para fusionar la información del uso del suelo directamente con las características del edificio de USA Structures.

“Esa información adicional, cuando está disponible, hace que los datos de las estructuras sean más poderosos. ¿Esa plaza es una casa, un almacén o una iglesia? Cada uno de ellos tiene diferentes implicaciones en un desastre”, dijo Christopher.

Si no se disponía de datos fiables sobre el uso de la tierra, el equipo utilizó un modelo de aprendizaje automático independiente para distinguir las estructuras residenciales de las no residenciales. Las estructuras también se describen con otros atributos, como un identificador de edificio único, pies cuadrados, longitud y latitud.

“Tomamos mucho tiempo para verificar que todo lo que estamos entregando a FEMA es de la más alta calidad que podemos brindar”, dijo Yang.

Esta potente el conjunto de datos de código abierto está disponible públicamente de la GeoPlataforma del gobierno de EE.UU. Además, el Servicio Geológico de EE. UU. ha añadido los datos a el Mapa Nacional, un esfuerzo de colaboración entre agencias y socios de EE. UU. para entregar información topográfica. El equipo de ORNL espera que el acceso abierto a los datos sea útil para las instituciones académicas para la investigación y para las pequeñas agencias municipales para la planificación de riesgos.

“Es posible que muchos condados rurales y jurisdicciones pequeñas no tengan el presupuesto para recopilar o comprar este tipo de datos”, dijo Christopher. “Podría ser utilizado por socorristas o proveedores de servicios básicos. También podría aplicarse a las necesidades a nivel de condado para la planificación urbana o la tasación de propiedades”.

Los investigadores de ORNL en el proyecto incluyen a Taylor Hauser, Benjamin Swan, Andrew Reith, Matthew Whitehead, Jessica Moehl, Erik Schmidt y Bennet Morris. Otros colaboradores incluyen a Brad Miller, Matthew Crockett y Katie Heying.

En la próxima fase del proyecto, el equipo espera completar los dos atributos clave (tipos de ocupación y direcciones) para el resto de los estados y abordar la información de altura y elevación necesaria para el modelado de inundaciones.

Desarrollar un proceso sostenible para detectar e incorporar cambios a lo largo del tiempo será clave para extender la vida útil del conjunto de datos. Además, este poderoso modelo podría usarse para propósitos similares en todo el mundo en la planificación y respuesta a desastres o combinarse con otra tecnología de detección para extraer otra información útil.

Chris Vaughan, socio del proyecto de Yang en FEMA, ha sido un entusiasta defensor de USA Structures, promoviendo su uso y promocionando el esquema consistente y la accesibilidad de los datos.

“Las operaciones de desastre requieren un conjunto de datos de estructura estandarizados y accesibles para ayudar a optimizar la asistencia a los sobrevivientes. El trabajo de ORNL en USA Structures nos ha ayudado a compartir datos de incidentes con nuestros socios interinstitucionales como nunca antes”, dijo Vaughan. “Además, nos están ayudando a cerrar las brechas de datos de larga data relacionadas con las poblaciones vulnerables, lo cual es una prioridad principal para nuestro equipo”.

Yang ha visto un creciente interés de las agencias federales, las organizaciones de investigación, los gobiernos locales y los profesionales no solo en usar el conjunto de datos, sino también en contribuir e incorporar datos de proyectos locales más pequeños.

“Este proyecto aún está evolucionando y esperamos continuar con actualizaciones importantes de los datos actuales”, dijo. “Esperamos que más comunidades utilicen los datos. Ya se ha demostrado que es valioso a través del trabajo de FEMA, pero puede haber otras aplicaciones que tengan un impacto aún mayor”.

UT-Batelle gestiona ORNL para la Oficina de Ciencias del Departamento de Energía, el mayor patrocinador individual de la investigación básica en ciencias físicas en los Estados Unidos. La Oficina de Ciencias está trabajando para abordar algunos de los desafíos más apremiantes de nuestro tiempo. Para mayor información por favor visite energía.gov/ciencia.

Originalmente publicado por Laboratorio Nacional Oak Ridge.

 

¿Aprecia la originalidad de CleanTechnica y la cobertura de noticias de tecnología limpia? Considere convertirse en un Miembro, colaborador, técnico o embajador de CleanTechnica - o un mecenas en Patreon.

 


¿No quiere perderse una historia de tecnología limpia? Matricularse en actualizaciones diarias de noticias de CleanTechnica en el correo electrónico O Síguenos en Google Noticias!

 


¿Tiene un consejo para CleanTechnica, quiere publicitar o quiere sugerir un invitado para nuestro podcast CleanTech Talk? Contáctenos aquí.


Anuncio

 


punto_img

Información más reciente

punto_img