Logotipo de Zephyrnet

Cree una plataforma de datos agronómicos con las capacidades geoespaciales de Amazon SageMaker

Fecha:

El mundo corre un riesgo cada vez mayor de escasez mundial de alimentos como consecuencia del conflicto geopolítico, las interrupciones de la cadena de suministro y el cambio climático. Simultáneamente, hay un aumento en la demanda general por el crecimiento de la población y el cambio de dietas que se enfocan en alimentos ricos en nutrientes y proteínas. Para satisfacer el exceso de demanda, los agricultores deben maximizar el rendimiento de los cultivos y administrar de manera efectiva las operaciones a escala, utilizando tecnología de agricultura de precisión para mantenerse a la vanguardia.

Históricamente, los agricultores se han basado en el conocimiento heredado, el ensayo y error y el asesoramiento agronómico no prescriptivo para tomar decisiones. Las decisiones clave incluyen qué cultivos plantar, cuánto fertilizante aplicar, cómo controlar las plagas y cuándo cosechar. Sin embargo, con una demanda creciente de alimentos y la necesidad de maximizar el rendimiento de la cosecha, los agricultores necesitan más información además del conocimiento heredado. Las tecnologías innovadoras como la detección remota, IoT y la robótica tienen el potencial de ayudar a los agricultores a superar la toma de decisiones heredada. Las decisiones basadas en datos impulsadas por conocimientos casi en tiempo real pueden permitir a los agricultores cerrar la brecha en el aumento de la demanda de alimentos.

Si bien los agricultores tradicionalmente han recopilado datos manualmente de sus operaciones mediante el registro de datos de equipo y rendimiento o tomando notas de las observaciones de campo, los desarrolladores de plataformas de datos agronómicos en AWS ayudan a los agricultores a trabajar con sus asesores agronómicos de confianza para usar esos datos a escala. Los campos pequeños y las operaciones permiten que un agricultor vea más fácilmente todo el campo para buscar problemas que afecten el cultivo. Sin embargo, no es factible explorar cada campo con frecuencia en busca de campos y granjas grandes, y la mitigación de riesgos exitosa requiere una plataforma integrada de datos agronómicos que pueda brindar información a escala. Estas plataformas ayudan a los agricultores a dar sentido a sus datos al integrar información de múltiples fuentes para su uso en aplicaciones de visualización y análisis. Los datos geoespaciales, incluidas las imágenes satelitales, los datos del suelo, el clima y los datos topográficos, se superponen junto con los datos recopilados por los equipos agrícolas durante las operaciones de siembra, aplicación de nutrientes y cosecha. Al desbloquear información a través de análisis de datos geoespaciales mejorados, visualizaciones de datos avanzadas y automatización de flujos de trabajo a través de la tecnología de AWS, los agricultores pueden identificar áreas específicas de sus campos y cultivos que están experimentando un problema y tomar medidas para proteger sus cultivos y operaciones. Estos conocimientos oportunos ayudan a los agricultores a trabajar mejor con sus agrónomos de confianza para producir más, reducir su huella ambiental, mejorar su rentabilidad y mantener su tierra productiva para las generaciones venideras.

En esta publicación, analizamos cómo puede utilizar las predicciones generadas a partir de Capacidades geoespaciales de Amazon SageMaker en una interfaz de usuario de una plataforma de datos agronómicos. Además, discutimos cómo los equipos de desarrollo de software están agregando conocimientos avanzados basados ​​en aprendizaje automático (ML), incluidos algoritmos de detección remota, enmascaramiento de nubes (detectando automáticamente nubes dentro de imágenes satelitales) y canalizaciones de procesamiento de imágenes automatizadas, a sus plataformas de datos agronómicos. Juntas, estas adiciones ayudan a los agrónomos, desarrolladores de software, ingenieros de ML, científicos de datos y equipos de detección remota a proporcionar valiosos sistemas escalables de apoyo a la toma de decisiones para los agricultores. Esta publicación también proporciona un ejemplo de cuaderno de extremo a extremo y Repositorio GitHub que demuestra las capacidades geoespaciales de SageMaker, incluida la segmentación de campos agrícolas basada en ML y modelos geoespaciales preentrenados para la agricultura.

Agregar información y predicciones geoespaciales a las plataformas de datos agronómicos

Los modelos matemáticos y agronómicos establecidos combinados con imágenes satelitales permiten la visualización de la salud y el estado de un cultivo por imagen satelital, píxel por píxel, a lo largo del tiempo. Sin embargo, estos modelos establecidos requieren acceso a imágenes satelitales que no estén obstruidas por nubes u otras interferencias atmosféricas que reduzcan la calidad de la imagen. Sin identificar y eliminar las nubes de cada imagen procesada, las predicciones y los conocimientos tendrán inexactitudes significativas y las plataformas de datos agronómicos perderán la confianza del agricultor. Debido a que los proveedores de plataformas de datos agronómicos suelen atender a clientes que comprenden miles de campos agrícolas en diversas geografías, las plataformas de datos agronómicos requieren visión por computadora y un sistema automatizado para analizar, identificar y filtrar nubes u otros problemas atmosféricos dentro de cada imagen satelital antes de continuar con el procesamiento o proporcionar análisis. A los consumidores.

Desarrollar, probar y mejorar los modelos de visión por computadora ML que detectan nubes y problemas atmosféricos en imágenes satelitales presenta desafíos para los desarrolladores de plataformas de datos agronómicos. En primer lugar, crear canalizaciones de datos para ingerir imágenes satelitales requiere tiempo, recursos de desarrollo de software e infraestructura de TI. Cada proveedor de imágenes satelitales puede diferir mucho entre sí. Los satélites frecuentemente recolectan imágenes en diferentes resoluciones espaciales; las resoluciones pueden variar desde muchos metros por píxel hasta imágenes de muy alta resolución medidas en centímetros por píxel. Además, cada satélite puede recopilar imágenes con diferentes bandas multiespectrales. Algunas bandas se han probado exhaustivamente y muestran una fuerte correlación con los indicadores de desarrollo y salud de las plantas, y otras bandas pueden ser irrelevantes para la agricultura. Las constelaciones de satélites vuelven a visitar el mismo lugar en la tierra a diferentes velocidades. Las constelaciones pequeñas pueden volver a visitar un campo cada semana o más, y las constelaciones más grandes pueden volver a visitar la misma área varias veces al día. Estas diferencias en las imágenes y frecuencias satelitales también generan diferencias en las capacidades y funciones de la API. Combinadas, estas diferencias significan que las plataformas de datos agronómicos pueden necesitar mantener múltiples canalizaciones de datos con metodologías de ingestión complejas.

En segundo lugar, una vez que las imágenes se ingieren y se ponen a disposición de los equipos de detección remota, los científicos de datos y los agrónomos, estos equipos deben participar en un proceso que requiere mucho tiempo para acceder, procesar y etiquetar cada región dentro de cada imagen como nublada. Con miles de campos repartidos en diversas geografías y múltiples imágenes satelitales por campo, el proceso de etiquetado puede llevar mucho tiempo y debe capacitarse continuamente para tener en cuenta la expansión del negocio, los nuevos campos de clientes o las nuevas fuentes de imágenes.

Acceso integrado a imágenes y datos satelitales de Sentinel para ML

Mediante el uso de capacidades geoespaciales de SageMaker para el desarrollo de modelos ML de detección remota y mediante el consumo de imágenes satelitales de la Intercambio de datos de AWS público convenientemente disponible Servicio de almacenamiento simple de Amazon (Amazon S3), los creadores de plataformas de datos agronómicos en AWS pueden lograr sus objetivos de forma más rápida y sencilla. Su depósito S3 siempre tiene las imágenes satelitales más actualizadas de Sentinel-1 y Sentinel-2 porque Open Data Exchange y el Iniciativa de datos de sostenibilidad de Amazon proporcionarle acceso integrado automatizado a imágenes satelitales.

El siguiente diagrama ilustra esta arquitectura.

El siguiente diagrama ilustra esta arquitectura.

Las capacidades geoespaciales de SageMaker incluyen modelos de redes neuronales profundas preentrenadas integradas, como la clasificación del uso del suelo y el enmascaramiento de nubes, con un catálogo integrado de fuentes de datos geoespaciales que incluye imágenes satelitales, mapas y datos de ubicación de AWS y de terceros. Con un catálogo de datos geoespaciales integrado, los clientes geoespaciales de SageMaker tienen un acceso más fácil a imágenes satelitales y otros conjuntos de datos geoespaciales que eliminan la carga de desarrollar canalizaciones complejas de ingesta de datos. Este catálogo de datos integrado puede acelerar la creación de su propio modelo y el procesamiento y enriquecimiento de conjuntos de datos geoespaciales a gran escala con operaciones especialmente diseñadas, como estadísticas de tiempo, remuestreo, creación de mosaicos y geocodificación inversa. La capacidad de ingerir fácilmente imágenes de Amazon S3 y usar modelos ML geoespaciales preentrenados de SageMaker que identifican nubes y califican automáticamente cada imagen satelital Sentinel-2 elimina la necesidad de involucrar a equipos de teledetección, agronomía y ciencia de datos para ingerir, procesar y etiqueta manualmente miles de imágenes de satélite con regiones nubladas.

Las capacidades geoespaciales de SageMaker admiten la capacidad de definir un área de interés (AOI) y una hora de interés (TOI), buscar en el archivo de depósito de Open Data Exchange S3 imágenes con una intersección geoespacial que cumpla con la solicitud y devolver imágenes en color verdadero, Índice de vegetación de diferencia normalizada (NDVI), detección de nubes y puntajes, y cobertura terrestre. NDVI es un índice común utilizado con imágenes satelitales para comprender la salud de los cultivos mediante la visualización de mediciones de la cantidad de clorofila y actividad fotosintética a través de una imagen recién procesada y codificada por colores.

Los usuarios de las capacidades geoespaciales de SageMaker pueden usar el índice NDVI preconstruido o desarrollar uno propio. Las capacidades geoespaciales de SageMaker facilitan que los científicos de datos y los ingenieros de ML creen, entrenen e implementen modelos de ML más rápido y a escala utilizando datos geoespaciales y con menos esfuerzo que antes.

Los agricultores y agrónomos necesitan un acceso rápido a la información en el campo y en el hogar

La entrega inmediata de imágenes e información procesadas a los agricultores y las partes interesadas es importante para las empresas agrícolas y la toma de decisiones en el campo. La identificación de áreas de mala salud de los cultivos en cada campo durante períodos de tiempo críticos permite al agricultor mitigar los riesgos mediante la aplicación de fertilizantes, herbicidas y pesticidas donde sea necesario, e incluso identificar áreas de posibles reclamos de seguros de cultivos. Es común que las plataformas de datos agronómicos comprendan un conjunto de aplicaciones, incluidas aplicaciones web y aplicaciones móviles. Estas aplicaciones proporcionan interfaces de usuario intuitivas que ayudan a los agricultores y sus partes interesadas de confianza a revisar de forma segura cada uno de sus campos e imágenes mientras están en casa, en la oficina o en el mismo campo. Sin embargo, estas aplicaciones web y móviles necesitan consumir y mostrar rápidamente imágenes procesadas e información agronómica a través de API.

Puerta de enlace API de Amazon facilita a los desarrolladores la creación, publicación, mantenimiento, supervisión y protección de las API RESTful y WebSocket a escala. Con API Gateway, el acceso a la API y la autorización están integrados con Administración de acceso de identidad de AWS (IAM) y ofrece compatibilidad nativa con OIDC y OAuth2, así como Cognito Amazonas. Cognito Amazonas es un servicio rentable de administración de acceso e identidad del cliente (CIAM) que admite un almacén de identidad seguro con opciones de federación que se puede escalar a millones de usuarios.

Las imágenes satelitales sin procesar y sin procesar pueden ser muy grandes, en algunos casos cientos de megabytes o incluso gigabytes por imagen. Debido a que muchas áreas agrícolas del mundo tienen poca o ninguna conectividad celular, es importante procesar y entregar imágenes e información en formatos más pequeños y en formas que limiten el ancho de banda requerido. Por lo tanto, al usar AWS Lambda para implementar un servidor de teselas, se pueden devolver archivos GeoTIFF, JPEG u otros formatos de imágenes de tamaño más pequeño en función de la vista de mapa actual que se muestra al usuario, a diferencia de los tamaños y tipos de archivo mucho más grandes que reducen el rendimiento. Al combinar un servidor de teselas implementado a través de funciones Lambda con API Gateway para administrar solicitudes de aplicaciones web y móviles, los agricultores y sus partes interesadas de confianza pueden consumir imágenes y datos geoespaciales de uno o cientos de campos a la vez, con latencia reducida y lograr un usuario óptimo. experiencia.

Se puede acceder a las capacidades geoespaciales de SageMaker a través de una interfaz de usuario intuitiva que le permite acceder fácilmente a un amplio catálogo de datos geoespaciales, transformar y enriquecer datos, capacitar o usar modelos creados específicamente, implementar modelos para predicciones y visualizar y explorar datos en mapas integrados e imágenes satelitales. Para obtener más información sobre la experiencia de usuario geoespacial de SageMaker, consulte Cómo Xarvio aceleró las canalizaciones de datos espaciales para la agricultura digital con las capacidades geoespaciales de Amazon SageMaker.

Las plataformas de datos agronómicos proporcionan varias capas de datos e información a escala

La siguiente interfaz de usuario de ejemplo demuestra cómo un creador de plataformas de datos agronómicos puede integrar los conocimientos proporcionados por las capacidades geoespaciales de SageMaker.

Capacidades geoespaciales de SageMaker

Esta interfaz de usuario de ejemplo muestra las superposiciones de datos geoespaciales comunes consumidas por los agricultores y las partes interesadas agrícolas. Aquí, el consumidor ha seleccionado tres superposiciones de datos separadas. Primero, la imagen satelital de color natural Sentinel-2 subyacente tomada en octubre de 2020 y disponible a través del catálogo de datos geoespaciales integrado de SageMaker. Esta imagen se filtró utilizando el modelo geoespacial preentrenado de SageMaker que identifica la cobertura de nubes. La segunda superposición de datos es un conjunto de límites de campo, representado con un contorno blanco. Un límite de campo es comúnmente un polígono de coordenadas de latitud y longitud que refleja la topografía natural de un campo agrícola o un límite operativo que diferencia entre planes de cultivo. La tercera superposición de datos son datos de imágenes procesadas en forma de Índice de vegetación de diferencia normalizada (NDVI). Además, las imágenes de NDVI se superponen en el límite del campo respectivo y se muestra un gráfico de clasificación de colores de NDVI en el lado izquierdo de la página.

La siguiente imagen muestra los resultados utilizando un modelo previamente entrenado de SageMaker que identifica la cobertura de nubes.

Modelo preentrenado de SageMaker que identifica la cobertura de nubes

En esta imagen, el modelo identifica nubes dentro de la imagen satelital y aplica una máscara amarilla sobre cada nube dentro de la imagen. Al eliminar los píxeles enmascarados (nubes) del procesamiento posterior de imágenes, los análisis y productos posteriores han mejorado la precisión y brindan valor a los agricultores y sus asesores de confianza.

En áreas de poca cobertura celular, la reducción de la latencia mejora la experiencia del usuario

Para abordar la necesidad de baja latencia al evaluar datos geoespaciales e imágenes de teledetección, puede utilizar Amazon ElastiCache para almacenar en caché las imágenes procesadas recuperadas de las solicitudes de teselas realizadas a través de Lambda. Al almacenar las imágenes solicitadas en una memoria caché, la latencia se reduce aún más y no es necesario volver a procesar las solicitudes de imágenes. Esto puede mejorar el rendimiento de la aplicación y reducir la presión sobre las bases de datos. Porque Amazon ElastiCache admite muchas opciones de configuración para estrategias de almacenamiento en caché, replicación entre regiones y escalado automático, los proveedores de plataformas de datos agronómicos pueden escalar rápidamente en función de las necesidades de la aplicación y continuar logrando rentabilidad pagando solo lo que se necesita.

Conclusión

Esta publicación se centró en el procesamiento de datos geoespaciales, la implementación de conocimientos de detección remota habilitados para ML y las formas de optimizar y simplificar el desarrollo y la mejora de las plataformas de datos agronómicos en AWS. Ilustró varios métodos y servicios que los desarrolladores de plataformas de datos agronómicos en los servicios de AWS pueden usar para lograr sus objetivos, incluidos SageMaker, Lambda, Amazon S3, Open Data Exchange y ElastiCache.

Para seguir un cuaderno de ejemplo completo que demuestra las capacidades geoespaciales de SageMaker, acceda al cuaderno de ejemplo disponible en el siguiente Repositorio GitHub. Puede revisar cómo identificar campos agrícolas a través de modelos de segmentación ML, o explorar los modelos geoespaciales preexistentes de SageMaker y la funcionalidad traer su propio modelo (BYOM) en tareas geoespaciales como el uso del suelo y la clasificación de la cobertura del suelo. El cuaderno de ejemplo de extremo a extremo se analiza en detalle en la publicación complementaria Cómo Xarvio aceleró las canalizaciones de datos espaciales para la agricultura digital con Amazon SageMaker Geospatial.

Comuníquese con nosotros para obtener más información sobre cómo la industria agrícola está resolviendo problemas importantes relacionados con el suministro mundial de alimentos, la trazabilidad y las iniciativas de sostenibilidad mediante el uso de la nube de AWS.


Sobre los autores

Will Conrado es el Jefe de Soluciones para la Industria Agrícola en AWS. Le apasiona ayudar a los clientes a usar la tecnología para mejorar los medios de vida de los agricultores, el impacto ambiental de la agricultura y la experiencia del consumidor para las personas que comen alimentos. En su tiempo libre, arregla cosas, juega al golf y recibe órdenes de sus cuatro hijos.

Bishish Adhikari es arquitecto de creación de prototipos de aprendizaje automático en el equipo de creación de prototipos de AWS. Trabaja con los clientes de AWS para crear soluciones en varios casos de uso de inteligencia artificial y aprendizaje automático para acelerar su viaje a la producción. En su tiempo libre, le gusta caminar, viajar y pasar tiempo con su familia y amigos.

priyanka mahankali es Arquitecto de Soluciones de Orientación en AWS durante más de 5 años creando soluciones intersectoriales que incluyen tecnología para clientes agrícolas globales. Le apasiona traer casos de uso de vanguardia a la vanguardia y ayudar a los clientes a crear soluciones estratégicas en AWS.

ron osborne es AWS Global Technology Lead for Agriculture - WWSO y Senior Solution Architect. Ron se enfoca en ayudar a los clientes y socios de agronegocios de AWS a desarrollar e implementar soluciones seguras, escalables, resilientes, elásticas y rentables. Ron es un entusiasta de la cosmología, un innovador establecido dentro de la tecnología agrícola y le apasiona posicionar a los clientes y socios para la transformación empresarial y el éxito sostenible.

punto_img

Información más reciente

punto_img