Logotipo de Zephyrnet

Potenciar el valor de los datos en 2024 – DATAVERSITY

Fecha:

Sin lugar a dudas, iniciativas como la IA generativa (GenAI) y la migración a la nube han atraído la mayor parte de la atención entre personas influyentes y líderes de datos este año, mientras las organizaciones intentaban determinar cómo y si tenían sentido para su negocio. Parece que esta tendencia continuará en 2024, ya que casi todas las principales predicciones estratégicas de Gartner giran en torno a la IA y su impacto. Además, la firma de analistas comenta que para 2027, el valor de productividad de la IA será reconocido como un indicador económico primario del poder nacional.

Si bien no se debe ignorar el rumor generativo de la IA, como cualquier estrategia de datos, es fundamental que los profesionales de datos y análisis tengan muy claras sus prioridades y estén alineados con los planes, prioridades y objetivos de negocio. 

El próximo año, las organizaciones evaluarán y modernizarán las prácticas de gestión de datos para impulsar mejores resultados comerciales; determinar cuándo implementar la IA; comprender mejor el papel que desempeñan los metadatos semánticos en las estructuras de datos; y acelerar la adopción de gráficos de conocimiento – que será impulsado por modelos de lenguajes grandes (LLM) y la convergencia de gráficos de propiedades etiquetadas (LPG) y marcos de descripción de recursos (RDF). 

En 2024, las tendencias en la gestión de datos y conocimientos incluirán:

1. Las organizaciones (por fin) gestionarán el revuelo en torno a la IA.

A medida que el ruido ensordecedor en torno a GenAI alcance un crescendo, las organizaciones se verán obligadas a moderar el revuelo y fomentar un enfoque realista y responsable hacia esta tecnología disruptiva. Ya sea que se trate de una crisis de IA relacionada con la escasez de GPU, los efectos climáticos del entrenamiento de grandes modelos de lenguaje (LLM) o preocupaciones sobre la privacidad, la ética, los prejuicios y/o la gobernanza, estos desafíos empeorarán antes de mejorar, lo que lleva a muchos a preguntarse si es Vale la pena aplicar GenAI en primer lugar.

Si bien las presiones corporativas pueden impulsar a las organizaciones a “hacer algo con la IA”, estar basado en datos debe ser lo primero y seguir siendo la máxima prioridad. Después de todo, garantizar que los datos fundamentales estén organizados, compartibles e interconectados es tan crítico como preguntar si los modelos GenAI son confiables, confiables, deterministas, explicables, éticos y libres de sesgos. 

Antes de implementar soluciones GenAI en producción, las organizaciones deben asegurarse de proteger su propiedad intelectual y planificar posibles problemas de responsabilidad. Esto se debe a que, si bien GenAI puede reemplazar a las personas en algunos casos, no existe un seguro de responsabilidad profesional para los LLM. Esto significa que los procesos de negocio que involucran GenAI seguirán requiriendo una amplia participación de “humanos involucrados” que pueden contrarrestar cualquier ganancia de eficiencia. 

En 2024, se espera que los proveedores aceleren las mejoras en sus ofertas de productos agregando nuevas interfaces enfocadas en satisfacer la tendencia del mercado GenAI. Sin embargo, las organizaciones deben ser conscientes de que pueden no ser más que tiritas atornilladas. Abordar desafíos como la calidad de los datos y garantizar un acceso unificado y semánticamente consistente a datos precisos y confiables requerirá establecer una estrategia de datos clara, así como adoptar un enfoque realista impulsado por el negocio. Sin esto, las organizaciones seguirán pagando un “impuesto a los datos incorrectos”, ya que los modelos de IA/ML tendrán dificultades para superar una prueba de concepto y, en última instancia, no cumplirán con las expectativas.

2. La adopción de gráficos de conocimiento se acelerará debido a los LLM y la convergencia tecnológica.

Un factor clave que frena la adopción de los gráficos de conocimiento (KG) es el extenso (y costoso) proceso de desarrollo de los modelos de dominio necesarios. Los LLM pueden optimizar varias tareas que van desde la evolución de taxonomías, clasificar entidades y extraer nuevas propiedades y relaciones a partir de datos no estructurados. Si se realizan correctamente, los LLM podrían reducir los costos de extracción de información, ya que las herramientas y la metodología adecuadas pueden gestionar la calidad de los procesos de análisis de texto y arrancar/evolucionar los KG con una fracción del esfuerzo requerido actualmente. Los LLM también facilitarán el consumo de KG mediante la aplicación de consultas y resúmenes en lenguaje natural.

Los gráficos de propiedades etiquetados y los marcos de descripción de recursos también ayudarán a impulsar la adopción de los gráficos de conocimiento, ya que cada uno de ellos son modelos de datos potentes con fuertes sinergias cuando se combinan. Entonces, si bien RDF y LPG están optimizados para diferentes cosas, los administradores de datos y los proveedores de tecnología se están dando cuenta de que juntos brindan un enfoque integral y flexible para el modelado y la integración de datos. La combinación de estas pilas de tecnología de gráficos permitirá a las empresas crear mejores prácticas de gestión de datos, donde el análisis de datos, la gestión de metadatos y datos de referencia, el intercambio y la reutilización de datos se manejen de una manera eficiente y preparada para el futuro. Una vez que se crea una base gráfica eficaz, se puede reutilizar y reutilizar en todas las organizaciones para ofrecer resultados a nivel empresarial, en lugar de limitarse a implementaciones de KG desconectadas.

A medida que las tecnologías innovadoras y emergentes, como los gemelos digitales, la IoT, la IA y el aprendizaje automático, ganen más popularidad, la gestión de datos será aún más importante. Al utilizar las capacidades LPG y RDF juntas, las organizaciones pueden representar relaciones de datos complejas entre los modelos de IA y ML, así como rastrear datos de IoT para respaldar estos nuevos casos de uso. Además, con el aumento de la escala y la diversidad de los datos, esta combinación también abordará la necesidad de un mejor rendimiento.

Como resultado, se espera que la adopción de gráficos de conocimiento continúe creciendo en 2024 a medida que las empresas busquen conectar, procesar, analizar y consultar los conjuntos de datos de gran volumen que se encuentran actualmente en uso. 

3. El tejido de datos alcanzará la mayoría de edad y empleará metadatos semánticos.

Las buenas decisiones dependen de datos compartidos, especialmente los datos correctos en el momento adecuado. A veces, el desafío que se enfrenta es que los datos en sí plantean más preguntas de las que responden. Esta tendencia seguirá empeorando antes de mejorar, a medida que los ecosistemas de datos inconexos con herramientas, plataformas y silos de datos desconectados se vuelven cada vez más desafiantes para las empresas. Es por eso que el concepto de data fabric ha surgido como un método para gestionar y compartir mejor sus datos.

El objetivo holístico de Data Fabric es la culminación de herramientas de gestión de datos diseñadas para gestionar los datos desde su identificación, acceso, limpieza, enriquecimiento, transformación, gobierno y análisis. Es una tarea difícil y llevará varios años madurar antes de que se adopte en todas las empresas.

Las soluciones actuales no se desarrollaron completamente para cumplir todas las promesas de un tejido de datos. El próximo año, las organizaciones incorporarán gráficos de conocimiento e inteligencia artificial para la gestión de metadatos con el fin de mejorar las ofertas actuales y serán un criterio clave para hacerlas más efectivas. Los metadatos semánticos servirán como factor habilitante para la gestión descentralizada de datos, siguiendo el paradigma de la malla de datos. También proporcionará un contexto formal sobre el significado de los elementos de datos que se gobiernan de forma independiente, que cumplen diferentes funciones comerciales y que incorporan diferentes lógicas y suposiciones comerciales. Además, estas soluciones evolucionarán e incorporarán análisis de metadatos de autoaprendizaje, impulsando la identificación de patrones de utilización de datos para optimizar, automatizar y acceder a datos específicos del dominio a través de productos de datos.  

Los problemas de seguridad, acceso, gobernanza y sesgos de los datos continúan afectando de manera rutinaria a los negocios diarios, y con la IA generativa recibiendo tanta atención, las organizaciones buscarán aprovechar un tejido de datos impulsado por tecnologías semánticas para reducir el costo de propiedad y los costos operativos, al tiempo que mejoran los datos. compartir y confiar.

punto_img

Información más reciente

punto_img