Logotipo de Zephyrnet

Gráficos de conocimiento 101: la historia (y los beneficios) detrás del revuelo – DATAVERSITY

Fecha:

Los gráficos de conocimiento, si bien no son tan conocidos como otras ofertas de gestión de datos, son una solución dinámica y escalable comprobada para abordar los requisitos de gestión de datos empresariales en varios sectores verticales. Como centro de datos, metadatos y contenido, proporcionan una visión unificada, coherente e inequívoca de los datos dispersos en diferentes sistemas. Utilizando el conocimiento global como contexto para la interpretación y fuente de enriquecimiento, también optimizan la información patentada para que las organizaciones puedan mejorar la toma de decisiones y realizar correlaciones que antes no estaban disponibles entre sus activos de datos. 

Las organizaciones ya saben que los datos que necesitan gestionar son demasiado diversos, dispersos y en volúmenes insondables hace sólo una década. Esto a menudo hace que se pierdan conocimientos y oportunidades de negocio en medio de una complejidad enredada de datos y contenidos aislados y sin sentido. Los gráficos de conocimiento ayudan a superar estos desafíos al unificar el acceso a los datos, proporcionar una integración de datos flexible y automatizar la gestión de datos. El uso de gráficos de conocimiento tiene un efecto enorme en varios sistemas y procesos, por eso Garner predice que para 2025, las tecnologías gráficas se utilizarán en el 80% de las innovaciones de datos y análisis, frente al 10% en 2021, lo que facilitará una rápida toma de decisiones en toda la empresa. 

Definición de gráficos de conocimiento y por qué son importantes la semántica (y las ontologías)

Según la  Wikipedia , un gráfico de conocimiento es una base de conocimiento que utiliza una topología o modelo de datos estructurados por gráficos para representar y operar con datos. El corazón del gráfico de conocimiento es un modelo de conocimiento: una colección de descripciones interconectadas de conceptos, entidades, relaciones y eventos donde:

  • Las descripciones tienen una semántica formal que permite que tanto las personas como las computadoras las procesen de manera eficiente y sin ambigüedades.
  • Las descripciones se contribuyen entre sí, formando una red, donde cada entidad representa parte de la descripción de las entidades relacionadas con ella.
  • Diversos datos están conectados y descritos mediante metadatos semánticos según el modelo de conocimiento.

Al crear una descripción semántica común, un gráfico de conocimiento permite un mayor nivel de abstracción que no depende de la infraestructura física o el formato de los datos. A veces se le conoce como tejido de datos, ofrece una forma unificada, amigable y significativa de acceder e integrar datos internos y externos. Al utilizar metadatos semánticos, los gráficos de conocimiento brindan una visión consistente de diversos datos empresariales, interconectando el conocimiento que se ha distribuido en diferentes sistemas y partes interesadas. 

Con la ayuda del procesamiento del lenguaje natural (NLP), los documentos de texto también se pueden integrar con gráficos de conocimiento. Dado que muchos investigadores dicen que entre el 75% y el 85% del conocimiento de una organización está encerrado en documentos estáticos, se está perdiendo un enorme valor y sabiduría. Los canales de PNL se benefician enormemente, ya que se pueden utilizar métodos sofisticados de análisis de texto al combinar el aprendizaje automático con gráficos de conocimiento. Los gráficos de conocimiento también son esenciales para cualquier IA semántica y estrategia de IA explicable.

Ontologías son igualmente importantes, ya que representan la columna vertebral de la semántica formal de un gráfico de conocimiento. Como esquema de datos del gráfico, sirven como un contrato entre los desarrolladores del gráfico de conocimiento y sus usuarios con respecto al significado de los datos. Un usuario podría ser otro ser humano o una aplicación de software que necesite interpretar los datos de forma fiable y precisa. Las ontologías aseguran una comprensión compartida de los datos y sus significados. Cuando se utiliza la semántica formal para expresar e interpretar los datos de un gráfico de conocimiento, existen varios instrumentos de representación y modelado: 

  • clases: Muy a menudo, una descripción de entidad contiene una clasificación de la entidad relativa a una jerarquía de clases. Por ejemplo, cuando se trata de noticias generales o información comercial, podría haber clases que incluyan Persona, Organización y Ubicación. Las personas y organizaciones pueden tener un agente de superclase común. La ubicación suele tener numerosas subclases, por ejemplo, país, lugar poblado, ciudad, etc. 
  • Relaciones: Las relaciones entre entidades suelen estar etiquetadas con tipos, que proporcionan información sobre la naturaleza de la relación, por ejemplo, amigo, pariente, competidor, etc. 
  • Categorías: Una entidad puede asociarse con categorías que describen algún aspecto de su semántica, por ejemplo, “Cuatro Grandes consultores” o “compositores del siglo XIX”. Un libro puede pertenecer simultáneamente a todas estas categorías: “Libros sobre África”, “Bestseller”, “Libros de autores italianos”, “Libros para niños”, etc. A menudo, las categorías se describen y ordenan en una taxonomía. 
  • Texto libre: Es posible agregar "texto amigable para los humanos" para aclarar aún más las intenciones de diseño de la entidad y mejorar la búsqueda.

Gráficos de conocimiento en el marco de descripción de recursos (RDF)

Resource Description Framework es un estándar para describir recursos web e intercambio de datos, desarrollado y estandarizado con el World Wide Web Consortium (W3C). Además de RDF, el modelo de gráfico de propiedades etiquetado (LPG) proporciona una introducción ligera a la gestión de datos de gráficos. Los GLP a menudo se ganan el corazón de los desarrolladores si es necesario recopilar datos ad hoc y realizar análisis de gráficos en el curso de un solo proyecto, descartándose el gráfico posteriormente. Desafortunadamente, la tecnología en torno a los GLP carece de esquemas estandarizados o lenguajes de modelado y lenguajes de consulta, y no existen disposiciones para semántica formal y especificaciones de interoperabilidad (por ejemplo, sin formatos de serialización, protocolos de federación, etc.).

Mientras que RDF permite hacer declaraciones solo sobre nodos, RDF-Star permite hacer declaraciones sobre otras declaraciones y de esta manera adjuntar metadatos para describir un borde en un gráfico, como puntuaciones, pesos, aspectos temporales y procedencia. Con todo, los gráficos de conocimiento, representados en RDF, proporcionan el mejor marco para la integración, unificación, vinculación y reutilización de datos, porque combinan lo siguiente:

  1. Expresividad: Los estándares de la pila de Web Semántica (RDF(s) y OWL) permiten una representación fluida de varios tipos de datos y contenidos: esquemas de datos, taxonomías, vocabularios, todo tipo de metadatos, referencias y datos maestros. La extensión RDF-star facilita el modelado de procedencia y otros metadatos estructurados. 
  2. Semántica formal: Todos los estándares de la Web Semántica vienen con una semántica bien especificada, que permite a los humanos y a las computadoras interpretar esquemas, ontologías y datos sin ambigüedades. 
  3. Actuación: Todas las especificaciones han sido pensadas y probadas para permitir una gestión eficiente de gráficos de miles de millones de hechos y propiedades.
  4. Interoperabilidad: Existe una variedad de especificaciones para la serialización de datos, el acceso (Protocolo SPARQL para puntos finales), la administración (SPARQL Graph Store) y la federación. El uso de identificadores únicos a nivel mundial facilita la integración y publicación de datos. 
  5. Estandarización: Todo lo anterior está estandarizado a través del proceso de la comunidad W3C, para garantizar que se satisfagan los requisitos de los diferentes actores, desde lógicos hasta profesionales de gestión de datos empresariales y equipos de operaciones de sistemas. 

Sin embargo, es importante tener en cuenta que no todos los gráficos RDF son gráficos de conocimiento. Por ejemplo, un conjunto de datos estadísticos, por ejemplo, los datos del PIB de los países, representados en el RDF no es un gráfico de conocimiento. Una representación gráfica de los datos suele ser útil, pero puede resultar innecesaria para capturar el conocimiento semántico de los datos. También podría ser suficiente que una solicitud tenga simplemente la cadena “Italia” asociada con la cadena “PIB” y el número “1.95 billones de dólares” sin necesidad de definir qué países son o cuál es el Producto Interno Bruto de un país. 

Son las conexiones y el gráfico lo que hace que el conocimiento sea gráfico, no el lenguaje utilizado para representar los datos. Una característica clave de un gráfico de conocimiento es que las descripciones de las entidades deben estar interconectadas entre sí. La definición de una entidad incluye otra entidad. Esta vinculación es la forma en que se forma el gráfico (por ejemplo, A es B; B es C; C tiene D; A tiene D). Las bases de conocimiento sin estructura formal ni semántica, por ejemplo, la “base de conocimiento” de preguntas y respuestas sobre un producto de software, tampoco representan un gráfico de conocimiento. Es posible tener un sistema experto que tenga una colección de datos organizados en un formato que no sea un gráfico pero que utilice procesos deductivos automatizados, como un conjunto de reglas "si-entonces", para facilitar el análisis. 

Los gráficos de conocimiento tampoco son software. Más bien, un gráfico de conocimiento es una forma de organizar y recopilar datos y metadatos para cumplir con criterios y cumplir propósitos específicos que, a su vez, son utilizados por diferentes software. Los datos de un gráfico de conocimiento se pueden utilizar en múltiples sistemas independientes para diferentes propósitos.

Gráficos de conocimiento y gestión de datos en tiempo real

Las demandas sobre nuestros datos han llevado los enfoques tradicionales de gestión de datos más allá de sus límites. Hay enormes cantidades de datos, cada día más, y es necesario procesarlos, comprenderlos y hacerlos útiles. Debe ser confiable y realizarse en tiempo real, independientemente de si proviene de fuentes internas o externas. Después de todo, el valor de los datos depende totalmente de la capacidad de aprovechar su uso. Esta es una lección que las organizaciones están aprendiendo rápidamente a medida que buscan reducir los costos de desarrollo y mantenimiento y llegan a apreciar las ventajas y los ingresos que se pueden obtener mediante la gestión inteligente de los datos organizacionales. Los ecosistemas de datos actuales también son globales. 

Los gráficos de conocimiento pueden abordar su diversidad y la falta de control centralizado porque es un paradigma adecuado al ecosistema de datos global que incluye a todas las organizaciones. Mejor aún, a medida que cambian la información y la comprensión y las necesidades de una organización a partir de esa información, también cambia el gráfico de conocimiento. Los datos representados por un gráfico de conocimiento tienen un significado formal estricto que tanto los humanos como las máquinas pueden interpretar. Ese significado lo hace utilizable para un ser humano pero también permite que el razonamiento automatizado permita a las computadoras aliviar parte de la carga. Con los gráficos de conocimiento, las organizaciones pueden cambiar, podar y adaptar el esquema mientras mantienen los datos iguales y los reutilizan para generar aún más conocimientos.

Hace años, pasamos de la palabra de moda Big Data a Smart Data. Tener cantidades de datos sin precedentes impulsó la necesidad de tener un modelo de datos que reflejara nuestra compleja comprensión de la información. Para que los datos sean inteligentes, las máquinas ya no podrían estar sujetas a esquemas de datos inflexibles y frágiles. Necesitaban depósitos de datos que pudieran representar el mundo real y las relaciones enredadas que conlleva. Todo esto debía hacerse de una manera legible por máquina con semántica formal para permitir un razonamiento automatizado que complementara y facilitara la experiencia y la toma de decisiones humanas. 

Los gráficos de conocimiento expresados ​​en RDF proporcionan esto, así como numerosas aplicaciones en servicios con mucha información y datos. Los ejemplos incluyen contenido, empaque y reutilización inteligentes; recomendación de contenido receptivo y contextualmente consciente; descubrimiento automatizado de conocimientos; búsqueda semántica; y agentes inteligentes. También puede respaldar aspectos como la elaboración de perfiles y clasificaciones de empresas; descubrimiento de información en documentos regulatorios; y seguimiento de la literatura sobre farmacovigilancia. 

En pocas palabras, los gráficos de conocimiento ayudan a las empresas a tomar decisiones críticas basadas en modelos de conocimiento armonizados y datos derivados de sistemas fuente aislados. También ofrecen escalabilidad y semántica nativas que permiten un enfoque eficiente, específico y receptivo de los datos, incluida la seguridad y la gobernanza, la gestión de la propiedad y la procedencia. 

punto_img

Información más reciente

punto_img