Logotipo de Zephyrnet

Gráficos de propiedad frente a gráficos de conocimiento

Fecha:

Una de las mayores fortalezas de las bases de datos de gráficos es su capacidad para tratar las "relaciones" entre los datos como si fueran tan importantes como los datos mismos. Muestran una imagen visual de un gráfico en respuesta a consultas. Bases de datos están diseñados para contener datos sin restringirlos a un modelo fijo y predeterminado. Como consecuencia, las bases de datos de gráficos son muy buenas para gestionar consultas de investigación complejas.

Utilizando una consulta y un punto de partida, bases de datos gráficas busque los datos circundantes (recolectando y acumulando información de miles de nodos y relaciones) mientras deja solo cualquier dato fuera del perímetro de búsqueda.

Los nodos se utilizan en bases de datos de gráficos y representan entidades como cuentas, empresas, personas o cualquier otro elemento que se esté rastreando. (En una base de datos relacional, son el equivalente aproximado de una fila, registro o relación).

Los bordes son líneas que conectan los nodos y representan relaciones. Por ejemplo, el gerente de un club de ajedrez que desea investigar la relación de Alice y Bob consultaría la base de datos de gráficos y se le mostraría información básica sobre Alice y Bob y sus relaciones, así como su relación con el club de ajedrez. (Una consulta sobre "todos" los miembros mostraría la misma información básica, pero sería mucho más grande y compleja).

Los bordes (y las relaciones que representan) son los que hacen que las bases de datos de grafos sean únicas. Se pueden encontrar patrones significativos al revisar los bordes (relaciones) que conectan los nodos.

Fuente de imagen: Wikimedia Commons

Los bordes pueden ser dirigidos o no dirigidos. Los gráficos no dirigidos usan bordes sin "dirección específica" y sugieren una relación bidireccional o bidireccional. Cada borde se puede utilizar para moverse en ambas direcciones. Los gráficos dirigidos, por otro lado, tienen bordes que se mueven en una sola dirección durante la consulta. Estos bordes sugieren una relación unidireccional.

Se puede usar un gráfico dirigido para representar un sitio web (el nodo "inicio" o "hacia"), con los bordes unidireccionales que representan hipervínculos y el destino vinculado como el nodo "final" o "desde". Facebook se puede utilizar como ejemplo de gráficos no dirigidos, porque cuando el propietario de una página de inicio agrega un amigo, ese nuevo amigo tiene acceso completo al contenido público del propietario de la página. Las comunicaciones van y vienen en una relación bidireccional.

Solo las bases de datos que adoptan relaciones de forma nativa pueden almacenar, procesar y consultar conexiones entre dos o más bases de datos de manera eficiente. Mientras que otras bases de datos (como SQL) pueden encontrar relaciones entre bases de datos al responder a una consulta, deben usar costosos ÚNETE operaciones.

Bases de datos, por otro lado, están diseñados para almacenar sus conexiones (relaciones) con los datos. (Consultas más complejas usando Sistemas de gestión de bases de datos SQL requieren comandos JOIN).

Los orígenes de las bases de datos de gráficos se remontan al matemático suizo del siglo XVIII. Leonhard Euler.

En los últimos años, dos tipos de bases de datos de gráficos han ganado una popularidad significativa. Ellos son gráficos de conocimiento y gráficas de propiedades. Ambos tipos de bases de datos de gráficos brindan flexibilidad, un enfoque en las relaciones y conocimientos adquiridos a partir de los datos existentes. Gráficos de propiedades se han descrito como más simples y como un posible primer paso para adoptar un gráfico de conocimiento. 

Gráficos de propiedades (también llamados gráficos de propiedades etiquetadas)

A gráfico de propiedades utiliza nodos, relaciones, etiquetas y "propiedades". Tanto las relaciones como sus nodos de conexión de datos tienen nombre y pueden almacenar propiedades. Los nodos se pueden etiquetar en apoyo de ser parte de un grupo. Los gráficos de propiedades usan "bordes dirigidos" y cada relación tiene un nodo inicial y un nodo final.

A las relaciones también se les pueden asignar propiedades. Esta característica es útil para presentar metadatos adicionales a las relaciones entre los nodos.

Marko Rodríguez, cofundador y director general de RRedX, declaró:

“El término 'gráfico de propiedades' ha llegado a denotar un gráfico multirelacional con atributos. Es decir, un gráfico donde los bordes están etiquetados y tanto los vértices como los bordes pueden tener cualquier cantidad de propiedades clave/valor asociadas con ellos”.

Los gráficos de propiedades etiquetadas se desarrollaron por primera vez en Suecia en un esfuerzo por desarrollar un sistema de gestión de contenido empresarial (ECM). Los desarrolladores optaron por un sistema de gráficos que enfatizaba el almacenamiento eficiente, lo que a su vez promovía velocidades de consulta rápidas y recorridos rápidos a través de datos conectados. Las bases de datos de gráficos de propiedades se han centrado en tiempos de inicio y rendimiento rápidos, pero continúan evolucionando y desarrollando nuevas capacidades.

Los gráficos de propiedades usan etiquetas relevantes y fáciles de reconocer que se pueden usar para modelar datos y sus conexiones. Estos datos se pueden estructurar de manera que los humanos los entiendan fácilmente. Cuando los datos se modelan con estos términos relevantes, se pueden consultar de una manera fácil de leer.

Algunas de las características básicas que hacen que los gráficos de propiedades sean tan populares incluyen:

  • Fácil de usar: Las imágenes visuales de los gráficos, con los nodos y sus propiedades, parecen entenderse con mucha facilidad
  • Sin esquema fijo: Esta función funciona bien con datos estructurados y semiestructurados.
  • Las relaciones tienen puntos de inicio y fin: Los gráficos de propiedades siempre tienen un punto inicial y final (y una dirección)
  • A las relaciones se les asignan propiedades: Los bordes pueden tener valores asignados que pueden especificar cosas como la capacidad, la longitud u otras características.
  • Identificaciones internas: Las bases de datos de gráficos de propiedades asignan internamente ID de nodos y bordes
    usando cadenas de texto (tipos de relaciones, etiquetas de nodos y nombres de propiedades)

Gráficos de conocimiento

Un gráfico de conocimiento es básicamente un mapa de los datos de una organización. Puede restringirse a un dominio específico o usarse como un gráfico de conocimiento empresarial, mapeando todos los datos que una empresa ha almacenado.

Gráficos de conocimiento a veces se denominan "redes semánticas". Esto se debe a que se basan en la web semántica, un sistema diseñado para estructurar los metadatos de las páginas web y sus enlaces, haciéndolos legibles por máquina. (Al igual que los gráficos de propiedades, los gráficos de conocimiento también usan bordes dirigidos).

La web semántica, propuesta por primera vez en 2001, nunca tuvo éxito porque desarrolló una reputación de ser demasiado académica. Sin embargo, Google adaptó los conceptos básicos para su motor de búsqueda en 2012 y lo llamó el Google Gráfico Conocimiento. Para mantener su competitividad, Microsoft, Yahoo, LinkedIn, etc., también incorporaron “gráficos de conocimiento”.

Gráficos de conocimiento use información semántica para proporcionar contexto, apoyando las percepciones humanas. El gráfico de conocimiento representa una colección de descripciones interrelacionadas de entidades (negocios, personas, eventos, conceptos) y un marco para la integración y el análisis de datos. Debido a su capacidad para hacer que los metadatos sean legibles por máquina, los gráficos de conocimiento tienen un gran potencial para su uso con el aprendizaje automático y la inteligencia artificial.

Varias aplicaciones específicas se basan en gráficos de conocimiento. Estos incluyen servicios pesados ​​de datos, como:

Los gráficos de conocimiento son muy útiles para trabajar con tejido de datos. La función de semántica (y el uso de gráficos) admite capas de descubrimiento y orquestación de datos en una estructura de datos. La combinación de los dos hace que la estructura de datos sea más fácil de construir de forma incremental y más flexible, lo que reduce el riesgo y acelera la implementación.

El proceso permite que una organización desarrolle el tejido en etapas. Puede comenzar con un solo dominio o un caso de uso de alto valor y expandirse gradualmente con más datos, usuarios y casos de uso.

A arquitectura de estructura de datos, combinado con un gráfico de conocimiento, admite capacidades útiles en muchas áreas clave. La combinación se puede usar para conectar datos relacionados de todos los silos con una flexibilidad notable, conectando millones de puntos de datos relacionados.

Las empresas pueden obtener una flexibilidad sin precedentes en el proceso de integración de datos. Los gráficos de conocimiento también pueden hacer que los datos complicados sean significativamente más fáciles de usar y comprender al establecer una capa semántica de definiciones comerciales.

Los recientes avances en procesamiento natural del lenguaje (preguntas, reconocimiento de entidades, clasificación de relaciones, clasificación de textos) han hecho necesario que las empresas utilicen la PNL para seguir siendo competitivas. (El procesamiento del lenguaje natural se refiere a la rama de la inteligencia artificial que permite a las computadoras comprender tanto el texto como las palabras habladas).

Los gráficos de conocimiento, cuando se combinan con NLP, se convierten en una poderosa herramienta que se puede utilizar para la investigación y la extracción de datos. Se pueden utilizar paquetes de procesamiento de lenguaje natural (NLP) crear un modelo de datos de gráficos de conocimiento que ofrece información útil sobre los datos.

Existen plataformas semánticas que han incorporado inteligencia artificial y grafos de conocimiento. Él Fiesta de piscina Semantic Suite parece ser líder en la combinación de inteligencia artificial con gráficos de conocimiento.

Tener un gráfico de conocimiento compatible con IA que pueda mostrar y vincular activos de datos puede proporcionar una ventaja competitiva. Andreas Blumauer, director ejecutivo y fundador de la Empresa de Web Semántica dijo:

“Finalmente podemos usar una gran cantidad de datos y realizar consultas complejas sobre ellos, validar diferentes fuentes de datos al mismo tiempo y unirlas”.

Imagen utilizada bajo licencia de Shutterstock.com 

Fuente: https://www.dataversity.net/property-graphs-vs-knowledge-graphs/

punto_img

Información más reciente

punto_img