Skip to content
Tiatra, LLCTiatra, LLC
Tiatra, LLC
Information Technology Solutions for Washington, DC Government Agencies
  • Home
  • About Us
  • Services
    • IT Engineering and Support
    • Software Development
    • Information Assurance and Testing
    • Project and Program Management
  • Clients & Partners
  • Careers
  • News
  • Contact
 
  • Home
  • About Us
  • Services
    • IT Engineering and Support
    • Software Development
    • Information Assurance and Testing
    • Project and Program Management
  • Clients & Partners
  • Careers
  • News
  • Contact

Gráficos de conocimiento: el eslabón perdido en la IA empresarial

Los grandes modelos de lenguaje (LLM) son buenos para aprender de datos no estructurados. Pero gran parte del valor de propiedad que tienen las empresas está encerrado en bases de datos relacionales, hojas de cálculo y otros tipos de archivos estructurados.

Las grandes empresas llevan mucho tiempo utilizando gráficos de conocimiento para comprender mejor las relaciones subyacentes entre los puntos de datos, pero estos gráficos son difíciles de construir y mantener, y requieren el esfuerzo de desarrolladores, ingenieros de datos y expertos en la materia que sepan lo que significan realmente los datos.

Los grafos de conocimiento son una capa de tejido conectivo que se sitúa sobre los almacenes de datos sin procesar, convirtiendo la información en conocimiento significativo en contexto. Así que, en teoría, serían una forma estupenda de ayudar a los LLM a comprender el significado de los conjuntos de datos corporativos, haciendo más fácil y eficiente para las empresas encontrar datos relevantes para incluirlos en las consultas, y haciendo que los propios LLM sean más rápidos y precisos.

En junio de 2023, los investigadores de Gartner dijeron que los líderes en datos y análisis deben aprovechar el poder de los LLM con la solidez de los gráficos de conocimiento para aplicaciones de IA tolerantes a fallos. Los proveedores tomaron la pelota y corrieron con ella. El primer gran anuncio fue en septiembre de 2023 por parte de la empresa de bases de datos de gráficos NebulaGraph. Su herramienta, Graph RAG, facilita a las empresas el uso de gráficos de conocimiento como parte de sus implementaciones de generación aumentada por recuperación (RAG).

La generación aumentada de recuperación (RAG) consiste en que, en lugar de limitarse a enviar una simple pregunta a un LLM, una empresa añade contexto a esa pregunta, incorporando documentos o información relevante de una base de datos vectorial. Sin RAG, los LLM solo saben en qué se les ha entrenado. Con RAG, las empresas pueden añadir información actualizada o información exclusiva de sus empresas. Por ejemplo, si se pide a un LLM que proporcione información sobre un producto de una empresa, los manuales de ese producto y otros materiales de referencia serían de gran ayuda.

Microsoft anunció su proyecto GraphRAG en febrero y lo hizo de código abierto en julio. La empresa de bases de datos de grafos Neo4j también creó una herramienta LLM Graph Transformer, que donó al proyecto de código abierto LangChain en marzo. En abril, esta herramienta se integró en Google Cloud y Vertex AI como parte de la implementación de GraphRAG de Google.

Más recientemente, a principios de diciembre, Amazon también anunció su apoyo a GraphRAG con Amazon Neptune Analytics, como parte de las bases de conocimiento de Amazon Bedrock.

Con toda esta actividad, no es de extrañar que en noviembre Gartner incluyera a GraphRAG en su ciclo de exageración de 2024 para la IA generativa, a mitad de camino de la pendiente hacia el pico de expectativas infladas. Gartner afirma que GraphRAG tardará entre dos y cinco años en alcanzar la madurez. En comparación, los agentes autónomos, situados justo debajo de GraphRAG en el ciclo de exageración, tardarán entre cinco y diez años.

GraphRAG mejora la precisión, fiabilidad y explicabilidad de los sistemas RAG, afirma Gartner, pero añade que la desventaja es que la integración de los gráficos de conocimiento con los modelos de IA gen puede ser técnicamente compleja y computacionalmente costosa. Sin mencionar que los gráficos de conocimiento por sí solos no son para los débiles de corazón.

“Llevo 20 años en el sector de los datos, y durante al menos la mitad de ese tiempo, la gente ha estado intentando que los gráficos de conocimiento sean el camino a seguir”, dice Matt Aslett, director de Investigación, Datos y Análisis de ISG Research.

Hay algunas organizaciones que han invertido en la tecnología, añade, como grandes empresas de medios de comunicación y editoriales, o empresas farmacéuticas que trabajan en el descubrimiento de fármacos. Novartis, por ejemplo, utiliza una base de datos de grafos para vincular sus datos internos a una base de datos externa de resúmenes de investigación. El objetivo es vincular genes, enfermedades y compuestos para acelerar el descubrimiento de fármacos.

E Intuit ha construido su plataforma de conocimiento de seguridad en un gráfico de conocimiento, utilizando la tecnología del proveedor de gráficos de conocimiento Neo4j, con 75 millones de actualizaciones de bases de datos que se introducen en el gráfico por hora. Pero la mayoría de las empresas no utilizan gráficos de conocimiento, dice Aslett. Las empresas que necesitan reunir datos suelen realizar proyectos de integración de datos puntuales.

“Si ya has pasado por el proceso de gráfico de conocimiento, entonces tendría sentido que esa información también estuviera disponible para tu proyecto de IA”, añade. “Pero si aún no lo has hecho, entonces tienes que pasar primero por todo este gran proyecto para introducir tu información en un gráfico de conocimiento”.

En el pasado, eso habría sido una propuesta desalentadora. Pero ahora la IA generativa se está utilizando para ayudar a crear estos gráficos de conocimiento, acelerando el ciclo virtuoso que convierte los datos corporativos en conocimientos prácticos y mejorando la precisión de los LLM al tiempo que reduce el coste y la latencia.

Una demanda de mejor oferta

Un gráfico de conocimiento puede integrarse en una base de datos, situarse sobre una base de datos, vincular varias bases de datos entre sí e incluso extraer información de otras fuentes, todo ello sin cambiar las estructuras de datos subyacentes.

En las bases de datos relacionales tradicionales, las relaciones entre los puntos de datos forman parte de la estructura de la propia base de datos y suelen limitarse a datos clave. Por ejemplo, los registros de clientes pueden vincularse a transacciones individuales mediante un número de identificación de cliente común. Y esas transacciones podrían, a su vez, vincularse a una base de datos de productos a través de un identificador de producto común.

Pero averiguar que un grupo concreto de clientes tiene las mismas preferencias es un poco más complicado, y las cosas se vuelven aún más complejas cuando las relaciones son más sutiles.

Hacer explícitas todas estas relaciones a través de un gráfico de conocimiento facilita la extracción de toda la información relevante a la hora de proporcionar a un LLM el contexto que necesita para responder a una pregunta, produciendo resultados más precisos.

Las empresas suelen utilizar incrustaciones RAG para aumentar las consultas de los LLM con sus conocimientos patentados, pero los expertos estiman que las tasas de precisión suelen llegar hasta el 70%.

“Los enfoques como la generación aumentada de recuperación tradicional a menudo no pueden alcanzar una precisión superior al 80%”, afirma Daniel Bukowski, director de Tecnología de Data2, una empresa emergente de software que trabaja en el problema de la precisión. “Aunque esto puede ser adecuado para algunos usos, muchas industrias y situaciones requieren un 99% o cerca de este porcentaje”.

Los LLM están optimizados para datos no estructurados, añade Sudhir Hasbe, director de producto de Neo4j. “Pero muchos datos empresariales también están estructurados. Entonces, ¿cómo se unen esos datos estructurados y no estructurados para responder a las preguntas? Uno quiere poder ir y obtener la respuesta y, lo que es más importante, explicar por qué obtuvo la respuesta”.

Los gráficos de conocimiento reducen las alucinaciones, dice, pero también ayudan a resolver el desafío de la explicabilidad. Los gráficos de conocimiento se sitúan por encima de las bases de datos tradicionales, proporcionando una capa de conexión y una comprensión más profunda, dice Anant Adya, vicepresidente ejecutivo de Infosys. “Se puede hacer una mejor búsqueda contextual”, dice, “y te ayuda a obtener mejores conocimientos”.

Infosys está realizando pruebas de concepto para utilizar los gráficos de conocimiento con el fin de combinar el conocimiento que la empresa ha ido recopilando a lo largo de los años con herramientas de IA general. “Estamos identificando aquellos casos de uso en los que pueden tener un mayor impacto”, afirma. Entre ellos se encuentran la extracción automatizada de conocimientos, la elaboración de presupuestos, las adquisiciones y la planificación empresarial. “Pero es muy pronto”, añade. “Todavía no está en producción”.

LinkedIn es una de las empresas que ha implementado un gráfico de conocimiento para mejorar el rendimiento de la IA generativa, y sobre la que se ha escrito. En un artículo publicado en abril, LinkedIn informa de que la combinación de RAG con un gráfico de conocimiento le ayudó a mejorar la precisión de una aplicación de IA general de servicio al cliente en un 78%. Y, durante los seis meses anteriores, el equipo de servicio al cliente de LinkedIn utilizó la combinación, lo que redujo el tiempo medio de resolución por incidencia en un 29%.

Reducción de costes y latencia

Cuando se añade la funcionalidad de IA generativa a los flujos de trabajo de la empresa, las consultas suelen aumentarse con información relevante, normalmente procedente de una base de datos vectorial. Y cuanta más información se pueda añadir a la consulta, más contexto tendrá el LLM para producir una respuesta.

“Pero cuanto más contexto y documentos proporciono, más grande se vuelve el RAG”, dice Vamsi Duvvuri, líder de IA en Tecnología, Medios de Comunicación y Entretenimiento, y Telecomunicaciones en EY. “Y mi sistema se vuelve cada vez más lento”. Además, los proveedores de IA generativa suelen cobrar por token; cuanta más información procesan sus modelos, mayores son los costes.

Según un documento de investigación de Microsoft de abril, GraphRAG requirió hasta un 97% menos de tokens y, aun así, proporcionó respuestas más completas que el RAG estándar.

Cuando se utiliza un gráfico de conocimiento como parte de la infraestructura RAG, se pueden utilizar conexiones explícitas para centrarse rápidamente en la información más relevante. “Se vuelve muy eficiente”, dijo Duvvuri. Y las empresas se están aprovechando de esto, dice. “La pregunta difícil es cuántas de esas soluciones se ven en producción, lo cual es bastante raro. Pero eso es cierto para muchas aplicaciones de IA generativa”.

Poner en práctica los LLM

El reto de crear gráficos de conocimiento es que se necesita una gran experiencia para crearlos. Esto fue particularmente difícil para conjuntos de datos grandes y complejos, exactamente aquellos en los que más se necesitaban grafos de conocimiento. Gran parte del arduo trabajo de crear un gráfico de conocimiento consiste en construir la ontología, como definir términos, decidir clasificaciones y averiguar que dos datos diversos están relacionados de alguna manera. “Y esto es algo en lo que la IA gen puede ser buena”, dice Aslett, de ISG. Algunos proveedores ya están intentando ofrecer esta capacidad, dice, pero las herramientas aún se encuentran en las primeras etapas de desarrollo.

Antes de la IA generativa, las empresas solían intentar crear grafos de conocimiento con aprendizaje automático. “Solíamos utilizar el procesamiento del lenguaje natural para crear gráficos de conocimiento, utilizando el reconocimiento de entidades nominales y creando relaciones mediante la coocurrencia”, dice Duvvuri. “La creación llevaba mucho tiempo porque había que entrenar el canal de PNL. Era una forma muy laboriosa de conseguirlo”.

Hoy en día, los LLM reducen significativamente el tiempo necesario para crear gráficos de conocimiento.

“Yo mismo he creado gráficos de conocimiento utilizando grandes modelos de lenguaje”, afirma. “Es una forma estupenda de extraer relaciones. El poder de un ráfico de conocimiento se acelera utilizando un gran modelo de lenguaje, y añadir un gráfico de conocimiento a un LLM acelera su rendimiento y también mejora el coste”.

Pierre Liang, profesor de Contabilidad en la Tepper School of Business de la Universidad Carnegie Mellon, afirma que la IA generativa tiene una forma asombrosa de generar conocimientos que antes no era posible. 2He visto ejemplos de esto en mi laboratorio”, afirma. “Las oportunidades para las empresas de utilizar LLM para ayudarnos a generar y utilizar grafos de conocimiento son muy prometedoras”.


Read More from This Article: Gráficos de conocimiento: el eslabón perdido en la IA empresarial
Source: News

Category: NewsJanuary 30, 2025
Tags: art

Post navigation

PreviousPrevious post:Principal Financial’s Kathy Kay on customer-centric IT leadershipNextNext post:Velocità vs lentezza: ecco quale sarà il reale impatto dei tempi di adozione dell’AI

Related posts

Barb Wixom and MIT CISR on managing data like a product
May 30, 2025
Avery Dennison takes culture-first approach to AI transformation
May 30, 2025
The agentic AI assist Stanford University cancer care staff needed
May 30, 2025
Los desafíos de la era de la ‘IA en todas partes’, a fondo en Data & AI Summit 2025
May 30, 2025
“AI 비서가 팀 단위로 지원하는 효과”···퍼플렉시티, AI 프로젝트 10분 완성 도구 ‘랩스’ 출시
May 30, 2025
“ROI는 어디에?” AI 도입을 재고하게 만드는 실패 사례
May 30, 2025
Recent Posts
  • Barb Wixom and MIT CISR on managing data like a product
  • Avery Dennison takes culture-first approach to AI transformation
  • The agentic AI assist Stanford University cancer care staff needed
  • Los desafíos de la era de la ‘IA en todas partes’, a fondo en Data & AI Summit 2025
  • “AI 비서가 팀 단위로 지원하는 효과”···퍼플렉시티, AI 프로젝트 10분 완성 도구 ‘랩스’ 출시
Recent Comments
    Archives
    • May 2025
    • April 2025
    • March 2025
    • February 2025
    • January 2025
    • December 2024
    • November 2024
    • October 2024
    • September 2024
    • August 2024
    • July 2024
    • June 2024
    • May 2024
    • April 2024
    • March 2024
    • February 2024
    • January 2024
    • December 2023
    • November 2023
    • October 2023
    • September 2023
    • August 2023
    • July 2023
    • June 2023
    • May 2023
    • April 2023
    • March 2023
    • February 2023
    • January 2023
    • December 2022
    • November 2022
    • October 2022
    • September 2022
    • August 2022
    • July 2022
    • June 2022
    • May 2022
    • April 2022
    • March 2022
    • February 2022
    • January 2022
    • December 2021
    • November 2021
    • October 2021
    • September 2021
    • August 2021
    • July 2021
    • June 2021
    • May 2021
    • April 2021
    • March 2021
    • February 2021
    • January 2021
    • December 2020
    • November 2020
    • October 2020
    • September 2020
    • August 2020
    • July 2020
    • June 2020
    • May 2020
    • April 2020
    • January 2020
    • December 2019
    • November 2019
    • October 2019
    • September 2019
    • August 2019
    • July 2019
    • June 2019
    • May 2019
    • April 2019
    • March 2019
    • February 2019
    • January 2019
    • December 2018
    • November 2018
    • October 2018
    • September 2018
    • August 2018
    • July 2018
    • June 2018
    • May 2018
    • April 2018
    • March 2018
    • February 2018
    • January 2018
    • December 2017
    • November 2017
    • October 2017
    • September 2017
    • August 2017
    • July 2017
    • June 2017
    • May 2017
    • April 2017
    • March 2017
    • February 2017
    • January 2017
    Categories
    • News
    Meta
    • Log in
    • Entries feed
    • Comments feed
    • WordPress.org
    Tiatra LLC.

    Tiatra, LLC, based in the Washington, DC metropolitan area, proudly serves federal government agencies, organizations that work with the government and other commercial businesses and organizations. Tiatra specializes in a broad range of information technology (IT) development and management services incorporating solid engineering, attention to client needs, and meeting or exceeding any security parameters required. Our small yet innovative company is structured with a full complement of the necessary technical experts, working with hands-on management, to provide a high level of service and competitive pricing for your systems and engineering requirements.

    Find us on:

    FacebookTwitterLinkedin

    Submitclear

    Tiatra, LLC
    Copyright 2016. All rights reserved.