Ir al contenido principal

Entradas

Mostrando entradas de julio, 2025

Cómo Evaluar la Recuperación de Grafos en Sistemas Agénticos MCP

Cómo Evaluar la Recuperación de Grafos en Sistemas Agénticos MCP El auge de los agentes de IA ha generado un interés significativo en extender las capacidades de los Modelos de Lenguaje Extensos (LLMs) más allá de la simple búsqueda de vectores, proporcionándoles acceso a diversas herramientas como la búsqueda web, APIs y bases de datos. Sin embargo, este crecimiento ha superado el desarrollo de métodos de evaluación rigurosos para estos sistemas. Aunque es relativamente sencillo integrar un LLM con diversas herramientas, resulta crucial comprender cómo se comportará realmente el sistema en un entorno operativo. Por ello, es fundamental establecer un marco sólido para evaluar los servidores MCP (Model Context Protocol), tanto los disponibles en el mercado como los personalizados, especialmente aquellos que recuperan información de Neo4j. Model Context Protocol (MCP) El Model Context Protocol (MCP) , desarrollado por Anthropic, es un estándar abierto que facilita la conexión de sist...

Cómo Bertelsmann Construyó un Sistema Multi-Agente para Impulsar la Creatividad

Cómo Bertelsmann Construyó un Sistema Multi-Agente para Impulsar la Creatividad Bertelsmann, una de las compañías de medios más grandes del mundo, con una larga trayectoria produciendo contenido influyente, desde las biografías de Barack Obama y el Príncipe Harry, hasta producciones ganadoras de premios Emmy y Óscar como Poor Things y The Young Pope , se enfrentaba a un desafío interno crítico: la fragmentación de la información . Cuando un creativo o investigador de Bertelsmann hacía una pregunta aparentemente sencilla como "¿Qué tipo de contenido tenemos sobre Barack Obama?", la respuesta podía estar dispersa en docenas de sistemas, bases de datos y plataformas diferentes. Para abordar este problema, el equipo de AI Hub de Bertelsmann desarrolló la Bertelsmann Content Search , un sistema multi-agente impulsado por LangGraph, que ha pasado de prototipo a una implementación completa en producción. Este sistema permite la búsqueda y el descubrimiento de contenido en toda l...

Por Qué la Infraestructura de Agentes es Crucial

Por Qué la Infraestructura de Agentes es Crucial En el último año, la industria ha sido testigo del auge de las aplicaciones basadas en agentes, que van desde copilotos de flujo de trabajo hasta asistentes de generación de código e investigadores profundos. Estas aplicaciones combinan el uso de herramientas, la memoria y el razonamiento para completar tareas complejas de varios pasos, superando la simple recuperación de información y el chat para tomar acciones concretas. Los agentes están transformando la forma en que concebimos las aplicaciones. Ya no se trata solo de una serie de solicitudes y respuestas reducidas a formularios de entrada, botones, elementos visuales o interfaces de chat. En cambio, los agentes recuerdan, razonan y actúan. Trabajan en segundo plano a partir de eventos e información. No solo actúan, sino que también piden ayuda, muestran su trabajo, razonan para resolver problemas y colaboran en grupo. Y si bien la computación sin estado y sin servidor sigue siendo...

Implementación End-to-End de AWS RDS con Bastion Host Usando Terraform

Implementación End-to-End de AWS RDS con Bastion Host Usando Terraform Este artículo explora cómo automatizar la configuración de una infraestructura segura en AWS utilizando Terraform. Se cubrirá la creación de una VPC, subredes públicas y privadas, una base de datos MySQL RDS y un Bastion host para un acceso seguro. El objetivo es proporcionar un entorno de base de datos fiable para procesos ETL posteriores, siguiendo las mejores prácticas de ingeniería de datos y DevOps. La información de este blog viene principalmente de https://towardsdatascience.com/end-to-end-aws-rds-setup-with-bastion-host-using-terraform/ . Introducción En cualquier arquitectura de datos, las fuentes de datos, especialmente las bases de datos, son la columna vertebral. Para simular un pipeline realista, se necesita un entorno de base de datos seguro y fiable que sirva como fuente de verdad para los trabajos ETL (Extract, Transform, Load) posteriores. En lugar de provisionar esto manualmente, la automatizac...

Robots que se conocen a sí mismos: Un nuevo sistema basado en visión les enseña a las máquinas a comprender su cuerpo

Robots que se conocen a sí mismos: Un nuevo sistema basado en visión les enseña a las máquinas a comprender su cuerpo Un nuevo sistema, bautizado como Neural Jacobian Fields (NJF) y desarrollado por investigadores del CSAIL del MIT, promete revolucionar la forma en que controlamos a los robots. En lugar de depender de modelos predefinidos o sensores costosos, este sistema permite que los robots aprendan a controlar sus movimientos a partir de la simple observación visual, utilizando una única cámara. Esta innovación abre la puerta a robots más flexibles, asequibles y con mayor "autoconciencia" corporal. El cambio de paradigma: Enseñar, no programar El enfoque tradicional en robótica se ha centrado en la programación, donde se definen explícitamente los movimientos y las acciones del robot. Sin embargo, el sistema NJF propone un cambio radical: enseñar al robot mediante la observación. Sizhe Lester Li, investigador principal del proyecto, lo describe como un paso hacia u...

Aeneas: IA para conectar a los historiadores con el pasado

Aeneas: IA para conectar a los historiadores con el pasado Las inscripciones del mundo romano, grabadas en monumentos imperiales y objetos cotidianos, ofrecen valiosas perspectivas sobre la vida diaria. Sin embargo, muchas veces estos textos están fragmentados, erosionados o deliberadamente dañados, lo que dificulta su restauración, datación e interpretación. La contextualización se vuelve esencial para desentrañar su significado. Un nuevo modelo de inteligencia artificial, llamado Aeneas , promete transformar la forma en que los historiadores abordan estos desafíos. Desarrollado en colaboración con varias universidades, Aeneas es el primer modelo de IA diseñado para contextualizar inscripciones antiguas. La herramienta es capaz de buscar paralelos textuales y contextuales en una vasta colección de inscripciones latinas, acelerando significativamente el proceso de investigación histórica. ¿Cómo funciona Aeneas? Aeneas es una red neuronal generativa multimodal que utiliza tanto el t...

DE VUELTA AL FUTURO: EVALUANDO AGENTES DE IA EN LA PREDICCIÓN DE EVENTOS FUTUROS

El Futuro de la Evaluación de IA: Prediciendo Eventos en el Mundo Real La verdadera medida del valor de la Inteligencia Artificial no reside en su capacidad para recordar el pasado, sino en su habilidad para pronosticar el futuro. Gran parte de los benchmarks actuales se centran en evaluar modelos de IA con base en conocimiento estático o problemas ya resueltos. Sin embargo, este enfoque presenta una debilidad fundamental: la contaminación de datos . Al igual que un estudiante que memoriza las respuestas de un examen, un modelo de IA entrenado con datos que incluyen las preguntas de su evaluación no demuestra una inteligencia genuina, sino una simple capacidad de memorización. Esto invalida la fiabilidad de muchos benchmarks tradicionales y dificulta la toma de decisiones sobre qué tecnología adoptar. Para superar este obstáculo, emerge un nuevo paradigma: evaluar a los agentes de IA por su capacidad para predecir eventos futuros. Este método es, por diseño, inmune a la contaminación...