Frameworks para agentes de IA

Guía completa de los mejores frameworks para crear agentes de inteligencia artificial en 2026: desde herramientas de ejecución local como Ollama hasta orquestadores multi-agente como CrewAI y LangChain. Analiza cada opción, compara sus ventajas y elige la que mejor encaja con tu proyecto.

Última actualización: mayo 2026

Qué es un framework de agentes IA

Un framework de agentes IA es el conjunto de herramientas, bibliotecas y abstracciones que permite conectar un modelo de lenguaje (LLM) con el mundo real: bases de datos, APIs externas, terminales, navegadores y cualquier sistema que pueda ejecutar acciones. Sin un framework, el modelo solo puede generar texto. Con un framework, el modelo puede planificar, actuar, observar el resultado y replantear su estrategia hasta completar una tarea compleja de principio a fin.

El término "framework" agrupa categorías muy distintas. Hay herramientas de ejecución local que descargan y sirven modelos en tu propio hardware (Ollama, LLM Studio); CLIs de agente que convierten al propio LLM en un asistente de terminal capaz de editar código y ejecutar comandos (Claude Code); frameworks Python de orquestación multi-agente que permiten definir equipos de especialistas con roles diferenciados (CrewAI, LangChain, LlamaIndex, Pydantic AI); plataformas de despliegue que abstraen la infraestructura y permiten servir agentes en producción con un par de clics (OpenClaw, Hermes Agent); y protocolos estándar que hacen que cualquier agente pueda hablar con cualquier herramienta sin integraciones ad-hoc (MCP).

Por qué importa elegir bien el framework

La elección del framework no es solo una decisión técnica: condiciona la velocidad de iteración, el coste de infraestructura, la facilidad de mantenimiento y los límites de lo que tu agente puede hacer. Un equipo que elige LangChain cuando solo necesita ejecutar modelos en local va a cargar con cientos de dependencias innecesarias. Un equipo que elige Ollama cuando necesita orquestación multi-agente va a reescribir desde cero toda la lógica de planificación.

A mayo de 2026, el ecosistema de frameworks ha madurado significativamente. Ollama superaba las 171.000 estrellas en GitHub y se había convertido en el estándar de facto para ejecutar modelos en local. CrewAI rondaba las 50.000 estrellas tras dos años de crecimiento explosivo. LangChain, a pesar de su complejidad, seguía siendo el más utilizado en proyectos de producción gracias a su ecosistema de integraciones. Y Claude Code había democratizado la figura del agente de terminal entre los desarrolladores individuales.

Las cinco dimensiones para evaluar un framework

Antes de entrar en la comparativa, conviene entender las dimensiones que realmente importan a la hora de elegir:

Abstracción vs. control. Los frameworks más opinados (CrewAI, Hermes Agent) te dan una estructura predefinida que acelera el desarrollo pero limita la personalización. Los más primitivos (LangChain en modo bajo nivel, Pydantic AI) exigen más código pero permiten arquitecturas arbitrarias. Elige según la singularidad de tu caso de uso.
Lenguaje y ecosistema. Python domina el espacio de agentes IA por su ecosistema científico. Pero TypeScript es la opción natural si tu stack es Node.js (Mastra, OpenClaw). PHP puede integrar agentes a través de APIs REST, pero los frameworks nativos de orquestación son escasos.
Local vs. cloud. Si la privacidad de los datos es crítica, necesitas ejecución local: Ollama o LLM Studio para los modelos, y un framework que soporte conexión a endpoints OpenAI-compatibles. Si puedes usar cloud, el abanico de modelos disponibles se amplía.
Agente único vs. multi-agente. Para tareas lineales, un agente único con acceso a herramientas es suficiente y mucho más fácil de depurar. Para tareas que requieren especialización paralela (investigación + redacción + revisión, por ejemplo), un sistema multi-agente como CrewAI o OpenSwarm multiplica la capacidad pero también la complejidad.
Coste operativo. Ejecutar 100.000 llamadas a GPT-5 cuesta decenas de veces más que ejecutar el mismo volumen con un modelo de 8B parámetros en local. El framework determina si puedes cambiar de modelo con un solo parámetro o si eso requiere reescribir toda la capa de integración.

El papel del protocolo MCP en el ecosistema

Merece mención especial el Model Context Protocol (MCP), el estándar abierto propuesto por Anthropic que define cómo los modelos se conectan con herramientas externas de forma estandarizada. MCP no es un framework de orquestación sino un protocolo de comunicación, pero su adopción creciente lo convierte en una pieza transversal: Claude Code lo usa como mecanismo de extensión, y cada vez más frameworks Python están añadiendo soporte nativo. Si tu agente va a integrarse con múltiples herramientas de terceros, entender MCP antes de elegir framework te ahorrará trabajo de integración significativo.

Con este contexto en mente, pasamos a la comparativa y al directorio completo de frameworks.

Panel central de inteligencia artificial con cerebro conectado a editores de código, terminales y diagramas de flujo de trabajo — Los frameworks de agentes IA conectan el LLM con herramientas, datos y sistemas externos

Datos

Comparativa rápida: los 6 principales frameworks

Tabla de referencia rápida. Para el análisis completo, accede a la página de cada framework.

Comparativa de frameworks de agentes IA a mayo 2026. Estrellas GitHub aproximadas.
Framework	Lenguaje	Tipo	GitHub Stars	Mejor para
Claude Code	TypeScript / CLI	Agente de terminal	~8.1k búsquedas/mes	Desarrollo de software con IA
Ollama	Go / API REST	Ejecución local	~171k	Modelos locales, privacidad, sin nube
CrewAI	Python	Multi-agente	~50.8k	Equipos de agentes especializados
LangChain	Python / JS	Orquestación	~92k	Integraciones complejas en producción
MCP	Protocolo abierto	Estándar de conexión	5.800+ servidores	Conectar cualquier agente a cualquier herramienta
Pydantic AI	Python	Agentes tipados	~17k	Producción con validación estricta de datos

Taxonomía de frameworks de agentes IA: 6 categorías conectadas al LLM central

Categoría 1

Agentes de código

Herramientas que convierten al LLM en un desarrollador autónomo: leen el repositorio, editan archivos, ejecutan comandos y hacen commit de los cambios.

Claude Code

CLI de Anthropic que convierte a Claude en un agente de terminal completo. Lee el codebase, edita archivos, ejecuta tests y hace commit. Soporta hooks, skills personalizables y servidores MCP para extender sus capacidades. Modelo de referencia para agentes de desarrollo en 2026.

Terminal Anthropic

Ver guía completa

OpenAI Codex

Sistema de agente de codificación de OpenAI: CLI open source en Rust, nube, extensión de IDE e integración en ChatGPT. Trabaja en sandbox, delega tareas en paralelo y usa GPT-5.5. Incluido en los planes de pago de ChatGPT.

CLI + Nube OpenAI

Ver guía completa

Google Antigravity

IDE de desarrollo agéntico de Google, lanzado con Gemini 3. Orquesta varios agentes autónomos en paralelo desde un Agent Manager, con navegador integrado para verificación visual. Soporta Gemini, Claude y GPT-OSS.

IDE agéntico Google

Ver guía completa

Categoría 2

Ejecución local de modelos

Herramientas para descargar y ejecutar modelos de lenguaje directamente en tu hardware, sin depender de APIs externas. Ideales cuando la privacidad de los datos es crítica o cuando quieres eliminar el coste variable por token.

Ollama

El estándar de facto para ejecutar modelos LLM en local. Un solo comando descarga y sirve cualquier modelo compatible: Llama 3, Mistral, Qwen, Phi. Expone una API REST compatible con OpenAI, lo que facilita la integración con cualquier framework de orquestación. Rondaba las 250.000 estrellas en GitHub a mayo de 2026.

Local Open Source

Ver guía completa

LLM Studio

LM Studio -- Run AI models locally and privately

Interfaz gráfica para gestionar y ejecutar modelos en local sin tocar la terminal. Permite comparar modelos lado a lado, ajustar parámetros de generación en tiempo real y exportar conversaciones. La opción más accesible para desarrolladores que prefieren trabajar con una UI visual.

Local UI Visual

Ver guía completa

Categoría 3

Plataformas de agentes

Plataformas de alto nivel que abstraen la infraestructura y permiten desplegar agentes conectados a múltiples canales (Telegram, WhatsApp, Discord, web) sin gestionar servidores ni integraciones individuales.

OpenClaw

Open WebUI -- Plataforma self-hosted para agentes IA

Gateway multicanal en Node.js que conecta agentes IA a Telegram, WhatsApp, Discord y más de 25 plataformas desde una sola configuración. Gestiona sesiones de usuario, historial de conversación y enrutamiento de mensajes de forma transparente. Con más de 137.000 estrellas en GitHub, es uno de los proyectos de infraestructura de agentes más populares del ecosistema.

Multicanal Node.js

Ver guía completa

Hermes Agent

Plataforma de siguiente generación con aprendizaje continuo integrado. El agente mejora con cada interacción, genera skills automáticamente a partir de patrones de uso frecuente y mantiene memoria persistente entre sesiones. Orientado a empresas que quieren agentes que evolucionen con el negocio sin reentrenamiento manual. Superaba las 95.000 estrellas en GitHub a mayo de 2026.

Aprendizaje Python

Ver guía completa

Categoría 4

Frameworks multi-agente (Python)

Bibliotecas Python para definir, orquestar y ejecutar sistemas donde varios agentes con roles especializados colaboran para completar tareas complejas. El corazón del desarrollo de agentes en producción.

CrewAI

Framework Python multi-agente con una filosofía clara: define un equipo de agentes con roles, objetivos y backstories específicos, y CrewAI orquesta la colaboración automáticamente. Cada agente puede usar herramientas distintas y delegar subtareas a otros miembros del equipo. Su abstracción de alto nivel lo hace ideal para equipos que quieren resultados rápidos sin profundizar en los detalles de la orquestación. Contaba con más de 50.800 estrellas en GitHub a mayo de 2026.

Multi-agente Python 50.8k stars

Ver guía completa

LangChain

El framework de orquestación de agentes más veterano y con mayor ecosistema de integraciones. Permite construir cadenas de razonamiento (chains), agentes con herramientas (agents), RAG pipelines y flujos conversacionales complejos. Disponible en Python y JavaScript. Su punto fuerte es el ecosistema: más de 600 integraciones con bases de datos, APIs y servicios externos. Con cerca de 95.000 estrellas en GitHub, sigue siendo la referencia en proyectos de producción a gran escala.

Orquestación Python / JS ~92k stars

Ver guía completa

LlamaIndex

Especializado en conectar agentes con datos propios: documentos PDF, bases de datos SQL, APIs internas, grafos de conocimiento. Su arquitectura de índices permite construir sistemas RAG (Retrieval Augmented Generation) de alta precisión donde el agente recupera contexto relevante antes de responder. La elección natural cuando el caso de uso implica razonar sobre grandes volúmenes de documentación privada.

RAG Python ~49k stars

Ver guía completa

Pydantic AI

Framework construido sobre Pydantic v2 que lleva la seguridad de tipos al mundo de los agentes. Define la entrada y salida de cada herramienta como modelos Pydantic validados, lo que elimina errores de parsing en tiempo de ejecución. El agente no puede invocar una herramienta con parámetros incorrectos porque el esquema se valida antes de cada llamada. La opción más robusta para equipos que priorizan fiabilidad sobre velocidad de prototipado.

Type-safe Python ~12k stars

Ver guía completa

Categoría 5

Orquestación

Frameworks que coordinan múltiples agentes o flujos de trabajo de forma estructurada, con soporte nativo para TypeScript o paradigmas de coordinación distribuida.

Mastra

Framework de orquestación de agentes nativo en TypeScript. Ofrece un modelo de ejecución basado en flujos de trabajo (workflows) con pasos tipados, reintentos automáticos y registro de ejecución. Integra soporte para herramientas, memoria persistente y modelos de múltiples proveedores desde una API unificada. La opción más madura para equipos Node.js que quieren construir agentes de producción.

Workflows TypeScript

Ver guía completa

OpenSwarm

OpenAI Swarm -- Lightweight multi-agent orchestration

Implementación del paradigma de enjambre (swarm) para agentes IA. En lugar de un orquestador central que distribuye tareas, cada agente del enjambre puede transferir el control a otro agente según el contexto de la conversación. Mínimo, experimental y extremadamente flexible. Ideal para arquitecturas donde la especialización dinámica importa más que la estructura rígida.

Swarm Python

Ver guía completa

Categoría 6

Protocolo

Estándares abiertos que definen cómo los modelos se comunican con herramientas y con otros sistemas, con independencia del framework de orquestación.

MCP — Model Context Protocol

Model Context Protocol -- Documentación oficial

Protocolo abierto propuesto por Anthropic que define un estándar de comunicación entre modelos de lenguaje y herramientas externas. Funciona como el "USB-C de la IA": cualquier agente compatible con MCP puede usar cualquier servidor MCP sin código de integración específico. A mayo de 2026 existían más de 97 servidores MCP públicos cubriendo desde bases de datos y APIs REST hasta herramientas de sistema de archivos, navegadores y servicios en la nube.

Protocolo Estándar abierto

Ver guía completa

Árbol de decisión simplificado para elegir framework de agentes IA

Decisión

Cómo elegir el framework adecuado para tu proyecto

Seis criterios concretos para evitar elegir el framework equivocado y tener que reescribir la arquitectura seis meses después.

Define el caso de uso antes que el stack

Un agente de soporte al cliente tiene requerimientos muy distintos a un agente de análisis de contratos. El caso de uso determina si necesitas multi-agente, RAG, ejecución local o integración multicanal. Empieza por el "qué" antes del "cómo".

Valora el requisito de privacidad

Si los datos no pueden salir de tu infraestructura (datos médicos, contratos, información financiera confidencial), necesitas ejecución local con Ollama o LLM Studio y un framework que soporte endpoints OpenAI-compatibles on-premise.

Agente único vs. sistema multi-agente

Los sistemas multi-agente son más potentes pero mucho más difíciles de depurar. Si tu tarea puede resolverla un único agente con acceso a las herramientas correctas, no añadas complejidad de orquestación. CrewAI y LlamaIndex empiezan a valer cuando la especialización paralela es genuinamente necesaria.

Estima el coste por operación

Cada llamada al LLM tiene coste. Un agente que ejecuta 10 pasos de razonamiento multiplica el coste por 10. Antes de elegir framework, estima el número de llamadas por tarea y el modelo que vas a usar. Los frameworks con caché de contexto integrado (como los que soportan Claude con prompt caching) pueden reducir el coste hasta un 90%.

Verifica las integraciones que necesitas

Si tu agente necesita conectarse a Salesforce, Google Sheets y tu base de datos PostgreSQL, revisa si el framework tiene esas integraciones antes de comprometerte. LangChain gana aquí con más de 600 integraciones nativas. MCP puede cubrir el gap para herramientas sin integración directa.

Considera el lenguaje de tu equipo

Si tu equipo es Python, tienes todo el ecosistema disponible. Si es Node.js, Mastra y OpenClaw son las opciones más sólidas. Si es PHP, la integración se hace a través de APIs REST que cualquier framework expone: Ollama, LangChain Serve y la API de Claude son todas accesibles desde PHP nativo.

Resumen: regla de decisión rápida

Solo quiero ejecutar modelos en local sin código → Ollama
Soy desarrollador y quiero un asistente de terminal → Claude Code
Quiero construir un chatbot multicanal (Telegram, WhatsApp) → OpenClaw
Necesito un equipo de agentes especializados en Python → CrewAI
Tengo muchos documentos propios y necesito RAG de alta precisión → LlamaIndex
Necesito máxima robustez en producción con validación de tipos → Pydantic AI
Mi stack es Node.js / TypeScript → Mastra
Quiero que mi agente use herramientas de terceros de forma estandarizada → MCP

Frameworks para agentes de IA

Qué es un framework de agentes IA

Por qué importa elegir bien el framework

Las cinco dimensiones para evaluar un framework

El papel del protocolo MCP en el ecosistema

Comparativa rápida: los 6 principales frameworks

Agentes de código

Ejecución local de modelos

Plataformas de agentes

Frameworks multi-agente (Python)

Orquestación

Protocolo

Cómo elegir el framework adecuado para tu proyecto

Define el caso de uso antes que el stack

Valora el requisito de privacidad

Agente único vs. sistema multi-agente

Estima el coste por operación

Verifica las integraciones que necesitas

Considera el lenguaje de tu equipo

No estás seguro qué framework elegir

Crea tu primer agente de IA, paso a paso