Qué es un framework de agentes IA
Un framework de agentes IA es el conjunto de herramientas, bibliotecas y abstracciones que permite conectar un modelo de lenguaje (LLM) con el mundo real: bases de datos, APIs externas, terminales, navegadores y cualquier sistema que pueda ejecutar acciones. Sin un framework, el modelo solo puede generar texto. Con un framework, el modelo puede planificar, actuar, observar el resultado y replantear su estrategia hasta completar una tarea compleja de principio a fin.
El término "framework" agrupa categorías muy distintas. Hay herramientas de ejecución local que descargan y sirven modelos en tu propio hardware (Ollama, LLM Studio); CLIs de agente que convierten al propio LLM en un asistente de terminal capaz de editar código y ejecutar comandos (Claude Code); frameworks Python de orquestación multi-agente que permiten definir equipos de especialistas con roles diferenciados (CrewAI, LangChain, LlamaIndex, Pydantic AI); plataformas de despliegue que abstraen la infraestructura y permiten servir agentes en producción con un par de clics (OpenClaw, Hermes Agent); y protocolos estándar que hacen que cualquier agente pueda hablar con cualquier herramienta sin integraciones ad-hoc (MCP).
Por qué importa elegir bien el framework
La elección del framework no es solo una decisión técnica: condiciona la velocidad de iteración, el coste de infraestructura, la facilidad de mantenimiento y los límites de lo que tu agente puede hacer. Un equipo que elige LangChain cuando solo necesita ejecutar modelos en local va a cargar con cientos de dependencias innecesarias. Un equipo que elige Ollama cuando necesita orquestación multi-agente va a reescribir desde cero toda la lógica de planificación.
A , el ecosistema de frameworks ha madurado significativamente. Ollama superaba las 171.000 estrellas en GitHub y se había convertido en el estándar de facto para ejecutar modelos en local. CrewAI rondaba las 50.000 estrellas tras dos años de crecimiento explosivo. LangChain, a pesar de su complejidad, seguía siendo el más utilizado en proyectos de producción gracias a su ecosistema de integraciones. Y Claude Code había democratizado la figura del agente de terminal entre los desarrolladores individuales.
Las cinco dimensiones para evaluar un framework
Antes de entrar en la comparativa, conviene entender las dimensiones que realmente importan a la hora de elegir:
- Abstracción vs. control. Los frameworks más opinados (CrewAI, Hermes Agent) te dan una estructura predefinida que acelera el desarrollo pero limita la personalización. Los más primitivos (LangChain en modo bajo nivel, Pydantic AI) exigen más código pero permiten arquitecturas arbitrarias. Elige según la singularidad de tu caso de uso.
- Lenguaje y ecosistema. Python domina el espacio de agentes IA por su ecosistema científico. Pero TypeScript es la opción natural si tu stack es Node.js (Mastra, OpenClaw). PHP puede integrar agentes a través de APIs REST, pero los frameworks nativos de orquestación son escasos.
- Local vs. cloud. Si la privacidad de los datos es crítica, necesitas ejecución local: Ollama o LLM Studio para los modelos, y un framework que soporte conexión a endpoints OpenAI-compatibles. Si puedes usar cloud, el abanico de modelos disponibles se amplía.
- Agente único vs. multi-agente. Para tareas lineales, un agente único con acceso a herramientas es suficiente y mucho más fácil de depurar. Para tareas que requieren especialización paralela (investigación + redacción + revisión, por ejemplo), un sistema multi-agente como CrewAI o OpenSwarm multiplica la capacidad pero también la complejidad.
- Coste operativo. Ejecutar 100.000 llamadas a GPT-5 cuesta decenas de veces más que ejecutar el mismo volumen con un modelo de 8B parámetros en local. El framework determina si puedes cambiar de modelo con un solo parámetro o si eso requiere reescribir toda la capa de integración.
El papel del protocolo MCP en el ecosistema
Merece mención especial el Model Context Protocol (MCP), el estándar abierto propuesto por Anthropic que define cómo los modelos se conectan con herramientas externas de forma estandarizada. MCP no es un framework de orquestación sino un protocolo de comunicación, pero su adopción creciente lo convierte en una pieza transversal: Claude Code lo usa como mecanismo de extensión, y cada vez más frameworks Python están añadiendo soporte nativo. Si tu agente va a integrarse con múltiples herramientas de terceros, entender MCP antes de elegir framework te ahorrará trabajo de integración significativo.
Con este contexto en mente, pasamos a la comparativa y al directorio completo de frameworks.
Comparativa rápida: los 6 principales frameworks
Tabla de referencia rápida. Para el análisis completo, accede a la página de cada framework.
| Framework | Lenguaje | Tipo | GitHub Stars | Mejor para |
|---|---|---|---|---|
| Claude Code | TypeScript / CLI | Agente de terminal | ~8.1k búsquedas/mes | Desarrollo de software con IA |
| Ollama | Go / API REST | Ejecución local | ~171k | Modelos locales, privacidad, sin nube |
| CrewAI | Python | Multi-agente | ~50.8k | Equipos de agentes especializados |
| LangChain | Python / JS | Orquestación | ~92k | Integraciones complejas en producción |
| MCP | Protocolo abierto | Estándar de conexión | 5.800+ servidores | Conectar cualquier agente a cualquier herramienta |
| Pydantic AI | Python | Agentes tipados | ~17k | Producción con validación estricta de datos |
Agentes de código
Herramientas que convierten al LLM en un desarrollador autónomo: leen el repositorio, editan archivos, ejecutan comandos y hacen commit de los cambios.
Ejecución local de modelos
Herramientas para descargar y ejecutar modelos de lenguaje directamente en tu hardware, sin depender de APIs externas. Ideales cuando la privacidad de los datos es crítica o cuando quieres eliminar el coste variable por token.
Plataformas de agentes
Plataformas de alto nivel que abstraen la infraestructura y permiten desplegar agentes conectados a múltiples canales (Telegram, WhatsApp, Discord, web) sin gestionar servidores ni integraciones individuales.
Frameworks multi-agente (Python)
Bibliotecas Python para definir, orquestar y ejecutar sistemas donde varios agentes con roles especializados colaboran para completar tareas complejas. El corazón del desarrollo de agentes en producción.
Orquestación
Frameworks que coordinan múltiples agentes o flujos de trabajo de forma estructurada, con soporte nativo para TypeScript o paradigmas de coordinación distribuida.
Protocolo
Estándares abiertos que definen cómo los modelos se comunican con herramientas y con otros sistemas, con independencia del framework de orquestación.
Cómo elegir el framework adecuado para tu proyecto
Seis criterios concretos para evitar elegir el framework equivocado y tener que reescribir la arquitectura seis meses después.
Define el caso de uso antes que el stack
Un agente de soporte al cliente tiene requerimientos muy distintos a un agente de análisis de contratos. El caso de uso determina si necesitas multi-agente, RAG, ejecución local o integración multicanal. Empieza por el "qué" antes del "cómo".
Valora el requisito de privacidad
Si los datos no pueden salir de tu infraestructura (datos médicos, contratos, información financiera confidencial), necesitas ejecución local con Ollama o LLM Studio y un framework que soporte endpoints OpenAI-compatibles on-premise.
Agente único vs. sistema multi-agente
Los sistemas multi-agente son más potentes pero mucho más difíciles de depurar. Si tu tarea puede resolverla un único agente con acceso a las herramientas correctas, no añadas complejidad de orquestación. CrewAI y LlamaIndex empiezan a valer cuando la especialización paralela es genuinamente necesaria.
Estima el coste por operación
Cada llamada al LLM tiene coste. Un agente que ejecuta 10 pasos de razonamiento multiplica el coste por 10. Antes de elegir framework, estima el número de llamadas por tarea y el modelo que vas a usar. Los frameworks con caché de contexto integrado (como los que soportan Claude con prompt caching) pueden reducir el coste hasta un 90%.
Verifica las integraciones que necesitas
Si tu agente necesita conectarse a Salesforce, Google Sheets y tu base de datos PostgreSQL, revisa si el framework tiene esas integraciones antes de comprometerte. LangChain gana aquí con más de 600 integraciones nativas. MCP puede cubrir el gap para herramientas sin integración directa.
Considera el lenguaje de tu equipo
Si tu equipo es Python, tienes todo el ecosistema disponible. Si es Node.js, Mastra y OpenClaw son las opciones más sólidas. Si es PHP, la integración se hace a través de APIs REST que cualquier framework expone: Ollama, LangChain Serve y la API de Claude son todas accesibles desde PHP nativo.
- Solo quiero ejecutar modelos en local sin código → Ollama
- Soy desarrollador y quiero un asistente de terminal → Claude Code
- Quiero construir un chatbot multicanal (Telegram, WhatsApp) → OpenClaw
- Necesito un equipo de agentes especializados en Python → CrewAI
- Tengo muchos documentos propios y necesito RAG de alta precisión → LlamaIndex
- Necesito máxima robustez en producción con validación de tipos → Pydantic AI
- Mi stack es Node.js / TypeScript → Mastra
- Quiero que mi agente use herramientas de terceros de forma estandarizada → MCP
No estás seguro qué framework elegir
Responde 5 preguntas sobre tu caso de uso, stack técnico y presupuesto. Nuestro selector te recomienda el framework más adecuado con una explicación detallada.
Usar el selector de frameworks