171 000 estrellas · v0.23.2 estable —

Ollama GitHub: repositorio, contribuciones e integraciones de la comunidad

El repositorio GitHub de Ollama en github.com/ollama/ollama es uno de los proyectos de IA en local con mayor crecimiento en la historia de GitHub: más de 171 000 estrellas y 16 100 forks a mayo de 2026. En esta guía encontrarás cómo está estructurado el proyecto, cómo contribuir al código, cómo compilar desde el código fuente, el ritmo de releases y el ecosistema de integraciones que la comunidad ha construido alrededor de Ollama.

Lo más importante del repositorio Ollama
  • 171 000 estrellas y 16 100 forks en GitHub a mayo de 2026: uno de los proyectos de IA local con mayor crecimiento.
  • Escrito en Go (66,8%) y C (27%) sobre llama.cpp: arquitectura que permite un binario único y portable con alto rendimiento nativo.
  • Más de 214 releases publicados, con cadencia aproximada de una release por semana. Última estable: v0.23.2 (7 mayo 2026).
  • El ecosistema de integraciones incluye más de 200 proyectos de la comunidad: interfaces web, extensiones de editor, frameworks de agentes y librerías.
  • Open WebUI, la interfaz web más popular para Ollama, cuenta con 137 000 estrellas propias en GitHub.
Flujo de trabajo con el repositorio GitHub de Ollama: clonar, compilar, ejecutar y contribuir
Flujo de trabajo con el repositorio de Ollama: desde clonar hasta contribuir, con estadísticas clave del proyecto.
Datos actualizados mayo 2026

Estadísticas del repositorio GitHub de Ollama

El repositorio github.com/ollama/ollama se ha convertido en uno de los proyectos open-source de infraestructura de IA más importantes del ecosistema.

Captura del repositorio oficial
Captura del repositorio GitHub de Ollama mostrando estrellas, forks y descripción
El repositorio oficial de Ollama en GitHub, mostrando más de 171K estrellas y el listado de los modelos soportados más populares.
171 000+ estrellas
Posiciona a Ollama entre los repositorios de herramientas de IA con mayor crecimiento en GitHub. Supero las 100K estrellas en menos de 18 meses desde su lanzamiento público.
16 100+ forks
Alto número de forks indica una comunidad activa de desarrolladores que experimentan con el código base, crean integraciones propias o contribuyen mejoras al proyecto principal.
214+ releases
Ritmo de desarrollo muy activo con nuevas releases casi semanales. Esto refleja la velocidad con que el equipo incorpora soporte para nuevos modelos, mejoras de rendimiento y correcciones de bugs.
Desglose de lenguajes en el repositorio de Ollama — mayo 2026
Lenguaje Porcentaje Uso principal
Go 66,8% Servidor HTTP, API REST, gestión de modelos, CLI, orquestación
C 27,0% Inferencia de bajo nivel (llama.cpp), bindings de GPU, cuantización
TypeScript 3,2% Herramientas de desarrollo, tests de integración de la API
C++ 1,1% Extensiones de llama.cpp, soporte Metal (Apple Silicon)
Shell 0,5% Scripts de instalación y CI/CD
Objective-C 0,5% Integración macOS nativa
Arquitectura interna

Estructura del proyecto: cómo está organizado el código

Entender la estructura del repositorio facilita tanto la contribución al proyecto como la comprensión de cómo Ollama gestiona los modelos internamente.

El repositorio tiene una organización clara que separa las responsabilidades en capas: la capa de servidor y API en Go, la capa de inferencia en C/C++ (basada en llama.cpp) y los bindings entre ambas. Las carpetas principales son:

api/ — definiciones de la API

Estructuras de datos Go para todas las peticiones y respuestas de la API REST. Aquí se definen los tipos que corresponden a los endpoints /api/generate, /api/chat, /api/embed y el resto de la API publica.

server/ — lógica del servidor

El servidor HTTP en Go que expone la API, gestiona las peticiones concurrentes, coordina la carga y descarga de modelos, y gestiona las sesiones de chat. Es el núcleo de Ollama como servicio.

llm/ — motor de inferencia

Bindings Go para llama.cpp y la lógica de gestión de backends de inferencia. Esta capa abstrae las diferencias entre CPU, CUDA (NVIDIA), ROCm (AMD) y Metal (Apple Silicon), exponiendo una interfaz unificada al servidor.

model/ — gestión de modelos

Lógica para descargar, verificar, almacenar y cargar modelos en formato GGUF. Gestiona el registro local de modelos, el sistema de capas (layers) similar a Docker y la compatibilidad de formatos.

cmd/ — interfaz de línea de comandos

La CLI de Ollama: los comandos run, pull, push, list, rm y serve. Implementados sobre la API interna con salida adaptada para terminal.

docs/ — documentación técnica

Referencia de la API, guías de desarrollo, FAQ técnico y notas de compatibilidad. La documentación principal está migrando a docs.ollama.com pero el repositorio mantiene la versión de referencia en Markdown.

Historial de versiones

Últimas releases: qué hay de nuevo en Ollama

Ollama publica nuevas versiones con alta frecuencia. Las releases recientes muestran el enfoque actual del proyecto: rendimiento, soporte para Apple Silicon y mejoras de integración.

v0.23.3 — 12 mayo 2026 (pre-release)

Mejoras en el backend MLX para Apple Silicon: comportamiento de push de modelos refinado y corrección de fugas del target macOS 26 en archivos metallib. Orientado a mejorar la estabilidad en los Macs con chip Apple.

v0.23.2 — 7 mayo 2026 (estable)

Las respuestas de /api/show ahora se cachean, mejorando la latencia mediana en un 6,7x para aplicaciones que consultan información del modelo frecuentemente (como integraciones de Claude Desktop). Se eliminó el soporte de Claude Desktop del comando ollama launch.

v0.23.1 — 5 mayo 2026

Soporte de decodificación especulativa MTP para Gemma 4 en Mac. El resultado pratico es una mejora de más del 2x en velocidad para el modelo Gemma 4 31B en tareas de código en hardware Apple Silicon.

v0.23.0 — 3 mayo 2026

Integración con Claude Desktop y Claude Code via ollama launch. Recomendaciones de modelos impulsadas por el servidor que no requieren actualizar Ollama. Mejoras en la inicialización de Metal en macOS.

v0.22.1 — 28 abril 2026

Renderer actualizado para Gemma 4 con mejoras en thinking y tool-calling. Las recomendaciones de modelos ahora se pueden actualizar independientemente de la versión de Ollama instalada, separando el ciclo de vida de datos y software.

Puedes ver el historial completo de releases en github.com/ollama/ollama/releases . Para recibir notificaciones de nuevas versiones, usa el boton "Watch" del repositorio y selecciona "Releases only" en la configuración de notificaciones de GitHub.

Guía de contribución

Cómo contribuir al repositorio de Ollama

Ollama acepta contribuciones de la comunidad según el proceso estándar de GitHub. Aquí tienes los pasos concretos y los tipos de contribución más bienvenidos.

Proceso de contribución paso a paso

1. Fork y clone

Haz fork del repositorio en tu cuenta de GitHub y clona tu fork en local. Agrega el repositorio original como remote upstream para mantener tu fork actualizado.

2. Rama de trabajo

Crea una rama con un nombre descriptivo del cambio que vas a hacer. Convenciones habituales: fix/nombre-del-bug, feat/nombre-de-la-feature, docs/seccion.

3. Desarrollar y testar

Implementa el cambio y ejecuta los tests del proyecto con go test ./.... Para cambios en la interfaz de usuario de la CLI, verifica el comportamiento manual con go run . serve en modo desarrollo.

4. Pull Request

Abre un Pull Request contra la rama main del repositorio original. El PR debe incluir: descripción clara del cambio, razón del cambio, cómo testarlo y referencias a Issues relacionados si los hay.

Comandos de desarrollo

# Clonar el repositorio (usa tu fork)
git clone https://github.com/TU_USUARIO/ollama.git
cd ollama

# Agregar upstream para sincronizar con el original
git remote add upstream https://github.com/ollama/ollama.git

# Actualizar tu fork con los cambios del original
git fetch upstream
git merge upstream/main

# Crear una rama de trabajo
git checkout -b fix/nombre-del-bug

# Compilar para verificar que el codigo compila
go build .

# Ejecutar tests
go test ./...

# Iniciar el servidor en modo desarrollo
go run . serve

# En otra terminal: probar con la CLI local
go run . run llama3.2:3b

Tipos de contribución bienvenidos

Correcciones de bugs
Reportar bugs con pasos reproducibles es igualmente valioso que la corrección. Para reportar, abre un Issue con: versión de Ollama, sistema operativo, GPU, modelo afectado y pasos para reproducir.
Documentación
Mejoras al README, correcciones en docs/, ejemplos de uso y guías de integración. La documentación en español no existe en el repositorio oficial: una oportunidad de contribución única.
Soporte para nuevos modelos
Agregar plantillas de prompts, configuraciones de parámetros o adaptadores para modelos nuevos que aún no están en la librería de Ollama. Requiere conocer el formato Modelfile y las peculiaridades de cada arquitectura.
Mejoras de rendimiento
Optimizaciones en la gestión de memoria, mejoras en el tiempo de carga de modelos, reducción de latencia en la API o mejoras en el soporte de hardware específico (nuevas GPU, plataformas ARM).
Build desde código

Compilar Ollama desde el código fuente

Compilar Ollama desde el código fuente es necesario cuando quieres aplicar parches propios, usar una versión de desarrollo o contribuir al proyecto. El proceso requiere Go, CMake y un compilador C.

Requisitos previos

Go 1.22+
El compilador Go. Descarga desde go.dev/dl. Verifica con go version.
CMake 3.24+
Sistema de build para compilar las dependencias C/C++ de llama.cpp. Disponible en el gestor de paquetes del sistema.
GCC / Clang / MSVC
Compilador C/C++ del sistema. En Linux: gcc. En macOS: Xcode Command Line Tools. En Windows: MSVC o MinGW.

Compilación en Linux y macOS

# 1. Clonar el repositorio
git clone https://github.com/ollama/ollama.git
cd ollama

# 2. Compilar las dependencias nativas (llama.cpp y backends GPU)
# Este paso descarga y compila las dependencias de C/C++)
go generate ./...

# 3. Compilar el binario de Ollama
go build .

# 4. Verificar que el binario funciona
./ollama --version

# 5. Iniciar el servidor con el binario compilado
./ollama serve

Compilación con soporte CUDA (NVIDIA)

# Instalar CUDA Toolkit 11.8+ antes de compilar
# https://developer.nvidia.com/cuda-downloads

# Verificar que nvcc esta disponible
nvcc --version

# Compilar con soporte CUDA activado automaticamente
# go generate detecta CUDA y activa el backend correspondiente
go generate ./...
go build .

# Verificar que el backend CUDA esta disponible
./ollama info

Compilación en Windows

# Requisitos adicionales en Windows:
# - Visual Studio Build Tools 2022 con "Desktop development with C++"
# - O MinGW-w64 (gcc para Windows)

# En PowerShell con el entorno de VS activado:
git clone https://github.com/ollama/ollama.git
cd ollama

# Compilar dependencias (puede tardar varios minutos)
go generate ./...

# Compilar el ejecutable
go build -o ollama.exe .

# Verificar
.\ollama.exe --version

El paso go generate ./... es el que más tiempo consume: descarga y compila llama.cpp junto con los backends de GPU. En una maquina moderna puede tardar entre 5 y 20 minutos dependiendo del hardware. Los pasos posteriores son rápidos (menos de 1 minuto para el binario Go).

Ecosistema

Integraciones de la comunidad: el ecosistema alrededor de Ollama

El repositorio oficial de Ollama lista más de 200 integraciones de la comunidad. Aquí presentamos las más utilizadas y con mayor impacto en el ecosistema.

Interfaces web y de escritorio

Open WebUI
Captura de Open WebUI, la interfaz web para Ollama
La interfaz web más popular para Ollama con 137 000 estrellas en GitHub. Ofrece una experiencia tipo ChatGPT: historial de conversaciones, gestión de modelos, RAG con documentos, generación de imágenes y soporte multiusuario. Se instala con Docker en un comando.
137K estrellas
Ollama Web UI alternativas
Además de Open WebUI, existen otras interfaces populares:
  • Lobe Chat — interfaz moderna con plugins
  • Msty — aplicación de escritorio nativa para macOS y Windows
  • Enchanted — cliente nativo para iOS y macOS
  • Chatbox — aplicación de escritorio multiplataforma
  • AnythingLLM — enfocado en RAG y documentos

Extensiones para editores de código

Continue
Extensión para VS Code y JetBrains con 33 000 estrellas. Permite usar Ollama como backend para chat de código integrado en el editor, autocompletado inline y revisión de código. Completamente configurable via un archivo JSON en el proyecto.
33K estrellas
Otras integraciones de editor
  • CodeGPT — extensión VS Code con soporte Ollama
  • Ollama para Neovim — plugin para usuarios de Neovim
  • tgpt — cliente de terminal para Ollama
  • Aider — asistente de código en terminal con soporte Ollama
  • Cursor — acepta Ollama como backend OpenAI-compatible

Frameworks de agentes y librerías

LangChain
Integración oficial en LangChain via langchain-ollama. Permite usar cualquier modelo de Ollama como LLM base para cadenas, agentes, RAG y pipelines complejos en Python o JavaScript.
LlamaIndex
Soporte nativo para Ollama como LLM y como proveedor de embeddings. Ideal para construir pipelines RAG completos con modelos locales: indexación, recuperación y generación en local.
Dify, Flowise y n8n
Plataformas no-code/low-code para construir aplicaciones con IA que soportan Ollama como proveedor local. Permiten crear flujos de trabajo, agentes y chatbots sin código mediante interfaces visuales.
Principales integraciones de la comunidad de Ollama — mayo 2026
Integración Categoría Estrellas GitHub Descripción
Open WebUI Interfaz web ~137 000 Chat completo con RAG, gestión de modelos y multiusuario
Continue Extensión editor ~33 000 Asistente de código para VS Code y JetBrains
LangChain (Python) Framework agentes ~100 000 Integración oficial via langchain-ollama
LlamaIndex Framework RAG ~40 000 LLM y embeddings locales para pipelines RAG
AnythingLLM Interfaz RAG ~40 000 Chat con documentos propios usando Ollama en local
Msty App escritorio Cliente nativo para macOS y Windows con gestión de modelos
Crawl4AI Web crawling ~30 000 Extracción de datos web con LLMs locales via Ollama
Comunidad

Issues, discusiones y recursos de la comunidad

Además del repositorio GitHub, Ollama tiene una comunidad activa en varios canales donde puedes encontrar ayuda, compartir proyectos y seguir las novedades del proyecto.

Discord oficial
El servidor de Discord de Ollama es el canal más activo de la comunidad. Tiene canales separados para soporte técnico, presentación de proyectos, desarrollo y discusión general. Acceso via el enlace en el README del repositorio.
GitHub Discussions
Para preguntas técnicas sobre uso de la API, configuración avanzada, compatibilidad de modelos y propuestas de nuevas funcionalidades. Las Discussions son el lugar para conversaciones que no son bugs concretos.
GitHub Issues
Para reportar bugs con pasos reproducibles. El tracker de issues del repositorio tiene etiquetas como good first issue que identifican bugs apropiados para nuevos contribuidores.
Blog oficial y Reddit
El blog en ollama.com/blog publica anuncios de nuevas funcionalidades y tutoriales oficiales. El subreddit r/ollama tiene discusiones activas sobre casos de uso y proyectos de la comunidad.
Preguntas frecuentes

Preguntas frecuentes sobre el repositorio GitHub de Ollama

El repositorio de Ollama en GitHub supera las 171.000 estrellas a mayo de 2026, con más de 16.100 forks. Es uno de los repositorios de herramientas de IA en local con mayor crecimiento en los últimos dos años, y figura entre los proyectos más destacados de la categoría de infraestructura de IA open-source.

Ollama está escrito principalmente en Go (66,8% del código), que gestiona la lógica del servidor, la API REST y la orquestación de modelos. El 27% está en C, correspondiente a las capas de inferencia de bajo nivel basadas en llama.cpp. Esta combinación permite un binario único y portable con alto rendimiento en inferencia nativa sin dependencias externas en tiempo de ejecución.

Para contribuir a Ollama hay que hacer fork del repositorio en github.com/ollama/ollama, crear una rama con el cambio, asegurarse de que los tests pasan con go test ./..., y abrir un Pull Request describiendo el cambio. Para cambios grandes es recomendable abrir primero un Issue discutiendo el enfoque con los mantenedores. Los tipos de contribución más bienvenidos son correcciones de bugs, mejoras de documentación, soporte para nuevos modelos y mejoras de rendimiento.

La última versión estable a mayo de 2026 es v0.23.2, publicada el 7 de mayo. Esta versión incluye caché de respuestas /api/show que mejora la latencia mediana en 6,7x para integraciones que consultan información del modelo frecuentemente. El repositorio publica releases con frecuencia aproximada de una por semana, con un total de más de 214 releases desde el inicio del proyecto.

El ecosistema de integraciones de Ollama es muy amplio. Las más destacadas son: Open WebUI (137K estrellas, interfaz web tipo ChatGPT), Continue (33K estrellas, extensión para VS Code y JetBrains), integración oficial en LangChain, soporte en LlamaIndex, Dify, Flowise y otros frameworks de agentes. El repositorio oficial mantiene una lista curada de más de 200 integraciones en su README.

Sí. Para compilar Ollama desde el código fuente necesitas Go 1.22+, CMake 3.24+ y un compilador C/C++ (GCC en Linux, Xcode Command Line Tools en macOS, MSVC o MinGW en Windows). El proceso es: clonar el repositorio, ejecutar go generate ./... para compilar las dependencias nativas de llama.cpp (este paso puede tardar 5-20 minutos), y luego go build . para obtener el binario. La documentación detallada está en el archivo DEVELOPMENT.md del repositorio.

Aprende a instalar y usar Ollama desde cero

Si aún no tienes Ollama en tu máquina, la guía de instalación cubre Windows, macOS y Linux con todos los pasos para tener tu primer modelo corriendo en local en menos de 10 minutos.

Ver guía de instalación de Ollama
Guía gratuita

Crea tu primer agente de IA, paso a paso

Descarga la guía en PDF: 12 secciones, ejemplos reales y datos de 2026. Gratis.