Problemas Técnicos y Controversia Comunitaria de Ollama

✍️ OpenClawRadar📅 Publicado: 18 de abril de 2026🔗 Source
Problemas Técnicos y Controversia Comunitaria de Ollama
Ad

Tecnología Central de Ollama y Problemas de Atribución

Toda la capacidad de inferencia de Ollama originalmente provenía de llama.cpp, el motor de inferencia en C++ creado por Georgi Gerganov en marzo de 2023. Durante más de un año, el README de Ollama no contenía mención alguna de llama.cpp, y sus distribuciones binarias no incluían el aviso de licencia MIT requerido para el código de llama.cpp que estaban distribuyendo.

La comunidad abrió el issue #3185 en GitHub a principios de 2024 solicitando el cumplimiento de la licencia, el cual pasó más de 400 días sin respuesta de los mantenedores. Cuando se abrió el issue #3697 en abril de 2024 solicitando específicamente el reconocimiento de llama.cpp, el cofundador de Ollama, Michael Chiang, eventualmente agregó una sola línea al final del README: "Proyecto llama.cpp fundado por Georgi Gerganov."

Problemas Técnicos con el Backend Personalizado

A mediados de 2025, Ollama dejó de usar llama.cpp como su backend de inferencia y construyó una implementación personalizada directamente sobre ggml. Este backend personalizado reintrodujo errores que llama.cpp había resuelto años atrás, incluyendo:

  • Soporte de salida estructurada roto
  • Fallos en modelos de visión
  • Caídas por aserciones GGML en múltiples versiones
  • Modelos que funcionaban bien en el upstream de llama.cpp fallaban en Ollama
  • Falta de soporte para tipos de tensores requeridos por nuevas versiones como GPT-OSS 20B

Georgi Gerganov identificó que Ollama había bifurcado y realizado malos cambios a GGML.

Ad

Benchmarks de Rendimiento

Múltiples pruebas de la comunidad muestran que llama.cpp funciona 1.8 veces más rápido que Ollama en el mismo hardware con el mismo modelo:

  • 161 tokens por segundo versus 89 tokens por segundo
  • En CPU, la brecha de rendimiento es del 30-50%
  • Una comparación reciente en Qwen-3 Coder 32B mostró ~70% más de rendimiento con llama.cpp

La sobrecarga de rendimiento proviene de la capa daemon de Ollama, heurísticas deficientes de descarga de GPU y un backend vendido que va a la zaga del upstream.

Problemas con la Denominación de Modelos

Cuando DeepSeek lanzó su familia de modelos R1 en enero de 2025, Ollama listó las versiones destiladas más pequeñas (modelos como DeepSeek-R1-Distill-Qwen-32B) sin indicar claramente que eran destiladas en lugar de los modelos completos.

📖 Leer la fuente completa: HN LLM Tools

Ad

👀 Ver también

OpenClaw como Interfaz de Infraestructura como Código para la Gestión de Laboratorios Domésticos
Herramientas

OpenClaw como Interfaz de Infraestructura como Código para la Gestión de Laboratorios Domésticos

OpenClaw se transforma de un dispositivo de IA a la interfaz principal de la computadora para la gestión del laboratorio doméstico, ejecutando tareas como configurar contenedores de Traefik, crear configuraciones de Dashy y configurar el acceso a Tailscale con acceso directo a la máquina.

OpenClawRadar
ClaudeMeter: Aplicación de Barra de Menú de macOS de Código Abierto para el Seguimiento en Tiempo Real del Uso de Claude
Herramientas

ClaudeMeter: Aplicación de Barra de Menú de macOS de Código Abierto para el Seguimiento en Tiempo Real del Uso de Claude

ClaudeMeter es una aplicación gratuita y de código abierto para la barra de menú de macOS para suscriptores de Claude Max que muestra porcentajes de uso de sesión y semanal, temporizadores de reinicio e indicadores de ritmo sin interrumpir el flujo de trabajo. Toda la aplicación fue construida usando Claude (Claude Code/Opus) para el código Swift, el backend Supabase y las Edge Functions.

OpenClawRadar
Los usuarios de OpenClaw informan cuellos de botella en la planificación y revisión con agentes de IA.
Herramientas

Los usuarios de OpenClaw informan cuellos de botella en la planificación y revisión con agentes de IA.

Los usuarios de OpenClaw describen los flujos de trabajo de planificación y revisión como 'parecidos a MS-DOS' a pesar de la generación de código efectiva, citando la intervención manual, la fragmentación de documentos y la pérdida de razonamiento durante la colaboración entre agentes. Algunos están experimentando con editores de documentos nativos para agentes como comment.io y Proof by Every.

OpenClawRadar
Signet: Capa de Memoria de Código Abierto para Agentes de IA de Programación Alcanza 80% de F1 en LoCoMo
Herramientas

Signet: Capa de Memoria de Código Abierto para Agentes de IA de Programación Alcanza 80% de F1 en LoCoMo

Signet es un sistema de memoria de código abierto para agentes de IA de programación que logra un 80% de F1 en el benchmark LoCoMo, en comparación con el 41% del RAG estándar. Extrae recuerdos después de cada sesión e inyecta contexto relevante antes de los prompts, ejecutándose localmente con SQLite.

OpenClawRadar