Claude Engram
Memoria persistente e inteligencia de sesión para asistentes de programación con IA. Se integra en el ciclo de vida de Claude Code para rastrear automáticamente errores, decisiones y contexto, y luego analiza todo el historial de tu sesión para identificar patrones, predecir lo que necesitarás y buscar en todo lo que hayas discutido.
Cero esfuerzo manual. Funciona con cualquier cliente compatible con MCP.
Qué hace
Automático (hooks — cero invocación):
Rastrea cada edición, error, resultado de prueba y evento de sesión
Captura automáticamente decisiones de tus prompts ("usemos X", "cambiemos a Y")
Inyecta las 3 memorias más relevantes antes de cada edición de archivo
Advierte cuando estás a punto de repetir un error pasado
Detecta bucles de edición (mismo archivo 3+ veces sin progreso)
Sobrevive a la compactación de contexto: crea puntos de control antes y los reinyecta después
Analiza el historial de tu sesión en segundo plano después de cada sesión
Análisis de sesión (automático, en segundo plano):
Analiza los registros completos de conversación de Claude Code (JSONL) después de cada sesión, incluidas las conversaciones con subagentes (Explore, Plan, code-reviewer, etc.)
Extrae decisiones, errores, enfoques y correcciones del usuario mediante análisis estructural + puntuación semántica AllMiniLM (tolerante a errores tipográficos)
Construye un índice de búsqueda en todas las conversaciones pasadas (más de 20k fragmentos con subagentes)
Detecta dificultades recurrentes, patrones de error y correlaciones de edición de archivos
Predice qué archivos y contexto necesitarás antes de las ediciones
Reflexiona sobre los patrones usando un LLM local para sintetizar causas raíz y conocimientos arquitectónicos
En la primera instalación, analiza retroactivamente todo el historial de tu sesión
Bajo demanda (herramientas MCP):
memory: almacenar, buscar, archivar y gestionar memoriassession_mine: buscar conversaciones pasadas, encontrar decisiones, reproducir el historial de archivos, detectar patroneswork: registrar decisiones y errores con razonamientoAdemás: protección de alcance, puntos de control de contexto, seguimiento de convenciones, análisis de impacto
Related MCP server: Doclea MCP
Cómo funciona
Claude Code
|
+-- Hooks (remind.py) <- Intercepts every tool call
| SessionStart / Edit / Bash / Error / Compact / Stop
|
+-- Session Mining (mining/) <- Background intelligence
| JSONL parser -> Extractors -> Search index -> Pattern detection
|
+-- MCP Server (server.py) <- Tools for manual operations
| memory, session_mine, work, scope, context, ...
|
+-- Scorer Server (scorer_server.py) <- Persistent AllMiniLM process
TCP localhost, ~90MB RAM, batch embeddingsLos hooks se activan en cada llamada a herramienta (presupuesto de 1-2s cada uno). El procesamiento pesado ocurre en un subproceso en segundo plano después de finalizar la sesión. El servidor de puntuación permanece cargado en memoria para una puntuación semántica rápida.
Benchmarks
Benchmarks de integración
Estos prueban lo que el producto hace realmente.
Benchmark | Qué prueba | Resultado |
Captura de decisiones (220 prompts) | Detección automática de decisiones desde prompts del usuario | 97.8% precisión, 36.7% recall |
Relevancia de inyección (50 memorias, 15 casos) | Las memorias correctas aparecen antes de las ediciones | 14/15 superado, 100% aislamiento |
Supervivencia a la compactación (6 escenarios) | Las reglas/errores sobreviven a la compresión de contexto | 6/6 |
Captura automática de errores (53 cargas útiles) | Extraer errores, rechazar ruido, deduplicar | 100% recall, 97% precisión |
Alcance multiproyecto (11 casos) | Aislamiento de subproyectos + herencia de espacio de trabajo | 11/11 |
Detección de bucles de edición (12 escenarios) | Detectar espirales vs mejora iterativa | 12/12 |
Análisis de sesión (27 pruebas) | Análisis JSONL, indexación, búsqueda, procesamiento incremental | 27/27 |
Obsidian Vault (25 pruebas) | Compatibilidad con estructura de bóveda PARA + CLAUDE.md | 25/25 |
Reproducir: python tests/bench_integration.py, bench_session_mining.py, bench_obsidian_vault.py
Benchmarks de recuperación
Solo recuperación (recall@k): si la memoria correcta se encuentra en los mejores resultados.
Benchmark | Puntuación |
LongMemEval Recall@5 (500 preguntas) | 0.966 |
LongMemEval Recall@10 | 0.982 |
ConvoMem (250 elementos, 5 categorías) | 0.960 |
LoCoMo R@10 (1,986 preguntas) | 0.649 |
Velocidad | 43ms/consulta |
Búsqueda entre sesiones | 112ms/consulta sobre 7310 fragmentos |
Reproducir: python tests/bench_longmemeval.py, bench_locomo.py, bench_convomem.py
Compatibilidad
Plataforma | Qué funciona | Captura automática |
Claude Code (CLI, escritorio, VS Code, JetBrains) | Todo | Completa: hooks + análisis de sesión |
Cursor | Herramientas MCP (memoria, búsqueda, etc.) | Sin hooks |
Windsurf | Herramientas MCP | Sin hooks |
Continue.dev | Herramientas MCP | Sin hooks |
Zed | Herramientas MCP | Sin hooks |
Cualquier cliente MCP | Herramientas MCP | Sin hooks |
Bóvedas Obsidian | Completa (con CLAUDE.md en la raíz) | Completa con Claude Code |
Instalación
git clone https://github.com/20alexl/claude-engram.git
cd claude-engram
python -m venv venv
source venv/bin/activate # or venv\Scripts\activate on Windows
pip install -e . # Core
pip install -e ".[semantic]" # + AllMiniLM for vector search and semantic scoring
python install.py # Configure hooks, MCP server, and /engram skillConfiguración por proyecto
python install.py --setup /path/to/your/projectO copia .mcp.json a la raíz de tu proyecto.
Nota: El archivo CLAUDE.md en este repositorio es documentación específica de engram; no es necesario para que engram funcione. Los hooks se activan automáticamente y la habilidad /engram proporciona una referencia rápida bajo demanda. Si ya tienes un CLAUDE.md para tu proyecto, mantenlo tal cual y no copies el nuestro encima. Si deseas tener la documentación de engram junto a las reglas de tu proyecto, cámbiale el nombre a CLAUDE-ENGRAM.md (o similar) para que no sobrescriba tu archivo existente; Claude lo verá cuando sea relevante.
Actualización
cd claude-engram
git pull
pip install -e ".[semantic]" # Reinstall if dependencies changed
python install.py # Re-run to update hooks and /engram skillLos hooks y las herramientas MCP recogen los cambios de código inmediatamente (instalación editable). Reconecta el servidor MCP en Claude Code (/mcp) para recargar el proceso del servidor.
Adopción a mitad de proyecto
¿Ya estás inmerso en un proyecto? Instálalo normalmente. En la primera sesión, engram detecta automáticamente el historial de sesiones de Claude Code existente y lo analiza en segundo plano, extrayendo decisiones, errores y patrones de todas las conversaciones pasadas. Sin esfuerzo manual.
Características clave
Sistema de memoria
Búsqueda híbrida: palabra clave + vector AllMiniLM + reranking. Sin ChromaDB.
Inyección puntuada: las 3 mejores memorias por coincidencia de archivo, etiquetas, recencia e importancia antes de cada edición.
Almacenamiento por niveles: activo (rápido) + archivo (frío, buscable, restaurable). Las reglas y los errores nunca se archivan.
Multiproyecto: memorias con alcance por subproyecto. Las reglas del espacio de trabajo se propagan hacia abajo.
Análisis de sesión
Extracción estructural: analiza el flujo de la conversación (confirmaciones, redirecciones, secuencias de error->corrección, cambios de enfoque) en lugar de coincidencia de plantillas.
Indexación de contenido de herramientas: los comandos bash + salida, diferencias de edición y seguimientos de errores son buscables junto con el texto de la conversación.
Embeddings por lotes: 22 veces más rápido que las llamadas individuales mediante protocolo TCP por lotes.
Búsqueda entre sesiones: más de 44k fragmentos de conversación indexados, búsqueda semántica + palabra clave + híbrida.
Detección de patrones: dificultades recurrentes, patrones de error, correlaciones de edición entre sesiones.
Contexto predictivo: antes de las ediciones, muestra archivos relacionados y posibles errores del historial.
Aprendizaje entre proyectos: agrega patrones en todos tus proyectos.
Bootstrap retroactivo: analiza todo el historial de sesiones existente en la primera instalación.
Inicio automático del puntuador: el servidor AllMiniLM se inicia bajo demanda si no se está ejecutando. Sin degradación silenciosa.
Ciclo de vida
Captura automática de decisiones: patrones estructurales (confirmaciones, redirecciones, elecciones explícitas) + puntuación semántica como bono.
Rastreo automático de errores de cualquier herramienta fallida. Solo registra errores en archivos del proyecto (filtra ruido transitorio). Advierte antes de ediciones repetidas.
Sobrevive a la compactación: puntos de control con decisiones/errores de sesión, reinyecta después.
Detección de bucles de edición: marca cuando el mismo archivo se edita 3+ veces sin progreso.
Configuración
Variable | Predeterminado | Descripción |
|
| Modelo Ollama (opcional: solo para scout_search, verificación de convenciones) |
|
| Días hasta que las memorias inactivas se archiven |
|
| Tiempo de espera de inactividad del servidor AllMiniLM (segundos) |
Reindexación
Si la calidad de la búsqueda es deficiente o deseas reconstruir después de una actualización:
python scripts/reindex.py "E:\workspace" --force # rebuild search index
python scripts/reindex.py "E:\workspace" --force --extract # also re-extract decisions/mistakesO mediante MCP: session_mine(operation="reindex", mode="bootstrap")
Documentación
Libro de la biblioteca: filosofía de diseño, aspectos internos, guía de uso completa, referencia de API, advertencias y registro de cambios.
/engram: comando de barra diagonal con referencia rápida de herramientas (instalado por install.py).
Licencia
MIT
Maintenance
Latest Blog Posts
MCP directory API
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/20alexl/claude-engram'
If you have feedback or need assistance with the MCP directory API, please join our Discord server
