Claude Engram
Persistenter Speicher und Sitzungsintelligenz für KI-Coding-Assistenten. Klinkt sich in den Lebenszyklus von Claude Code ein, um Fehler, Entscheidungen und Kontext automatisch zu verfolgen – und durchsucht dann Ihre gesamte Sitzungshistorie, um Muster aufzudecken, vorherzusagen, was Sie benötigen, und alles zu durchsuchen, was Sie jemals besprochen haben.
Kein manueller Aufwand. Funktioniert mit jedem MCP-kompatiblen Client.
Was es tut
Automatisch (Hooks – kein Aufruf erforderlich):
Verfolgt jede Bearbeitung, jeden Fehler, jedes Testergebnis und jedes Sitzungsereignis
Erfasst automatisch Entscheidungen aus Ihren Prompts („lass uns X verwenden“, „zu Y wechseln“)
Injiziert die 3 relevantesten Erinnerungen vor jeder Dateibearbeitung
Warnt, wenn Sie einen früheren Fehler zu wiederholen drohen
Erkennt Bearbeitungsschleifen (dieselbe Datei 3+ Mal ohne Fortschritt)
Übersteht Kontextkomprimierung – Checkpoints davor, Re-Injektion danach
Durchsucht Ihre Sitzungshistorie im Hintergrund nach jeder Sitzung
Sitzungs-Mining (automatisch, im Hintergrund):
Analysiert die vollständigen Konversationsprotokolle (JSONL) von Claude Code nach jeder Sitzung – einschließlich Unteragenten-Konversationen (Explore, Plan, code-reviewer, etc.)
Extrahiert Entscheidungen, Fehler, Ansätze und Benutzerkorrekturen mittels struktureller Analyse + AllMiniLM semantischem Scoring (tippfehler-tolerant)
Erstellt einen durchsuchbaren Index über alle vergangenen Konversationen (20k+ Chunks mit Unteragenten)
Erkennt wiederkehrende Schwierigkeiten, Fehler-Muster und Korrelationen bei Dateibearbeitungen
Sagt voraus, welche Dateien und welchen Kontext Sie vor Bearbeitungen benötigen
Reflektiert Muster mithilfe eines lokalen LLM, um Grundursachen und architektonische Erkenntnisse zu synthetisieren
Bei der ersten Installation wird Ihre gesamte Sitzungshistorie rückwirkend durchsucht
Auf Abruf (MCP-Tools):
memory– Erinnerungen speichern, suchen, archivieren und verwaltensession_mine– vergangene Konversationen durchsuchen, Entscheidungen finden, Dateihistorie wiedergeben, Muster erkennenwork– Entscheidungen und Fehler mit Begründung protokollierenPlus: Scope-Schutz, Kontext-Checkpoints, Konventionsverfolgung, Wirkungsanalyse
Related MCP server: Doclea MCP
Funktionsweise
Claude Code
|
+-- Hooks (remind.py) <- Intercepts every tool call
| SessionStart / Edit / Bash / Error / Compact / Stop
|
+-- Session Mining (mining/) <- Background intelligence
| JSONL parser -> Extractors -> Search index -> Pattern detection
|
+-- MCP Server (server.py) <- Tools for manual operations
| memory, session_mine, work, scope, context, ...
|
+-- Scorer Server (scorer_server.py) <- Persistent AllMiniLM process
TCP localhost, ~90MB RAM, batch embeddingsHooks werden bei jedem Tool-Aufruf ausgelöst (jeweils 1-2s Budget). Die rechenintensive Verarbeitung erfolgt in einem Hintergrund-Subprozess nach Sitzungsende. Der Scorer-Server bleibt zur schnellen semantischen Bewertung im Speicher geladen.
Benchmarks
Integrations-Benchmarks
Diese testen, was das Produkt tatsächlich leistet.
Benchmark | Was es testet | Ergebnis |
Entscheidungserfassung (220 Prompts) | Automatische Erkennung von Entscheidungen aus Benutzer-Prompts | 97,8% Präzision, 36,7% Recall |
Injektionsrelevanz (50 Erinnerungen, 15 Fälle) | Richtige Erinnerungen erscheinen vor Bearbeitungen | 14/15 bestanden, 100% Isolation |
Überleben der Komprimierung (6 Szenarien) | Regeln/Fehler überleben Kontextkomprimierung | 6/6 |
Fehler-Auto-Erfassung (53 Payloads) | Fehler extrahieren, Rauschen verwerfen, deduplizieren | 100% Recall, 97% Präzision |
Multi-Projekt-Scoping (11 Fälle) | Unterprojekt-Isolation + Workspace-Vererbung | 11/11 |
Erkennung von Bearbeitungsschleifen (12 Szenarien) | Erkennung von Spiralen vs. iterative Verbesserung | 12/12 |
Sitzungs-Mining (27 Tests) | JSONL-Parsing, Indizierung, Suche, inkrementelle Verarbeitung | 27/27 |
Obsidian Vault (25 Tests) | Kompatibilität mit PARA + CLAUDE.md Vault-Struktur | 25/25 |
Reproduktion: python tests/bench_integration.py, bench_session_mining.py, bench_obsidian_vault.py
Retrieval-Benchmarks
Nur Retrieval (Recall@k) – ob die richtige Erinnerung in den Top-Ergebnissen gefunden wird.
Benchmark | Score |
LongMemEval Recall@5 (500 Fragen) | 0,966 |
LongMemEval Recall@10 | 0,982 |
ConvoMem (250 Elemente, 5 Kategorien) | 0,960 |
LoCoMo R@10 (1.986 Fragen) | 0,649 |
Geschwindigkeit | 43ms/Abfrage |
Sitzungsübergreifende Suche | 112ms/Abfrage über 7310 Chunks |
Reproduktion: python tests/bench_longmemeval.py, bench_locomo.py, bench_convomem.py
Kompatibilität
Plattform | Was funktioniert | Auto-Erfassung |
Claude Code (CLI, Desktop, VS Code, JetBrains) | Alles | Vollständig – Hooks + Sitzungs-Mining |
Cursor | MCP-Tools (Speicher, Suche, etc.) | Keine Hooks |
Windsurf | MCP-Tools | Keine Hooks |
Continue.dev | MCP-Tools | Keine Hooks |
Zed | MCP-Tools | Keine Hooks |
Jeder MCP-Client | MCP-Tools | Keine Hooks |
Obsidian Vaults | Vollständig (mit CLAUDE.md im Root) | Vollständig mit Claude Code |
Installation
git clone https://github.com/20alexl/claude-engram.git
cd claude-engram
python -m venv venv
source venv/bin/activate # or venv\Scripts\activate on Windows
pip install -e . # Core
pip install -e ".[semantic]" # + AllMiniLM for vector search and semantic scoring
python install.py # Configure hooks, MCP server, and /engram skillProjekt-Setup
python install.py --setup /path/to/your/projectOder kopieren Sie .mcp.json in Ihr Projekt-Root-Verzeichnis.
Hinweis: Die CLAUDE.md in diesem Repo ist Engram-spezifische Dokumentation – sie ist nicht erforderlich, damit Engram funktioniert. Hooks werden automatisch ausgelöst und der /engram-Skill bietet bei Bedarf eine Kurzübersicht. Wenn Sie bereits eine CLAUDE.md für Ihr Projekt haben, behalten Sie diese bei und überschreiben Sie sie nicht mit unserer. Wenn Sie Engram-Dokumente neben Ihren Projektregeln wünschen, benennen Sie sie in CLAUDE-ENGRAM.md (oder ähnlich) um, damit sie Ihre bestehende Datei nicht überschreibt – Claude wird sie sehen, wenn sie relevant ist.
Aktualisierung
cd claude-engram
git pull
pip install -e ".[semantic]" # Reinstall if dependencies changed
python install.py # Re-run to update hooks and /engram skillHooks und MCP-Tools übernehmen Code-Änderungen sofort (editable install). Verbinden Sie den MCP-Server in Claude Code (/mcp) neu, um den Serverprozess neu zu laden.
Einführung während eines laufenden Projekts
Sind Sie bereits tief in einem Projekt? Installieren Sie es normal. In der ersten Sitzung erkennt Engram automatisch Ihre bestehende Claude Code-Sitzungshistorie und durchsucht sie im Hintergrund – wobei Entscheidungen, Fehler und Muster aus allen vergangenen Konversationen extrahiert werden. Kein manueller Aufwand.
Hauptmerkmale
Speichersystem
Hybride Suche – Keyword + AllMiniLM-Vektor + Reranking. Kein ChromaDB.
Gewichtete Injektion – Top 3 Erinnerungen nach Dateiübereinstimmung, Tags, Aktualität, Wichtigkeit vor jeder Bearbeitung.
Gestufte Speicherung – Hot (schnell) + Archiv (kalt, durchsuchbar, wiederherstellbar). Regeln und Fehler werden nie archiviert.
Multi-Projekt – Erinnerungen pro Unterprojekt begrenzt. Workspace-Regeln werden vererbt.
Sitzungs-Mining
Strukturelle Extraktion – analysiert den Konversationsfluss (Bestätigungen, Umleitungen, Fehler->Fix-Sequenzen, Ansatzänderungen) anstelle von Template-Matching.
Tool-Inhaltsindizierung – Bash-Befehle + Ausgabe, Bearbeitungs-Diffs und Fehler-Tracebacks sind neben dem Konversationstext durchsuchbar.
Batch-Embeddings – 22x schneller als Einzelaufrufe über das gebündelte TCP-Protokoll.
Sitzungsübergreifende Suche – 44k+ Konversations-Chunks indiziert, semantische + Keyword + hybride Suche.
Mustererkennung – wiederkehrende Schwierigkeiten, Fehlermuster, Bearbeitungskorrelationen über Sitzungen hinweg.
Prädiktiver Kontext – vor Bearbeitungen werden verwandte Dateien und wahrscheinliche Fehler aus der Historie angezeigt.
Projektübergreifendes Lernen – aggregiert Muster über alle Ihre Projekte hinweg.
Rückwirkender Bootstrap – durchsucht bei der ersten Installation die gesamte bestehende Sitzungshistorie.
Scorer-Autostart – AllMiniLM-Server startet bei Bedarf, falls er nicht läuft. Keine stille Verschlechterung.
Lebenszyklus
Erfasst automatisch Entscheidungen – strukturelle Muster (Bestätigungen, Umleitungen, explizite Entscheidungen) + semantisches Scoring als Bonus.
Verfolgt automatisch Fehler aus jedem fehlgeschlagenen Tool. Protokolliert nur Fehler in Projektdateien (filtert transientes Rauschen). Warnt vor wiederholten Bearbeitungen.
Übersteht Komprimierung – Checkpoints mit Sitzungsentscheidungen/-fehlern, Re-Injektion danach.
Erkennung von Bearbeitungsschleifen – markiert, wenn dieselbe Datei 3+ Mal ohne Fortschritt bearbeitet wird.
Konfiguration
Variable | Standard | Beschreibung |
|
| Ollama-Modell (optional – nur für scout_search, Konventionsprüfung) |
|
| Tage bis inaktive Erinnerungen archiviert werden |
|
| AllMiniLM-Server Leerlauf-Timeout (Sekunden) |
Neuindizierung
Wenn die Suchqualität schlecht ist oder Sie nach einem Update neu aufbauen möchten:
python scripts/reindex.py "E:\workspace" --force # rebuild search index
python scripts/reindex.py "E:\workspace" --force --extract # also re-extract decisions/mistakesOder via MCP: session_mine(operation="reindex", mode="bootstrap")
Dokumentation
Library Book – Designphilosophie, Interna, vollständige Nutzungsanleitung, API-Referenz, Fallstricke und Changelog.
/engram – Slash-Befehl mit schneller Tool-Referenz (installiert durch install.py).
Lizenz
MIT
Maintenance
Latest Blog Posts
MCP directory API
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/20alexl/claude-engram'
If you have feedback or need assistance with the MCP directory API, please join our Discord server
