m{ai}geXR-3d-mcp
Der Multi-Framework-3D-MCP-Server, der tatsächlich funktioniert. Steuern Sie Live-Three.js-, A-Frame-, Babylon.js- und React Three Fiber-Szenen von jedem MCP-fähigen KI-Tool aus — GitHub Copilot, Claude Desktop, Cursor, was auch immer — mit In-World-Async-Chat, sodass Sie aus dem Inneren des 3D-Canvas mit der KI sprechen können, während diese die Welt um Sie herum neu gestaltet.
Alle vier Framework-Clients rendern übereinstimmende, visuell ausgerichtete Ausgaben aus einem einzigen, vereinheitlichten Szenenzustand. Gleicher Prompt, gleiche Szene, jede Engine.
Highlights
4 produktionsreife 3D-Clients — Three.js, A-Frame (1.7.0 + Bloom), Babylon.js (PBR), React Three Fiber + Zustand — alle visuell aufeinander abgestimmt
WebXR / VR-Unterstützung — tauchen Sie in allen vier Clients in immersive VR ein; ein schwebendes Chat-Panel folgt Ihrem Blick, sodass Sie aus dem Headset heraus mit der KI sprechen können
9 KI-Anbieter direkt einsatzbereit — OpenAI (GPT-5.2), Anthropic (Claude Sonnet 4.6), Google Gemini 3.1 Pro, Mistral, Groq (Llama 3.3 70B), xAI Grok-4, Cohere Command R+, Together.ai und lokales Ollama
23 MCP-Werkzeuge — Objekte, Lichter, Kameras, Animationen, Umgebung, Szenen-I/O, Rückgängig/Wiederherstellen, Screenshots und In-World-Chat
Persistente Animationen — Animationen überstehen das Neuladen der Seite; der Server speichert aktive Animationen im Szenenzustand und spielt sie beim erneuten Verbinden der Clients wieder ab
Gleichzeitige Animationen — mehrere Eigenschaften (Position, Rotation, Skalierung) werden gleichzeitig auf demselben Objekt über alle Engines hinweg animiert
Framework-spezifische System-Prompts — jeder Client weist die KI an, Geometrien, Materialien und Beleuchtung zu generieren, die in dieser Engine korrekt aussehen (adaptiert von der iOS maigeXR-App)
In-World-Chat — drücken Sie
~, um mit der KI zu sprechen, ohne das 3D-Viewport zu verlassen; sie liest Ihre Nachrichten und antwortet in einem schwebenden OverlaySzenenbewusste KI — 20-stufige Konversationshistorie + Live-Szenenzustandsinjektion stellen sicher, dass die KI inkrementelle Änderungen vornimmt, keine destruktiven Neuerstellungen
Ein Befehl —
pnpm devstartet den Server + alle vier Clients gleichzeitig; öffnet automatisch den Three.js-Client in Ihrem BrowserHot-Swappable KI-Anbieter — wechseln Sie den Anbieter mitten in der Sitzung über das Client-Dropdown; kein Neustart erforderlich
Related MCP server: Unity MCP
Schnellstart
Option A — npx (kein Klonen erforderlich)
npx maige-3d-mcpDies startet den MCP-Server über stdio. Verweisen Sie Ihren MCP-Client (VS Code Copilot, Claude Desktop, Cursor) auf den Befehl npx maige-3d-mcp.
Option B — aus dem Quellcode
1. Installieren
cd mcp-webgpu
pnpm install2. Konfigurieren
cp .env.example .envFügen Sie mindestens einen API-Schlüssel hinzu. Alle Variablen:
Variable | Standard | Zweck | ||||||||
|
| WebSocket-Bridge-Port | ||||||||
|
| Aktiver KI-Anbieter ( |
|
|
|
|
|
|
|
|
| — | OpenAI | ||||||||
| — | Anthropic | ||||||||
| — | Google Gemini | ||||||||
| — | Mistral | ||||||||
| — | Groq | ||||||||
| — | xAI / Grok | ||||||||
| — | Cohere | ||||||||
| — | Together.ai | ||||||||
|
| Lokales Ollama | ||||||||
|
| Browser beim Start öffnen | ||||||||
|
| Welcher Client automatisch geöffnet werden soll ( |
|
|
|
Jeder Anbieter hat auch eine *_MODEL Umgebungsvariable (z. B. OPENAI_MODEL=gpt-4.1) — siehe .env.example für alle verfügbaren Modelle.
Zwei Chat-Modi:
Relay-Modus (kein Schlüssel erforderlich): Die MCP-Host-KI (Copilot, Claude Desktop) übernimmt den In-World-Chat durch Abfragen von
getPendingUserMessages.Direkt-Modus (Schlüssel in
.env): Der Server beantwortet den Chat autonom unter Verwendung des konfigurierten Anbieters.
3. Bauen & Ausführen
pnpm build:server # compile TypeScript once
pnpm dev # start server + all 4 clientsClients öffnen sich unter:
Framework | URL |
Three.js | |
A-Frame | |
Babylon.js | |
React Three Fiber |
4. Registrierung bei VS Code Copilot
Die .vscode/mcp.json ist vorkonfiguriert. Laden Sie VS Code neu und maige-3d-mcp erscheint im Copilot-Agenten-Modus.
Alternativ fügen Sie es zu Ihren globalen VS Code-Einstellungen hinzu:
// .vscode/mcp.json (already included)
{
"servers": {
"maige-3d-mcp": {
"type": "stdio",
"command": "node",
"args": ["packages/server/build/main.js"],
"env": {
"OPENAI_API_KEY": "${env:OPENAI_API_KEY}",
"ANTHROPIC_API_KEY": "${env:ANTHROPIC_API_KEY}",
"GOOGLE_API_KEY": "${env:GOOGLE_API_KEY}"
}
}
}
}Unterstützte KI-Anbieter (9)
Anbieter | Standardmodell | Verfügbare Modelle | Hinweise |
OpenAI |
| gpt-5.2, gpt-5.2-pro, gpt-4.1, gpt-4.1-mini, gpt-4o, o3, o4-mini | Beste Allzweck-Option |
Anthropic |
| claude-opus-4-6, claude-sonnet-4-6, claude-sonnet-4-5, claude-haiku-4-5 | Starke Argumentation |
Google Gemini |
| gemini-3.1-pro-preview, gemini-2.5-pro, gemini-2.5-flash, gemini-2.5-flash-lite | Aktuelles Flaggschiff, multimodal |
Mistral |
| mistral-large, mistral-medium, mistral-small, open-mistral-nemo | Schnell + leistungsfähig |
Groq |
| llama-3.3-70b, deepseek-r1-distill-llama-70b, llama-3.1-8b-instant, mixtral-8x7b | Rasante Inferenzgeschwindigkeit |
xAI / Grok |
| grok-4-0709, grok-4-fast-reasoning, grok-3, grok-3-mini, grok-code-fast-1 | Aktuelles Grok 4 |
Cohere |
| command-r-plus, command-r, command, command-light | Fokus auf Werkzeugnutzung |
Together.ai |
| DeepSeek-R1-Distill-70B-free, Llama-3.3-70B-free, Llama-3.3-70B, DeepSeek-R1, Qwen2.5-72B | Kostenlose Stufe verfügbar |
Ollama |
| llama3.2, mistral, phi4, gemma3, qwen2.5, deepseek-r1 | Vollständig lokal, kein API-Schlüssel |
Wechseln Sie die Anbieter über das Dropdown im Chat-Overlay oder durch Ändern von CHAT_PROVIDER in .env. Überschreiben Sie das Modell pro Anbieter mit *_MODEL Umgebungsvariablen (siehe .env.example).
Verfügbare MCP-Werkzeuge (23)
Objekte
Werkzeug | Beschreibung |
| Mesh hinzufügen — Box, Kugel, Zylinder, Kegel, Torus, Ebene, Kapsel oder glTF-Modell |
| Teilweises Update: Position, Rotation, Skalierung, Material (Farbe, Metallizität, Rauheit, Emission), Sichtbarkeit |
| Nach ID entfernen |
| Duplizieren mit optionalem Offset |
| Ein einzelnes Objekt untersuchen |
| Vollständiger Szenen-JSON-Snapshot |
Lichter
createLight · updateLight · deleteLight — Ambient, Direktional, Punkt, Spot, Hemisphäre
Kamera
setCamera · flyToObject
Animation
animateObject · stopAnimation — Rotieren, Springen, Pulsieren, Schweben, Drehen, benutzerdefinierte Keyframes. Animationen bleiben im Serverzustand erhalten und werden beim Neuladen der Seite automatisch wiedergegeben. Mehrere Eigenschaften werden pro Objekt gleichzeitig animiert.
Umgebung
setEnvironment — Hintergrundfarbe, Nebel, Tone Mapping, Belichtung, Schatten-Umschalter
Szene
clearScene · loadScene · exportScene · undo · redo · takeScreenshot
In-World-Chat
Werkzeug | Beschreibung |
| Nachrichten abrufen, die aus dem 3D-Canvas heraus getippt wurden |
| KI-Antwort im schwebenden Overlay anzeigen |
| Warteschlange leeren |
MCP-Ressourcen
URI | Beschreibung |
| Live-JSON-Snapshot aller Objekte, Lichter, Kamera und Umgebung |
| Liste der aktuell verbundenen Browser-Sitzungen (ID, Framework, Zeitstempel) |
MCP-Prompts
Prompt | Beschreibung |
| Vollständiger Systemkontext für KI-Assistenten — Szenenwerkzeuge, Chat-Workflow, Regeln für inkrementelle Updates, 10+ fortgeschrittene Demo-Rezepte (Galaxie, DNA-Helix, Neontunnel, Kristallcluster usw.) |
| Tipps zu Geometrie/Material/Beleuchtung pro Framework. Akzeptiert |
| NEU: Sofortiger Zugriff auf 10+ beeindruckende, vorgefertigte Demo-Vorlagen. Perfekt für schnelle, beeindruckende Visualisierungen. Akzeptiert |
WebXR / VR-Unterstützung
Alle vier Clients unterstützen immersive VR über WebXR. Klicken Sie auf die Schaltfläche 🥽 Enter VR (unten links), um eine Sitzung zu starten.
Framework | Implementierung |
Three.js | Benutzerdefiniertes |
A-Frame | Natives |
Babylon.js |
|
React Three Fiber |
|
In VR schwebt das Chat-Panel vor Ihnen und folgt Ihrem Blick. KI-Antworten erscheinen in Echtzeit, sodass Sie die Szene aus dem Headset heraus steuern können.
Erfordert einen WebXR-fähigen Browser (Chrome 79+, Edge 79+, Meta Quest Browser) und ein VR-Headset oder die WebXR API Emulator-Erweiterung für Desktop-Tests.
In-World-Chat
Drücken Sie ~ (Backtick) oder klicken Sie unten rechts auf AI Chat. Geben Sie eine Nachricht ein, drücken Sie Enter, und die KI empfängt sie, handelt danach und antwortet — alles ohne das 3D-Viewport zu verlassen. Das Chat-Overlay enthält außerdem:
Anbieter-Auswahl — KI-Anbieter im laufenden Betrieb wechseln
System-Prompt-Editor — das Verhalten der KI pro Sitzung anpassen
Szene löschen-Schaltfläche — die Welt sofort zurücksetzen
Debug-Panel — drücken Sie Escape, um den Szenenzustand und Verbindungsinformationen zu untersuchen
Architektur
┌─────────────────────────┐
│ MCP Host (Copilot, │ stdio / JSON-RPC
│ Claude, Cursor, etc.) │◄────────────────────┐
└─────────────────────────┘ │
│
┌──────────────────┴──────────────────┐
│ MCP Server (Node.js) │
│ │
│ tools/ ─ 23 tool definitions │
│ state/ ─ SceneStateManager + Undo │
│ chat/ ─ ChatRelay (9 providers) │
│ ws/ ─ WebSocket bridge :8083 │
│ └── adapters/ (per-framework) │
└──────────┬───────────────────────────┘
│ WebSocket
┌────────────────┬───────────────┼───────────────┬────────────────┐
▼ ▼ ▼ ▼ │
┌──────────────┐ ┌──────────────┐ ┌───────────────┐ ┌──────────────┐ │
│ Three.js │ │ A-Frame │ │ Babylon.js │ │ R3F / React │ │
│ :5173 │ │ :5174 │ │ :5175 │ │ :5176 │ │
│ ┌──────────┐ │ │ ┌──────────┐ │ │ ┌──────────┐ │ │ ┌──────────┐ │ │
│ │VR/WebXR │ │ │ │VR/WebXR │ │ │ │VR/WebXR │ │ │ │VR/WebXR │ │ │
│ │ChatPanel │ │ │ │ChatPanel │ │ │ │ChatPanel │ │ │ │ChatPanel │ │ │
│ └──────────┘ │ │ └──────────┘ │ │ └──────────┘ │ │ └──────────┘ │ │
└──────────────┘ └──────────────┘ └───────────────┘ └──────────────┘Jeder Client verbindet sich über WebSocket mit demselben MCP-Server. Der Server verwaltet einen einzigen kanonischen Szenenzustand und sendet Befehle über Framework-spezifische Adapter, die Vec3-Formate, Materialmodelle und Geometrienamen in die native Darstellung der jeweiligen Engine übersetzen.
Wichtige Server-Funktionen:
Konversationshistorie — die KI erinnert sich an die letzten 20 Dialogschritte und vermeidet so destruktive Szenen-Neuerstellungen
Szenenzustandsinjektion — jeder KI-Aufruf enthält eine Zusammenfassung der aktuellen Objekte, Lichter und Umgebung, damit die KI weiß, was bereits existiert
Framework-spezifische System-Prompts — jeder Client weist die KI an, Geometrien, Materialien und Beleuchtung zu generieren, die in dieser spezifischen Engine korrekt aussehen
Rückgängig/Wiederherstellen — 20-stufiger Snapshot-Stack auf dem Server, ausgelöst über MCP-Werkzeuge
Animationspersistenz — aktive Animationen werden im Szenenzustand gespeichert und beim erneuten Verbinden wiedergegeben, sodass sich wiederholende Animationen das Neuladen der Seite überstehen
Projektlayout
mcp-webgpu/
├── .env.example ← all env vars + model lists documented
├── .vscode/mcp.json ← pre-configured for VS Code Copilot agent mode
├── package.json ← pnpm workspace root
├── PLAN.md ← full architecture plan
├── packages/
│ ├── server/ ← MCP server (TypeScript / Node)
│ │ └── src/
│ │ ├── main.ts ← entry + .env discovery
│ │ ├── types.ts ← shared types
│ │ ├── tools/ ← 23 MCP tool definitions
│ │ ├── handlers/ ← tool / prompt / resource handlers
│ │ ├── state/ ← SceneStateManager + UndoStack
│ │ ├── chat/ ← ChatRelay (9 providers) + MessageQueue
│ │ └── ws/ ← WebSocket server + framework adapters
│ │ └── adapters/ ← ThreeAdapter, AFrameAdapter,
│ │ BabylonAdapter, R3FAdapter
│ ├── client-threejs/ ← Three.js (Vite)
│ │ └── src/
│ │ ├── scene.ts ← SceneManager
│ │ ├── commands/ ← command dispatcher
│ │ ├── overlay/ ← ChatOverlay UI
│ │ └── vr/ ← VRSetup + VRChatPanel (WebXR)
│ ├── client-aframe/ ← A-Frame 1.7.0 + bloom (Vite)
│ │ └── src/
│ │ ├── scene.ts ← A-Frame SceneManager
│ │ ├── commands/ ← command dispatcher
│ │ └── overlay/ ← ChatOverlay UI
│ ├── client-babylonjs/ ← Babylon.js + PBR (Vite)
│ │ └── src/
│ │ ├── scene.ts ← Babylon SceneManager
│ │ ├── commands/ ← command dispatcher
│ │ └── overlay/ ← ChatOverlay UI
│ └── client-r3f/ ← React Three Fiber + Zustand (Vite)
│ └── src/
│ ├── App.tsx ← React app shell
│ ├── SceneCanvas.tsx ← R3F canvas + XR wrapper
│ ├── store/ ← Zustand scene store
│ ├── commands/ ← command dispatcher
│ ├── overlay/ ← ChatOverlay UI
│ └── vr/ ← VRChatPanel (React XR component)Roadmap
[x] Phase 1 — Three.js-Client + vollständiger Werkzeugsatz + In-World-Chat
[x] Phase 2 — A-Frame-Client (1.
Maintenance
Resources
Unclaimed servers have limited discoverability.
Looking for Admin?
If you are the server author, to access and configure the admin panel.
Latest Blog Posts
MCP directory API
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/m-ai-geXR/mcp-webgpu'
If you have feedback or need assistance with the MCP directory API, please join our Discord server
