VOOZH about

URL: https://glama.ai/mcp/servers/m-ai-geXR/mcp-webgpu?locale=de-DE

⇱ maige-3d-mcp by m-ai-geXR | Glama


m{ai}geXR-3d-mcp

Der Multi-Framework-3D-MCP-Server, der tatsächlich funktioniert. Steuern Sie Live-Three.js-, A-Frame-, Babylon.js- und React Three Fiber-Szenen von jedem MCP-fähigen KI-Tool aus — GitHub Copilot, Claude Desktop, Cursor, was auch immer — mit In-World-Async-Chat, sodass Sie aus dem Inneren des 3D-Canvas mit der KI sprechen können, während diese die Welt um Sie herum neu gestaltet.

Alle vier Framework-Clients rendern übereinstimmende, visuell ausgerichtete Ausgaben aus einem einzigen, vereinheitlichten Szenenzustand. Gleicher Prompt, gleiche Szene, jede Engine.


Highlights

  • 4 produktionsreife 3D-Clients — Three.js, A-Frame (1.7.0 + Bloom), Babylon.js (PBR), React Three Fiber + Zustand — alle visuell aufeinander abgestimmt

  • WebXR / VR-Unterstützung — tauchen Sie in allen vier Clients in immersive VR ein; ein schwebendes Chat-Panel folgt Ihrem Blick, sodass Sie aus dem Headset heraus mit der KI sprechen können

  • 9 KI-Anbieter direkt einsatzbereit — OpenAI (GPT-5.2), Anthropic (Claude Sonnet 4.6), Google Gemini 3.1 Pro, Mistral, Groq (Llama 3.3 70B), xAI Grok-4, Cohere Command R+, Together.ai und lokales Ollama

  • 23 MCP-Werkzeuge — Objekte, Lichter, Kameras, Animationen, Umgebung, Szenen-I/O, Rückgängig/Wiederherstellen, Screenshots und In-World-Chat

  • Persistente Animationen — Animationen überstehen das Neuladen der Seite; der Server speichert aktive Animationen im Szenenzustand und spielt sie beim erneuten Verbinden der Clients wieder ab

  • Gleichzeitige Animationen — mehrere Eigenschaften (Position, Rotation, Skalierung) werden gleichzeitig auf demselben Objekt über alle Engines hinweg animiert

  • Framework-spezifische System-Prompts — jeder Client weist die KI an, Geometrien, Materialien und Beleuchtung zu generieren, die in dieser Engine korrekt aussehen (adaptiert von der iOS maigeXR-App)

  • In-World-Chat — drücken Sie ~, um mit der KI zu sprechen, ohne das 3D-Viewport zu verlassen; sie liest Ihre Nachrichten und antwortet in einem schwebenden Overlay

  • Szenenbewusste KI — 20-stufige Konversationshistorie + Live-Szenenzustandsinjektion stellen sicher, dass die KI inkrementelle Änderungen vornimmt, keine destruktiven Neuerstellungen

  • Ein Befehlpnpm dev startet den Server + alle vier Clients gleichzeitig; öffnet automatisch den Three.js-Client in Ihrem Browser

  • Hot-Swappable KI-Anbieter — wechseln Sie den Anbieter mitten in der Sitzung über das Client-Dropdown; kein Neustart erforderlich


Related MCP server: Unity MCP

Schnellstart

Option A — npx (kein Klonen erforderlich)

npx maige-3d-mcp

Dies startet den MCP-Server über stdio. Verweisen Sie Ihren MCP-Client (VS Code Copilot, Claude Desktop, Cursor) auf den Befehl npx maige-3d-mcp.

Option B — aus dem Quellcode

1. Installieren

cd mcp-webgpu
pnpm install

2. Konfigurieren

cp .env.example .env

Fügen Sie mindestens einen API-Schlüssel hinzu. Alle Variablen:

Variable

Standard

Zweck

WS_PORT

8083

WebSocket-Bridge-Port

CHAT_PROVIDER

openai

Aktiver KI-Anbieter (openai

anthropic

google

mistral

groq

xai

cohere

together

ollama)

OPENAI_API_KEY

OpenAI

ANTHROPIC_API_KEY

Anthropic

GOOGLE_API_KEY

Google Gemini

MISTRAL_API_KEY

Mistral

GROQ_API_KEY

Groq

XAI_API_KEY

xAI / Grok

COHERE_API_KEY

Cohere

TOGETHER_API_KEY

Together.ai

OLLAMA_BASE_URL

http://localhost:11434

Lokales Ollama

AUTO_OPEN_BROWSER

true

Browser beim Start öffnen

DEFAULT_FRAMEWORK

threejs

Welcher Client automatisch geöffnet werden soll (threejs

aframe

babylonjs

r3f)

Jeder Anbieter hat auch eine *_MODEL Umgebungsvariable (z. B. OPENAI_MODEL=gpt-4.1) — siehe .env.example für alle verfügbaren Modelle.

Zwei Chat-Modi:

  • Relay-Modus (kein Schlüssel erforderlich): Die MCP-Host-KI (Copilot, Claude Desktop) übernimmt den In-World-Chat durch Abfragen von getPendingUserMessages.

  • Direkt-Modus (Schlüssel in .env): Der Server beantwortet den Chat autonom unter Verwendung des konfigurierten Anbieters.

3. Bauen & Ausführen

pnpm build:server # compile TypeScript once
pnpm dev # start server + all 4 clients

Clients öffnen sich unter:

4. Registrierung bei VS Code Copilot

Die .vscode/mcp.json ist vorkonfiguriert. Laden Sie VS Code neu und maige-3d-mcp erscheint im Copilot-Agenten-Modus.

Alternativ fügen Sie es zu Ihren globalen VS Code-Einstellungen hinzu:

// .vscode/mcp.json (already included)
{
 "servers": {
 "maige-3d-mcp": {
 "type": "stdio",
 "command": "node",
 "args": ["packages/server/build/main.js"],
 "env": {
 "OPENAI_API_KEY": "${env:OPENAI_API_KEY}",
 "ANTHROPIC_API_KEY": "${env:ANTHROPIC_API_KEY}",
 "GOOGLE_API_KEY": "${env:GOOGLE_API_KEY}"
 }
 }
 }
}

Unterstützte KI-Anbieter (9)

Anbieter

Standardmodell

Verfügbare Modelle

Hinweise

OpenAI

gpt-5.2

gpt-5.2, gpt-5.2-pro, gpt-4.1, gpt-4.1-mini, gpt-4o, o3, o4-mini

Beste Allzweck-Option

Anthropic

claude-sonnet-4-6

claude-opus-4-6, claude-sonnet-4-6, claude-sonnet-4-5, claude-haiku-4-5

Starke Argumentation

Google Gemini

gemini-3.1-pro-preview

gemini-3.1-pro-preview, gemini-2.5-pro, gemini-2.5-flash, gemini-2.5-flash-lite

Aktuelles Flaggschiff, multimodal

Mistral

mistral-large-latest

mistral-large, mistral-medium, mistral-small, open-mistral-nemo

Schnell + leistungsfähig

Groq

llama-3.3-70b-versatile

llama-3.3-70b, deepseek-r1-distill-llama-70b, llama-3.1-8b-instant, mixtral-8x7b

Rasante Inferenzgeschwindigkeit

xAI / Grok

grok-4-0709

grok-4-0709, grok-4-fast-reasoning, grok-3, grok-3-mini, grok-code-fast-1

Aktuelles Grok 4

Cohere

command-r-plus

command-r-plus, command-r, command, command-light

Fokus auf Werkzeugnutzung

Together.ai

DeepSeek-R1-Distill-Llama-70B-free

DeepSeek-R1-Distill-70B-free, Llama-3.3-70B-free, Llama-3.3-70B, DeepSeek-R1, Qwen2.5-72B

Kostenlose Stufe verfügbar

Ollama

llama3.2

llama3.2, mistral, phi4, gemma3, qwen2.5, deepseek-r1

Vollständig lokal, kein API-Schlüssel

Wechseln Sie die Anbieter über das Dropdown im Chat-Overlay oder durch Ändern von CHAT_PROVIDER in .env. Überschreiben Sie das Modell pro Anbieter mit *_MODEL Umgebungsvariablen (siehe .env.example).


Verfügbare MCP-Werkzeuge (23)

Objekte

Werkzeug

Beschreibung

createObject

Mesh hinzufügen — Box, Kugel, Zylinder, Kegel, Torus, Ebene, Kapsel oder glTF-Modell

updateObject

Teilweises Update: Position, Rotation, Skalierung, Material (Farbe, Metallizität, Rauheit, Emission), Sichtbarkeit

deleteObject

Nach ID entfernen

cloneObject

Duplizieren mit optionalem Offset

getObject

Ein einzelnes Objekt untersuchen

getSceneState

Vollständiger Szenen-JSON-Snapshot

Lichter

createLight · updateLight · deleteLight — Ambient, Direktional, Punkt, Spot, Hemisphäre

Kamera

setCamera · flyToObject

Animation

animateObject · stopAnimation — Rotieren, Springen, Pulsieren, Schweben, Drehen, benutzerdefinierte Keyframes. Animationen bleiben im Serverzustand erhalten und werden beim Neuladen der Seite automatisch wiedergegeben. Mehrere Eigenschaften werden pro Objekt gleichzeitig animiert.

Umgebung

setEnvironment — Hintergrundfarbe, Nebel, Tone Mapping, Belichtung, Schatten-Umschalter

Szene

clearScene · loadScene · exportScene · undo · redo · takeScreenshot

In-World-Chat

Werkzeug

Beschreibung

getPendingUserMessages

Nachrichten abrufen, die aus dem 3D-Canvas heraus getippt wurden

sendChatMessage

KI-Antwort im schwebenden Overlay anzeigen

clearPendingMessages

Warteschlange leeren


MCP-Ressourcen

URI

Beschreibung

maige-3d://scene/state

Live-JSON-Snapshot aller Objekte, Lichter, Kamera und Umgebung

maige-3d://server/sessions

Liste der aktuell verbundenen Browser-Sitzungen (ID, Framework, Zeitstempel)


MCP-Prompts

Prompt

Beschreibung

3d-world-assistant

Vollständiger Systemkontext für KI-Assistenten — Szenenwerkzeuge, Chat-Workflow, Regeln für inkrementelle Updates, 10+ fortgeschrittene Demo-Rezepte (Galaxie, DNA-Helix, Neontunnel, Kristallcluster usw.)

framework-guide

Tipps zu Geometrie/Material/Beleuchtung pro Framework. Akzeptiert framework-Argument: threejs, aframe, babylonjs, r3f

demo-showcase

NEU: Sofortiger Zugriff auf 10+ beeindruckende, vorgefertigte Demo-Vorlagen. Perfekt für schnelle, beeindruckende Visualisierungen. Akzeptiert style-Argument: galaxy, dna, tunnel, crystals, geometries, wave, spiral, orbit, explosion, all


WebXR / VR-Unterstützung

Alle vier Clients unterstützen immersive VR über WebXR. Klicken Sie auf die Schaltfläche 🥽 Enter VR (unten links), um eine Sitzung zu starten.

Framework

Implementierung

Three.js

Benutzerdefiniertes VRSetup.ts — WebXR-Sitzungsverwaltung, Controller-Raycaster, VRChatPanel.ts Canvas-Textur-Chat-Panel

A-Frame

Natives vr-mode-ui + laser-controls, 3D-Chat-Entität mit dynamischem Text

Babylon.js

WebXRDefaultExperience + DynamicTexture Chat-Panel

React Three Fiber

@react-three/xr v6 (createXRStore + <XR> Wrapper), React VR-Chat-Panel-Komponente

In VR schwebt das Chat-Panel vor Ihnen und folgt Ihrem Blick. KI-Antworten erscheinen in Echtzeit, sodass Sie die Szene aus dem Headset heraus steuern können.

Erfordert einen WebXR-fähigen Browser (Chrome 79+, Edge 79+, Meta Quest Browser) und ein VR-Headset oder die WebXR API Emulator-Erweiterung für Desktop-Tests.


In-World-Chat

Drücken Sie ~ (Backtick) oder klicken Sie unten rechts auf AI Chat. Geben Sie eine Nachricht ein, drücken Sie Enter, und die KI empfängt sie, handelt danach und antwortet — alles ohne das 3D-Viewport zu verlassen. Das Chat-Overlay enthält außerdem:

  • Anbieter-Auswahl — KI-Anbieter im laufenden Betrieb wechseln

  • System-Prompt-Editor — das Verhalten der KI pro Sitzung anpassen

  • Szene löschen-Schaltfläche — die Welt sofort zurücksetzen

  • Debug-Panel — drücken Sie Escape, um den Szenenzustand und Verbindungsinformationen zu untersuchen


Architektur

┌─────────────────────────┐
│ MCP Host (Copilot, │ stdio / JSON-RPC
│ Claude, Cursor, etc.) │◄────────────────────┐
└─────────────────────────┘ │
 │
 ┌──────────────────┴──────────────────┐
 │ MCP Server (Node.js) │
 │ │
 │ tools/ ─ 23 tool definitions │
 │ state/ ─ SceneStateManager + Undo │
 │ chat/ ─ ChatRelay (9 providers) │
 │ ws/ ─ WebSocket bridge :8083 │
 │ └── adapters/ (per-framework) │
 └──────────┬───────────────────────────┘
 │ WebSocket
 ┌────────────────┬───────────────┼───────────────┬────────────────┐
 ▼ ▼ ▼ ▼ │
┌──────────────┐ ┌──────────────┐ ┌───────────────┐ ┌──────────────┐ │
│ Three.js │ │ A-Frame │ │ Babylon.js │ │ R3F / React │ │
│ :5173 │ │ :5174 │ │ :5175 │ │ :5176 │ │
│ ┌──────────┐ │ │ ┌──────────┐ │ │ ┌──────────┐ │ │ ┌──────────┐ │ │
│ │VR/WebXR │ │ │ │VR/WebXR │ │ │ │VR/WebXR │ │ │ │VR/WebXR │ │ │
│ │ChatPanel │ │ │ │ChatPanel │ │ │ │ChatPanel │ │ │ │ChatPanel │ │ │
│ └──────────┘ │ │ └──────────┘ │ │ └──────────┘ │ │ └──────────┘ │ │
└──────────────┘ └──────────────┘ └───────────────┘ └──────────────┘

Jeder Client verbindet sich über WebSocket mit demselben MCP-Server. Der Server verwaltet einen einzigen kanonischen Szenenzustand und sendet Befehle über Framework-spezifische Adapter, die Vec3-Formate, Materialmodelle und Geometrienamen in die native Darstellung der jeweiligen Engine übersetzen.

Wichtige Server-Funktionen:

  • Konversationshistorie — die KI erinnert sich an die letzten 20 Dialogschritte und vermeidet so destruktive Szenen-Neuerstellungen

  • Szenenzustandsinjektion — jeder KI-Aufruf enthält eine Zusammenfassung der aktuellen Objekte, Lichter und Umgebung, damit die KI weiß, was bereits existiert

  • Framework-spezifische System-Prompts — jeder Client weist die KI an, Geometrien, Materialien und Beleuchtung zu generieren, die in dieser spezifischen Engine korrekt aussehen

  • Rückgängig/Wiederherstellen — 20-stufiger Snapshot-Stack auf dem Server, ausgelöst über MCP-Werkzeuge

  • Animationspersistenz — aktive Animationen werden im Szenenzustand gespeichert und beim erneuten Verbinden wiedergegeben, sodass sich wiederholende Animationen das Neuladen der Seite überstehen


Projektlayout

mcp-webgpu/
├── .env.example ← all env vars + model lists documented
├── .vscode/mcp.json ← pre-configured for VS Code Copilot agent mode
├── package.json ← pnpm workspace root
├── PLAN.md ← full architecture plan
├── packages/
│ ├── server/ ← MCP server (TypeScript / Node)
│ │ └── src/
│ │ ├── main.ts ← entry + .env discovery
│ │ ├── types.ts ← shared types
│ │ ├── tools/ ← 23 MCP tool definitions
│ │ ├── handlers/ ← tool / prompt / resource handlers
│ │ ├── state/ ← SceneStateManager + UndoStack
│ │ ├── chat/ ← ChatRelay (9 providers) + MessageQueue
│ │ └── ws/ ← WebSocket server + framework adapters
│ │ └── adapters/ ← ThreeAdapter, AFrameAdapter,
│ │ BabylonAdapter, R3FAdapter
│ ├── client-threejs/ ← Three.js (Vite)
│ │ └── src/
│ │ ├── scene.ts ← SceneManager
│ │ ├── commands/ ← command dispatcher
│ │ ├── overlay/ ← ChatOverlay UI
│ │ └── vr/ ← VRSetup + VRChatPanel (WebXR)
│ ├── client-aframe/ ← A-Frame 1.7.0 + bloom (Vite)
│ │ └── src/
│ │ ├── scene.ts ← A-Frame SceneManager
│ │ ├── commands/ ← command dispatcher
│ │ └── overlay/ ← ChatOverlay UI
│ ├── client-babylonjs/ ← Babylon.js + PBR (Vite)
│ │ └── src/
│ │ ├── scene.ts ← Babylon SceneManager
│ │ ├── commands/ ← command dispatcher
│ │ └── overlay/ ← ChatOverlay UI
│ └── client-r3f/ ← React Three Fiber + Zustand (Vite)
│ └── src/
│ ├── App.tsx ← React app shell
│ ├── SceneCanvas.tsx ← R3F canvas + XR wrapper
│ ├── store/ ← Zustand scene store
│ ├── commands/ ← command dispatcher
│ ├── overlay/ ← ChatOverlay UI
│ └── vr/ ← VRChatPanel (React XR component)

Roadmap

  • [x] Phase 1 — Three.js-Client + vollständiger Werkzeugsatz + In-World-Chat

  • [x] Phase 2 — A-Frame-Client (1.

A
license - permissive license
A
quality
B
maintenance

Maintenance

Maintainers
Response time
Release cycle
Releases (12mo)
Commit activity

Resources

Unclaimed servers have limited discoverability.

Looking for Admin?

If you are the server author, to access and configure the admin panel.

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/m-ai-geXR/mcp-webgpu'

If you have feedback or need assistance with the MCP directory API, please join our Discord server