de en es ja ko ru zh

videolab-mcp

MCP-сервер, который превращает Claude (или любой другой MCP-хост) в полноценный видеоредактор для коротких видео. Просматривайте музыкальную библиотеку или генерируйте новые треки. Анимируйте статичные изображения с помощью Veo или создавайте синхронизацию губ для портретов с помощью OmniHuman. Пишите и переписывайте сценарии. Синтезируйте закадровый голос с помощью ElevenLabs. Монтируйте таймлайн с помощью FFmpeg, воспроизводите результат, а затем быстро вносите правки, заменяя музыку, голос или любой отдельный клип — без необходимости перерендеринга с нуля.

Также в комплект входит навык text-to-documentary (текст в документальный фильм), который преобразует длинные тексты (PDF, книги, статьи) в структурированные документальные видео с закадровым голосом, сгенерированным ИИ, субтитрами и фоновыми кадрами (b-roll).

Автономный, портативный, настраиваемый. Используйте свои собственные API-ключи.

Что внутри

Инструменты для рабочего процесса:

Категория	Инструменты
Музыка	`list_music`, `preview_music`, `generate_music`
Фоновые кадры (B-roll)	`list_broll`, `preview_broll`
Активы сцены	`list_scene_assets`, `get_scene_asset`
Изображения	`generate_image`, `list_images`, `get_image`
Закадровый голос (ElevenLabs)	`list_voices`, `generate_voiceover`, `preview_voiceover`, `list_voiceovers`
Сценарий (Anthropic)	`generate_script`, `rewrite_script`, `get_script`, `list_scripts`
Монтаж видео (FFmpeg)	`assemble_promo`, `swap_music`, `swap_voiceover`, `swap_clip`, `play_render`, `list_recent_renders`, `describe_render`
Анимация (Veo)	`animate_image_to_video`
Говорящие головы (Fal OmniHuman)	`generate_talking_head`
Документальный фильм	`extract_pdf`, `split_chapters`, `plan_documentary_scenes`, `validate_attention`
Диагностика	`ping`, `describe_capabilities`

Ресурсы для просмотра без использования вызовов инструментов: library://music, library://broll, library://renders, library://voiceovers, library://scripts, library://scenes.

Промпты для пошаговых сценариев: make-scene-promo, remix-render, compose-music-for-scene.

Навыки в skills/: text-to-documentary — PDF/книга → документальные видео по главам со структурированной сюжетной линией.

Related MCP server: ffmpeg-mcp

Требования

Node.js 18+
FFmpeg в вашем PATH (или укажите абсолютный путь к ffmpeg.binary в конфигурации)
API-ключи для используемых провайдеров (заранее ничего не требуется — инициализация происходит при первом вызове)

Быстрый старт

git clone <this-repo> videolab-mcp
cd videolab-mcp
npm install
npm run build
cp videolab.config.example.json videolab.config.json
cp .env.example .env # then fill in keys you have

Подключите его к Claude Desktop (~/Library/Application Support/Claude/claude_desktop_config.json на macOS, %AppData%\Claude\claude_desktop_config.json на Windows):

{
 "mcpServers": {
 "videolab": {
 "command": "node",
 "args": ["C:\\path\\to\\videolab-mcp\\build\\index.js"],
 "env": {
 "ELEVENLABS_API_KEY": "...",
 "ANTHROPIC_API_KEY": "...",
 "GOOGLE_VEO_API_KEY": "...",
 "FAL_KEY": "...",
 "VIDEOLAB_CONFIG": "C:\\path\\to\\videolab-mcp\\videolab.config.json"
 }
 }
 }
}

Перезапустите Claude Desktop. Откройте чат и вызовите ping, чтобы подтвердить соединение.

Конфигурация

Два файла. .env только для секретных данных:

ELEVENLABS_API_KEY=
ANTHROPIC_API_KEY=
GOOGLE_VEO_API_KEY=
FAL_KEY=

videolab.config.json для всего остального (хранилище, провайдеры, флаги FFmpeg, настройки по умолчанию). Пример файла содержит разумные значения по умолчанию без лишних зависимостей: локальное хранилище, JSON-индекс, провайдеры ElevenLabs/Anthropic/Veo/Fal, настройки для мобильных видео (9:16).

Пошаговое руководство — создание промо с нуля

В Claude Desktop с подключенным MCP-сервером:

User: Make a 20-second mobile promo for the test scene.

Claude:
 → list_scene_assets({ sceneRef: { key: "test-scene" } })
 → 3 assets: magenta, cyan, orange

 → generate_script({
 context: "Test scene with three coloured backdrops",
 durationSeconds: 20, tone: "punchy"
 })
 → scriptId: script_a3f, slot breakdown shown

 → generate_voiceover({ text: "<the script>" })
 → voiceoverId: vo_8d2

 → generate_music({
 prompt: "driving electronic, slow build, retro synth pad",
 durationMs: 20000
 })
 → trackId: music_4e1

 → assemble_promo({
 timeline: {
 platform: "mobile",
 slots: [
 { source: { kind: "scene", id: "asset-test-magenta" }, durationMs: 7000 },
 { source: { kind: "scene", id: "asset-test-cyan" }, durationMs: 7000 },
 { source: { kind: "scene", id: "asset-test-orange" }, durationMs: 6000 }
 ]
 },
 voiceoverId: "vo_8d2",
 musicId: "music_4e1"
 })
 → renderId: render_94c, autoplays in default video player

User: Make the music more chill.

Claude:
 → generate_music({ prompt: "soft ambient pad, gentle rhythm", durationMs: 20000 })
 → trackId: music_c70
 → swap_music({ renderId: "render_94c", newMusicId: "music_c70" })
 → renderId: render_d11 (rev of render_94c) — only re-mixes audio (~2s)

User: Replace the orange shot with a Veo animation of the magenta image zooming in.

Claude:
 → animate_image_to_video({
 imageSource: { kind: "scene", id: "asset-test-magenta" },
 prompt: "slow camera push-in, dust particles drifting"
 })
 → clipId: broll_veo_a8b
 → swap_clip({
 renderId: "render_d11",
 slotIndex: 2,
 newSource: { kind: "broll", id: "broll_veo_a8b" }
 })
 → renderId: render_2f9 (rev of render_d11)

Цикл итерации

Это та часть, которая делает рабочий процесс удобным:

assemble_promo записывает промежуточные файлы для каждого слота (slot_*.mp4), беззвучный visuals.mp4, аудиомикс и финальный output.mp4 — всё в папке media/renders/<renderId>/.
swap_music / swap_voiceover повторно используют родительский visuals.mp4 и только перемикшируют аудио. Типичное время выполнения: ~2 секунды.
swap_clip пересобирает поток визуальных эффектов + перемикширует аудио. Типичное время выполнения: ~5–10 секунд.
Каждый рендер получает новый renderId, связанный через parentId — вы никогда не потеряете предыдущую версию.

Режим «текст в документальный фильм»

Навык skills/text-to-documentary/ превращает PDF, книгу или вставленный длинный текст в серию документальных видео длительностью около 5 минут — по одному на главу. Каждое видео имеет структурированную сюжетную арку (Завязка → Основная идея → Примеры → Смена ритма → Краткие выводы → Клиффхэнгер), караоке-субтитры на основе временных меток ElevenLabs и сгенерированные ИИ фоновые кадры.

Используемые инструменты: extract_pdf, split_chapters, plan_documentary_scenes, validate_attention, generate_voiceover, generate_image, animate_image_to_video, generate_music, assemble_promo.

Если вы используете Claude Code или другой хост, поддерживающий навыки, навык загружается автоматически при активации (например, «преврати этот PDF в документальный фильм», «сделай видео из этой книги» и т.д.). В противном случае прочитайте skills/text-to-documentary/SKILL.md для получения полного списка шагов и вызова инструментов напрямую.

Пользовательский провайдер активов сцены

Сервер не зависит от конкретного провайдера активов сцены. Поставляемый провайдер json-manifest считывает данные из JSON-файла. Любая более сложная реализация (ваша CMS, база данных, API) может быть реализована как SceneAssetProvider:

export interface SceneAssetProvider {
 readonly kind: string;
 describeRefShape(): string; // shows up in the tool description so the host knows what to send
 listAssets(ref: SceneRef): Promise<SceneAsset[]>;
 getAsset(id: string): Promise<SceneAsset | null>;
}

Поместите свою реализацию в src/providers/scene-assets/<ваше-имя>.ts, зарегистрируйте её в src/providers/factory.ts в разделе buildSceneAssets и добавьте в схему конфигурации в src/config.ts. Тот же шаблон работает для бэкендов хранилища (S3, Azure) — см. src/providers/types.ts:StorageProvider.

Матрица провайдеров

Что	Провайдер по умолчанию	Переменная окружения	Поле конфигурации
Хранилище	local	—	`storage.kind`
Индекс (метаданные активов)	json	—	`index.kind`
Генерация музыки	ElevenLabs Music	`ELEVENLABS_API_KEY`	`providers.musicGen`
TTS (озвучка)	ElevenLabs	`ELEVENLABS_API_KEY`	`providers.tts`
LLM для сценария	Anthropic Claude	`ANTHROPIC_API_KEY`	`providers.llm`
Генерация изображений	Gemini Nano Banana	`GOOGLE_VEO_API_KEY`	`providers.imageGen`
Изображение в видео	Google Veo	`GOOGLE_VEO_API_KEY`	`providers.animate`
Говорящая голова	Fal OmniHuman	`FAL_KEY`	`providers.talkingHead`
Активы сцены	json-manifest	—	`providers.sceneAssets`

Дополнительные переопределения моделей через переменные окружения: ANTHROPIC_MODEL, ELEVENLABS_MUSIC_MODEL, VEO_MODEL, VEO_ENDPOINT, VEO_POLL_INTERVAL_MS, VEO_POLL_TIMEOUT_MS, FAL_OMNIHUMAN_MODEL, PROMO_VIDEO_LOG_LEVEL.

Лицензия

MIT — см. LICENSE.

This server cannot be installed

license - permissive license

quality - not tested

maintenance

How are these scores calculated?

Maintenance

–Maintainers

–Response time

–Release cycle

–Releases (12mo)

Commit activity

Resources

GitHub Repository

Need Help?

Related Servers

Unclaimed servers have limited discoverability.

Looking for Admin?

If you are the server author, to access and configure the admin panel.

Appeared in Searches

Building an AI-native media studio with autonomous agents for film, game, and interactive world creation

Latest Blog Posts

Lightport: Open-Sourcing Glama's AI Gateway
By punkpeye on April 27, 2026.
open source
OpenAI
Tool Definition Quality Score (TDQS)
By punkpeye on April 3, 2026.
mcp
The Hackers Who Tracked My Sleep Cycle
By punkpeye on March 26, 2026.
security

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/aTreeFrog/videolab-mcp'

If you have feedback or need assistance with the MCP directory API, please join our Discord server

URL: https://glama.ai/mcp/servers/aTreeFrog/videolab-mcp?locale=ru-RU

⇱ videolab-mcp by aTreeFrog | Glama