VOOZH about

URL: https://glama.ai/mcp/servers/zcaceres/markdownify-mcp?locale=zh-CN

⇱ Markdownify MCP 服务器 by zcaceres | Glama


Markdownify MCP 服务器

👁 markdownify mcp logo

Markdownify 是一个模型上下文协议 (MCP) 服务器,它将各种文件类型和网页内容转换为 Markdown 格式。它提供了一套工具,可以将 PDF、图像、音频文件、网页等转换为易于阅读和共享的 Markdown 文本。

功能

  • 将多种文件类型转换为 Markdown:

    • PDF

    • 图像

    • 音频(带转录)

    • DOCX

    • XLSX

    • PPTX

  • 将网页内容转换为 Markdown:

    • YouTube 视频转录

    • 必应搜索结果

    • 常规网页

  • 获取现有的 Markdown 文件

Related MCP server: Markdownify MCP Server - UTF-8 Enhanced

入门指南

  1. 克隆此仓库

  2. 安装依赖:

    bun install

    preinstall 步骤会在 .venv 中创建一个 Python 虚拟环境并安装 markitdown[all]

  3. 构建项目:

    bun run build
  4. 启动服务器:

    bun start

开发

  • 使用 bun run dev 以监视模式启动 TypeScript 编译器

  • 修改 src/server.ts 以自定义服务器行为

  • src/tools.ts 中添加或修改工具

在桌面应用中使用

要将此服务器与桌面应用集成,请将以下内容添加到应用的服务器配置中:

{
 "mcpServers": {
 "markdownify": {
 "command": "node",
 "args": [
 "{ABSOLUTE PATH TO FILE HERE}/dist/index.js"
 ]
 }
 }
}

环境变量

所有路径均默认为合理的值;仅在默认值不符合您的安装布局时才进行覆盖。

变量

默认值

用途

MARKITDOWN_PATH

<project>/.venv/bin/markitdown,然后在 PATH 中查找 markitdown

markitdown 可执行文件的绝对路径。当您在系统范围内安装了 markitdown(例如 pipx install "markitdown[pdf]")而不是使用捆绑的 venv 时,请设置此项。

REPOMIX_PATH

<project>/node_modules/.bin/repomix,然后在 PATH 中查找 repomix

git-repo-to-markdown 使用的 repomix 可执行文件的绝对路径。

MD_ALLOWED_PATHS

未设置(无限制)

服务器允许读取的目录列表,以路径分隔符分隔(POSIX 上为 :,Windows 上为 ;)。设置后,所有文件输入工具(pdf-to-markdownget-markdown-file 等)将拒绝这些目录之外的路径。

MD_SHARE_DIR

未设置

MD_ALLOWED_PATHS(单个目录)的弃用别名。为了向后兼容,仍然有效。

在 Docker 中使用

构建并运行:

docker build -t markdownify-mcp .
docker run --rm -i \
 -v "$HOME/Documents:/data:ro" \
 -e MD_ALLOWED_PATHS=/data \
 markdownify-mcp

关于 Docker MCP 目录 (mcp/markdownify) 的说明:

  • 将您希望服务器读取的任何主机目录挂载到容器中,然后将容器路径传递给工具(例如 /data/foo.pdf,而不是 /Users/you/Documents/foo.pdf)。

  • MD_ALLOWED_PATHS 设置为挂载目录的冒号分隔列表,以便服务器强制执行与绑定挂载相匹配的读取边界。

  • 已发布的 Docker 镜像仅安装 markitdown[pdf] — 音频转录和图像 OCR(audio-to-markdownimage-to-markdown)需要 [all] 额外功能,在精简镜像中会失败。请使用本地安装 (bun install) 以获得完整功能集。

可用工具

  • youtube-to-markdown:将 YouTube 视频转换为 Markdown

  • pdf-to-markdown:将 PDF 文件转换为 Markdown

  • bing-search-to-markdown:将必应搜索结果转换为 Markdown

  • webpage-to-markdown:将网页转换为 Markdown

  • image-to-markdown:将图像转换为带元数据的 Markdown

  • audio-to-markdown:将音频文件转换为带转录的 Markdown

  • docx-to-markdown:将 DOCX 文件转换为 Markdown

  • xlsx-to-markdown:将 XLSX 文件转换为 Markdown

  • pptx-to-markdown:将 PPTX 文件转换为 Markdown

  • get-markdown-file:获取现有的 Markdown 文件。文件扩展名必须以:*.md, *.markdown 结尾。

    可选:设置 MD_ALLOWED_PATHS 以将每个文件输入工具限制为目录列表,例如 MD_ALLOWED_PATHS=/data/in:/data/out bun start

贡献

欢迎贡献!请随时提交拉取请求 (Pull Request)。

许可证

本项目采用 MIT 许可证授权 - 有关详细信息,请参阅 LICENSE 文件。

A
license - permissive license
A
quality
B
maintenance

Maintenance

Maintainers
7dResponse time
1wRelease cycle
5Releases (12mo)
Issues opened vs closed

Resources

Unclaimed servers have limited discoverability.

Looking for Admin?

If you are the server author, to access and configure the admin panel.

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/zcaceres/markdownify-mcp'

If you have feedback or need assistance with the MCP directory API, please join our Discord server