Information
MCP PDF 表单
一个使用 MCP 和 PyMuPDF 构建的 PDF 表单处理工具包。
功能
跨多个目录查找 PDF 文件
从 PDF 文件中提取表单字段信息
在 PDF 文档中可视化表单字段
安装
# Install package from PyPI
pip install mcp_pdf_forms
# Or install from source
git clone https://github.com/Wildebeest/mcp_pdf_forms.git
cd mcp_pdf_forms
pip install -e .
服务器
服务器组件通过 MCP 的 API 提供与 PDF 相关的工具:
# Start the server with one or more directories to scan for PDFs
uv run -m mcp_pdf_forms.server examples
或者添加到 claude-code 中:
claude mcp add pdf-forms uv run -- --with mcp-pdf-forms -m mcp_pdf_forms.server .
使用
安装完成后,您可以使用该软件包来处理 PDF 表单。此软件包通过 MCP 接口提供工具。
PDF 发现工具
PDF 发现工具帮助您在指定目录中查找 PDF 文件。
输入:要搜索 PDF 的目录路径
输出:在指定目录中找到的 PDF 文件列表
用法:使用此功能可以快速定位项目或指定文件夹中的所有 PDF 文件
表单字段提取工具
表单字段提取工具用于提取 PDF 文档中所有表单字段的信息。
输入:PDF 文件路径
输出:每个表单字段的详细信息,包括字段名称、类型、位置和其他属性
用法:使用此功能分析表单结构并了解可用于填写的字段
字段高亮可视化工具
字段高亮点工具会在 PDF 中创建表单字段的可视化表示。
输入:PDF 文件路径
输出:修改后的 PDF,其中所有表单字段都被高亮显示以便于识别
用法:使用此功能直观检查文档中表单字段的布局和位置
使用的库
MCP - 机器对话协议框架
PyMuPDF - MuPDF 的 Python 绑定,一个高性能的 PDF 库
许可证
MIT