Go-Docs MCP
Install and Go — tu IA lee cualquier documento
El Problema
Todos los servidores MCP de documentos necesitan Node.js o Python. Solo manejan un formato — y ninguno hace OCR, extracción de tablas o lectura de imágenes.
La Solución
go install y listo. Un binario, 12 herramientas. PDF, DOCX, Markdown, imágenes, OCR — sin runtime, sin configuración.
¿Por qué go-docs-mcp?
El ecosistema MCP está inundado de Node y Python. Una opción en Go destaca simplemente por ser diferente. La gente que usa infraestructura ligera — self-hosters, DevOps, usuarios de terminal — prefiere binarios compilados sobre runtimes interpretados. Si ya tienes Go, este es el camino más rápido de cero a IA que lee documentos.
| Node / TS MCPs | Python MCPs | go-docs-mcp | |
|---|---|---|---|
| ⚡ | Necesita Node.js | Necesita Python + pip | Binario único, sin runtime |
| 📄 | Un solo formato | Un solo formato | PDF + TXT + MD + DOCX + CSV + imágenes |
| 👁 | Sin OCR | Sin OCR | OCR para PDFs escaneados + imágenes |
| 📊 | Tablas limitadas | Tablas básicas | Tablas + outline + imágenes + caché |
| 🔒 | Seguridad variable | Seguridad variable | Solo lectura, directorio bloqueado |
Características
Leer Cualquier Documento
Extrae texto completo de PDF, TXT, MD, CSV, DOCX e imágenes (PNG/JPG/TIFF) con granularidad por página. Tu IA lee cualquier formato desde un único servidor.
Búsqueda
Búsqueda full-text dentro de documentos con resultados contextuales. Encuentra exactamente lo que necesitas en cientos de páginas.
Extracción de Imágenes
Extrae imágenes embebidas de páginas de documentos. Diagramas, gráficos, fotos — extraídos y listos para análisis.
Fetch de URLs
Descarga y lee documentos desde URLs. Tu IA obtiene un documento de la web, lo cachea localmente y lo lee como cualquier archivo local.
Seguridad
Todo el procesamiento ocurre localmente. Ningún documento sale de tu máquina. Sin APIs cloud, sin riesgo de exfiltración.
Caché Rápida
Los documentos parseados se cachean para acceso instantáneo en lecturas posteriores. La primera lectura extrae, las siguientes son latencia casi cero.
OCR
Lee PDFs escaneados y archivos de imagen (PNG, JPG, TIFF) via OCR. Fallback automático para documentos basados en imagen, fuerza OCR cuando sea necesario.
Arquitectura
go-docs-mcp es un único binario Go que se comunica via stdio usando el Model Context Protocol. Delega a poppler-utils, tesseract y pandoc para extracción específica por formato.
12 herramientas en 5 categorías: Descubrimiento (2), Lectura (3), Búsqueda (1), Análisis (4), OCR (2).
12 Herramientas MCP
Un conjunto completo de herramientas para lectura, búsqueda y extracción de documentos multi-formato.
| Tool | Description |
|---|---|
list_documents | Listar todos los documentos en el directorio con detección de formato |
read_document | Leer texto completo o páginas específicas de cualquier documento soportado |
search_document | Buscar texto dentro de un documento con resultados contextuales |
get_document_summary | Obtener un resumen de la estructura y contenido del documento |
get_document_metadata | Extraer título, autor, fechas, número de páginas e info de formato |
get_document_outline | Extraer esquema del documento — encabezados, índice, estructura |
extract_tables | Extraer estructuras de tablas de documentos |
extract_images | Extraer imágenes embebidas de páginas de documentos |
read_url | Descargar un documento de una URL, cachear localmente y leerlo |
ocr_document | Forzar OCR en PDFs escaneados o documentos basados en imagen |
read_image | OCR de imágenes independientes (PNG, JPG, TIFF) |
list_formats | Mostrar formatos soportados y dependencias instaladas |
Inicio Rápido
Instala con un comando, configura en 30 segundos.
Requisitos
Un toolchain de Go para la instalación. Las dependencias por formato son opcionales — instala solo lo que necesites.
Construido Con
Un único binario Go con dependencias opcionales por formato.
- Go 1.25+ — Binario único, compilación multiplataforma
- MCP SDK (Go) — Model Context Protocol via stdio
- poppler-utils — Extracción de texto, imágenes y metadatos PDF
- tesseract + pandoc — OCR para imágenes/escaneos, conversión DOCX
¿Listo para dar a tu IA acceso a cualquier documento?
go-docs-mcp es gratuito, código abierto y se instala con un solo comando.