Dev Tools
Gotify Commander Un mando a distancia para tus servidores. El primer plugin de Gotify que responde.
SoundInbox Deja de revisar email. Escucha lo que importa.

Go-Docs MCP

Install and Go — tu IA lee cualquier documento

macOS Linux Licencia MIT Código Abierto Servidor MCP

El Problema

Todos los servidores MCP de documentos necesitan Node.js o Python. Solo manejan un formato — y ninguno hace OCR, extracción de tablas o lectura de imágenes.

La Solución

go install y listo. Un binario, 12 herramientas. PDF, DOCX, Markdown, imágenes, OCR — sin runtime, sin configuración.

¿Por qué go-docs-mcp?

El ecosistema MCP está inundado de Node y Python. Una opción en Go destaca simplemente por ser diferente. La gente que usa infraestructura ligera — self-hosters, DevOps, usuarios de terminal — prefiere binarios compilados sobre runtimes interpretados. Si ya tienes Go, este es el camino más rápido de cero a IA que lee documentos.

Node / TS MCPs Python MCPs go-docs-mcp
Necesita Node.js Necesita Python + pip Binario único, sin runtime
📄 Un solo formato Un solo formato PDF + TXT + MD + DOCX + CSV + imágenes
👁 Sin OCR Sin OCR OCR para PDFs escaneados + imágenes
📊 Tablas limitadas Tablas básicas Tablas + outline + imágenes + caché
🔒 Seguridad variable Seguridad variable Solo lectura, directorio bloqueado

Características

📄

Leer Cualquier Documento

Extrae texto completo de PDF, TXT, MD, CSV, DOCX e imágenes (PNG/JPG/TIFF) con granularidad por página. Tu IA lee cualquier formato desde un único servidor.

🔍

Búsqueda

Búsqueda full-text dentro de documentos con resultados contextuales. Encuentra exactamente lo que necesitas en cientos de páginas.

📷

Extracción de Imágenes

Extrae imágenes embebidas de páginas de documentos. Diagramas, gráficos, fotos — extraídos y listos para análisis.

🌐

Fetch de URLs

Descarga y lee documentos desde URLs. Tu IA obtiene un documento de la web, lo cachea localmente y lo lee como cualquier archivo local.

🔒

Seguridad

Todo el procesamiento ocurre localmente. Ningún documento sale de tu máquina. Sin APIs cloud, sin riesgo de exfiltración.

Caché Rápida

Los documentos parseados se cachean para acceso instantáneo en lecturas posteriores. La primera lectura extrae, las siguientes son latencia casi cero.

👁

OCR

Lee PDFs escaneados y archivos de imagen (PNG, JPG, TIFF) via OCR. Fallback automático para documentos basados en imagen, fuerza OCR cuando sea necesario.

Arquitectura

go-docs-mcp es un único binario Go que se comunica via stdio usando el Model Context Protocol. Delega a poppler-utils, tesseract y pandoc para extracción específica por formato.

# Data flow 🤖 AI (Claude, ChatGPT, etc.) → MCP (stdio) → go-docs-mcp (~10MB) ↓ 📄 PDF (poppler) 📝 TXT/MD/CSV 🗎 DOCX (pandoc) 📷 Images (tesseract OCR) ↓ Parsed → cached → AI

12 herramientas en 5 categorías: Descubrimiento (2), Lectura (3), Búsqueda (1), Análisis (4), OCR (2).

12 Herramientas MCP

Un conjunto completo de herramientas para lectura, búsqueda y extracción de documentos multi-formato.

ToolDescription
list_documentsListar todos los documentos en el directorio con detección de formato
read_documentLeer texto completo o páginas específicas de cualquier documento soportado
search_documentBuscar texto dentro de un documento con resultados contextuales
get_document_summaryObtener un resumen de la estructura y contenido del documento
get_document_metadataExtraer título, autor, fechas, número de páginas e info de formato
get_document_outlineExtraer esquema del documento — encabezados, índice, estructura
extract_tablesExtraer estructuras de tablas de documentos
extract_imagesExtraer imágenes embebidas de páginas de documentos
read_urlDescargar un documento de una URL, cachear localmente y leerlo
ocr_documentForzar OCR en PDFs escaneados o documentos basados en imagen
read_imageOCR de imágenes independientes (PNG, JPG, TIFF)
list_formatsMostrar formatos soportados y dependencias instaladas

Inicio Rápido

Instala con un comando, configura en 30 segundos.

# 1. Install go install github.com/drolosoft/go-docs-mcp@latest # 2. Add to your MCP config (Claude Desktop, etc.) { "mcpServers": { "docs": { "command": "go-docs-mcp", "env": { "DOCS_MCP_DIR": "/path/to/your/documents" } } } } # 3. Restart your AI client — done

Requisitos

Un toolchain de Go para la instalación. Las dependencias por formato son opcionales — instala solo lo que necesites.

Construido Con

Un único binario Go con dependencias opcionales por formato.

  • Go 1.25+ — Binario único, compilación multiplataforma
  • MCP SDK (Go) — Model Context Protocol via stdio
  • poppler-utils — Extracción de texto, imágenes y metadatos PDF
  • tesseract + pandoc — OCR para imágenes/escaneos, conversión DOCX
Gimme a coffee 😋
Buy Me A Coffee

Construyo las herramientas que me faltan, y las regalo.
Si alguna te ahorró tiempo, un café mantiene la siguiente en camino.

Buy Me A Coffee QR

¿Listo para dar a tu IA acceso a cualquier documento?

go-docs-mcp es gratuito, código abierto y se instala con un solo comando.

1 Or gimme a star 🤗