Anthropic MCP + Claude Agent SDK: agentes IA serios en pyme.
Dos piezas clave del ecosistema Anthropic 2026: el protocolo abierto MCP para conectar tools y datos a modelos, y el Agent SDK para construir agentes operativos. Cómo encajan, dónde brillan y dónde no son la respuesta.
Actualizado mayo 2026
Dos piezas distintas, complementarias.
MCP (Model Context Protocol) es un protocolo abierto creado por Anthropic en 2024 para conectar modelos LLM con herramientas, datos y servicios. Es el "USB-C de los LLM": un estándar único que evita reinventar conectores con cada framework. Soportado por Claude, OpenAI, Vercel AI SDK, Langchain. Ver MCP Anthropic para equipos y function calling MCP.
Claude Agent SDK es el SDK oficial de Anthropic para construir agentes basados en Claude: bucle agente, manejo de herramientas, contexto largo, memoria, sub-agentes. Pensado para ejecutar tareas complejas con autonomía controlada. TypeScript y Python.
Combinados: el Agent SDK orquesta el comportamiento del agente, MCP le da acceso a tus tools y datos (CRM, base datos, ficheros, APIs internas). Es la pareja recomendada cuando construyes agentes serios con Claude.
Tres razones para mirarlo en serio
No es marketing, es arquitectura.
Estándar abierto
MCP es protocolo abierto, no propietario. Los servidores MCP que escribes funcionan con Claude, ChatGPT, Vercel AI SDK y cualquier cliente compatible. Evita vendor lock-in y reescribir tools cada vez que cambias de modelo.
Reutilización de tools
Una vez tienes un servidor MCP para tu CRM, ERP o base de datos, lo conectas a cualquier app o agente. Un mismo conector vale para chatbot interno, automatización backend y Claude Code de desarrollo. Ahorra muchísimo trabajo repetido.
Bucle agente probado
Claude Agent SDK encapsula el bucle agente (LLM → tool → result → LLM → ...) con manejo de context window largo, gestión de errores y subagentes. Ahorra reescribir esa máquina de estado, que es donde más sufren los frameworks generales.
Dónde MCP + Agent SDK pyme tiene sentido.
1. Agente comercial sobre CRM. Servidor MCP para HubSpot/Salesforce/Pipedrive + Agent SDK con Claude. El agente busca contactos, actualiza notas, programa tareas, redacta emails. Operador humano supervisa. Ahorra horas de trabajo administrativo.
2. Asistente operaciones interno. Servidor MCP que expone tu base datos operativa + sistema de tickets + documentación. Agente responde preguntas internas tipo "qué pedidos llevamos esta semana del cliente X" con datos reales, no inventados.
3. Automatización data ad-hoc. Servidor MCP sobre warehouse (BigQuery, Snowflake) + Agent SDK. Analistas no técnicos preguntan en castellano, agente genera SQL, ejecuta, devuelve resultados. Variante seria de text-to-SQL. Ver fine-tuning vs RAG.
4. Soporte técnico aumentado. Servidor MCP sobre Zendesk/Intercom + base conocimiento + sistema operativo cliente. Agente clasifica ticket, busca contexto, redacta borrador respuesta. Humano valida y envía. Ver AI agents customer service.
5. Asistente para desarrollo interno. Servidores MCP para Git, base datos dev, documentación API. Agente ayuda al equipo dev a buscar contexto, generar boilerplate, actualizar docs. Variante interna del patrón Claude Code.
Proyecto piloto en 4-6 semanas
Semana 1 · Caso de uso y permisos
Elegir un caso operativo concreto (no genérico). Definir qué tools necesita el agente, con qué permisos lee/escribe, qué pasos requieren validación humana. Sin esto, agente es problema esperando ocurrir.
Semana 2 · Servidor MCP del primer sistema
Construir o adoptar un servidor MCP para el sistema principal (CRM, base datos, ERP). Empezar por operaciones de lectura. Probar con Claude Desktop antes de meterlo en agente productivo.
Semana 3 · Agente con Claude Agent SDK
Implementar el bucle agente con system prompt claro, tools del MCP, gestión de errores. UI mínima (CLI o web) para probar. Sin UI bonita aún, foco en comportamiento.
Semana 4 · Permisos y validación humana
Sumar gates para operaciones críticas (escritura en CRM, envío de email). Logging estructurado de cada acción. Alertas en caso de error. Sin este paso, agente en producción genera incidentes.
Semana 5-6 · Piloto controlado
Lanzar con 3-5 usuarios reales en operación supervisada. Medir: % tareas completadas, errores, tiempo ahorrado, satisfacción. Iterar prompts y tools antes de ampliar audiencia.
Lo que vemos roto en agentes
Agente sin guardrails
Dejar al agente escribir en CRM o enviar emails sin validación humana ni límites. Primera semana: 8 emails enviados al cliente equivocado. Mínimo: dry-run, confirmación humana para operaciones críticas, rate limits.
Servidor MCP con permisos excesivos
Servidor MCP con credenciales admin del CRM. Si el agente alucina un DROP, problema serio. Permisos por principio de mínimo privilegio: solo lectura donde sea posible, escritura limitada a campos concretos.
Sin observabilidad de agente
Agente en producción sin trazas de cada decisión. Cuando algo va mal, semanas reconstruyendo. Mínimo: Langfuse o LangSmith con trazas por paso del agente. Ver LangSmith vs Helicone vs Langfuse.
Caso de uso demasiado abierto
"Agente que ayuda a comercial" sin acotar. Comercial pide cosas distintas cada día, agente falla en 70%. Empezar acotado ("agente que actualiza notas tras una llamada") y ampliar tras éxito medible.
Checklist mínima para agente serio
Caso de uso acotado y medible
Una tarea concreta, un usuario tipo, un éxito definido. Sin esto, agente genérico falla en todo.
Tools con permisos mínimos
Cada tool MCP con principio de mínimo privilegio. Lectura por defecto, escritura solo donde imprescindible y con validación.
Loop con validación humana donde corresponde
Operaciones críticas (escribir CRM, enviar email, modificar datos cliente): confirmación humana o doble pasada de revisión. Sin esto, incidentes inminentes.
Observabilidad por defecto
Trazas de cada paso del agente: prompt, tools llamados, resultados, decisión. Langfuse o LangSmith integrado. Sin trazas, debugging es imposible.
Plan de rollback
Si el agente falla en producción, qué pasa con tareas a medio hacer, cómo se revierten escrituras. Pensar en fracaso antes que en éxito.
Dudas que nos hacéis llegar
¿Quieres montar un agente serio con MCP y Claude Agent SDK?
Diagnóstico de caso, arquitectura propuesta, piloto controlado en 4-6 semanas con métricas reales. Sin promesas de "agente que lo hace todo".