Magnetia — Agencia de marketing digital, IA y diseño web
Glosario · IA Técnica

¿Qué es Tool Use y cómo un agente IA elige qué herramienta usar y cuándo?

La capacidad del LLM de elegir, encadenar y ejecutar herramientas para completar tareas multi-paso. Base de cualquier agente IA serio. Patrón ReAct, orquestación y guardrails.

Diseñar agente IA con tool use

Actualizado mayo 2026

Definición

Tool use: el LLM decide qué herramienta usar y orquesta llamadas para completar una tarea.

Tool use en agentes IA es la capacidad del LLM de elegir entre múltiples herramientas disponibles, llamarlas con argumentos correctos, interpretar los resultados y encadenar varias llamadas para completar una tarea multi-paso. Es la diferencia entre un asistente que responde con texto y un agente IA que ejecuta acciones reales.

Técnicamente se apoya en function calling (los dos términos se usan casi como sinónimos). La diferencia es de escala: function calling describe el mecanismo de una llamada; tool use describe el patrón de decisión y orquestación cuando hay múltiples herramientas y la tarea requiere varias llamadas encadenadas.

El patrón más usado es ReAct (Reasoning + Acting), publicado por Yao et al. (2022): el agente alterna ciclos de razonar ("¿qué necesito hacer ahora? ¿qué herramienta usar?") y actuar (llamar herramienta), incorporando el resultado como contexto para el siguiente razonamiento. Es el patrón base de la mayoría de frameworks de agentes (LangChain, LlamaIndex, Anthropic Computer Use, OpenAI Assistants).

En una pyme española en 2026, tool use bien diseñado permite agentes que: buscar clientes en CRM, calcular cotización, mandar email, agendar reunión y crear ticket de seguimiento en una sola conversación. Sin tool use, cada paso requiere intervención humana. Con tool use bien diseñado, el agente orquesta autónomo. Sin diseño cuidadoso, los agentes con tools fallan en loops, alucinaciones de argumentos o ejecuciones peligrosas.

Patrones

Seis patrones de tool use en agentes IA

Las arquitecturas que vemos funcionar en producción 2025-2026.

ReAct: razonar + actuar

Ciclos alternos de pensamiento y acción. El agente piensa qué hacer, llama herramienta, lee resultado, vuelve a pensar. Patrón base. Soportado por LangChain, LlamaIndex, Anthropic.

Tool routing

Primer LLM "router" decide qué tool especialista usar (CRM, ERP, calendario). Cada tool tiene su propio sub-agente. Reduce ruido de tener 30 funciones a la vez en un prompt.

Sub-agentes especializados

Agente principal delega tareas a sub-agentes especializados (uno para ventas, uno para soporte, uno para finanzas). Cada uno con sus tools propias. Anthropic Claude implementa este patrón.

Plan-then-execute

Agente primero genera plan completo (lista de pasos), luego ejecuta cada paso con tools. Menos flexible que ReAct pero más predecible. Útil cuando la tarea tiene estructura conocida.

Multi-turn con humano en el bucle

Agente avanza autónomo hasta paso crítico (transferir dinero, borrar dato, mandar email). En ese punto, pide confirmación humana antes de seguir. Guardrails contra acciones peligrosas.

Computer use / browser agent

Tool use con herramientas de control de UI (clic, escribir, leer pantalla). Anthropic Computer Use, OpenAI Operator. Agente opera apps que no tienen API. Frágil pero potente cuando funciona.

Cómo diseñarlo

Cinco fases para diseñar tool use que aguante producción

Saltarse pasos sale caro. Cada uno previene clases enteras de fallo.

01

Inventario y diseño de herramientas

Listar herramientas necesarias: lectura (consulta CRM, BBDD), escritura (crear lead, mandar email), cálculo (precio con descuentos). Cada una con nombre claro, descripción precisa y schema de argumentos.

02

Prompt sistémico con instrucciones de uso

Cuándo usar cada tool, en qué orden, qué hacer si una falla. Few-shot con ejemplos de trayectorias completas (input → secuencia de tool calls → respuesta final).

03

Guardrails y permisos

Permisos por tipo de acción: read-only sin restricción, write con validación, delete con confirmación. Rate limits por usuario. Validación de argumentos antes de ejecutar. Confirmación humana en acciones críticas.

04

Observabilidad de trayectorias

Cada conversación con su secuencia de tool calls debe loggearse: input, tools usadas, argumentos, resultados, decisiones intermedias. Sin trazas, debugging es imposible. Langfuse, LangSmith, Arize Phoenix lo cubren.

05

Evaluación con casos reales

Dataset de trayectorias completas etiquetadas (entrada → secuencia correcta de tools → output esperado). Cada cambio en prompt o tool se valida contra dataset. Sin esto, mejoras son intuición.

Errores comunes

Cinco errores típicos en tool use de agentes

Demasiadas tools en un solo agente

Dar 40 funciones a un agente único. La elección se degrada con cantidad. Mejor: routing a sub-agentes especializados con 5-10 tools cada uno. Más mantenible y más fiable.

No manejar errores de tools

Tool falla (API caída, argumento mal) y el agente no sabe. Patrón obligatorio: devolver al agente el error en formato estructurado para que reintente o pida ayuda humana. Sin esto, el agente queda colgado.

Loops infinitos

Agente llama tool A → recibe X → llama tool B → recibe Y → vuelve a A. Sin límite, gasta tokens infinitos. Patrón: <strong>max_iterations</strong> (típico 10-20), guard contra repetir misma llamada con mismos args.

Permisos demasiado amplios desde el inicio

Tools de borrado, transferencia, compra activas en producción día 1. Una alucinación puede causar daño real. Empezar con read-only, ampliar a write tras validación, mantener acciones críticas con confirmación humana.

No medir tasa de éxito de trayectorias

Saber que individualmente cada tool funciona pero no medir si trayectorias completas terminan bien. Métrica clave: <strong>% de conversaciones que terminan con éxito según humano evaluador</strong>. Sin esto, optimizas piezas, no el sistema.

Cómo se relaciona con otros conceptos

Tool use en el mapa de IA empresarial.

Tool use es lo que convierte a un LLM en agente IA. Se construye sobre function calling y se beneficia de chain-of-thought (el modelo razona antes de elegir tool). Estándar emergente para estandarizar tools entre proveedores: MCP de Anthropic.

En arquitecturas avanzadas, tool use se combina con RAG: el agente tiene tool "search_docs" que ejecuta RAG cuando necesita información. Permite mezclar conocimiento estable (vía RAG) con acciones dinámicas (vía tools).

La disciplina operativa de tool use cae bajo LLMOps: trazas de trayectorias, evaluación de éxito, monitorización de coste por tool, alertas por errores. Sin LLMOps, los agentes en producción son cajas negras frágiles. Ver también agentes IA vs automatización clásica.

Para pymes españolas que quieran montar agentes con tool use serio (no demos), Magnetia diseña arquitectura completa: tools, prompt sistémico, guardrails, observabilidad, evaluación. Servicio integrado en automatización de procesos con IA, cofinanciable Kit Consulting.

Preguntas frecuentes

Dudas que nos hacéis llegar

Son esencialmente lo mismo con uso diferente. Function calling describe el mecanismo técnico de una llamada (schema, argumentos). Tool use describe el patrón de uso cuando hay múltiples herramientas y la tarea requiere encadenarlas. En la práctica los términos se intercambian.
45 min, sin compromiso

¿Quieres un agente IA que de verdad ejecute tareas?

Diseñamos arquitectura completa: tools, prompt sistémico, guardrails, observabilidad, evaluación. Agente que opera CRM, ERP, calendario con seguridad y trazabilidad.

Hablemos