Q: ¿Y si la respuesta del LLM me dice algo erróneo sobre un cliente?

Eso entra en el principio RGPD de exactitud (art. 5.1.d). Si el LLM alucina datos sobre una persona física y tu sistema actúa sobre esa alucinación (manda un email, toma una decisión, registra en CRM), tu empresa es responsable. Mitigación práctica: (1) supervisión humana antes de acciones críticas; (2) RAG contra base de datos verdadera en vez de pedir al LLM que recuerde; (3) registro de prompts y respuestas para auditar fallos; (4) derecho de rectificación del titular siempre operativo en tu sistema.

Question 1

¿Es ilegal usar ChatGPT en mi empresa para datos de clientes?

Accepted Answer

No es ilegal per se, pero sin la configuración correcta sí incumples RGPD. Necesitas (1) usar el endpoint API empresarial o ChatGPT Team/Enterprise, no la versión gratuita ni Plus individual; (2) firmar DPA con OpenAI; (3) activar zero data retention si los datos son sensibles; (4) actualizar tu política de privacidad para mencionar el subencargado. Si haces estos cuatro pasos, OpenAI estándar es legalmente usable para datos personales no sensibles. Si son datos sensibles, mejor Azure OpenAI o open source.

Question 2

¿Anthropic Claude tiene servidores en Europa?

Accepted Answer

La API directa de Anthropic corre predominantemente en AWS US. Para residencia europea garantizada hay que usar Claude vía AWS Bedrock en región europea (Frankfurt eu-central-1, Irlanda eu-west-1, París eu-west-3). La API de Anthropic estándar es legal para datos personales con DPA firmado + zero data retention, pero los datos físicamente viajan a EE.UU. para procesarse. Si tu compliance interna exige UE estricta, Bedrock es la respuesta.

Question 3

¿Azure OpenAI es lo mismo que OpenAI estándar?

Accepted Answer

Los modelos son los mismos (GPT-4o, GPT-4.1, etc.) pero el servicio cambia: lo opera Microsoft, no OpenAI; los datos quedan en la región Azure que elijas (eliges UE si quieres); el DPA lo firma Microsoft; el contrato comercial es Microsoft Enterprise Agreement; y los precios son ligeramente diferentes (suelen ser similares o algo más caros). Para una pyme europea con preocupaciones de residencia, suele ser la decisión más cómoda si ya está en ecosistema Microsoft.

Question 4

¿Llama 3.1 o Mistral son tan buenos como GPT-4?

Accepted Answer

En 2026, para la mayoría de tareas empresariales (clasificación, extracción de entidades, resumen, generación de respuestas en RAG, redacción asistida) Llama 3.1 70B y Mistral Large 2 están muy cerca de GPT-4, con diferencias inferiores al 5% en benchmarks reales de empresa. Para razonamiento complejo, código avanzado o agentes con muchas herramientas, GPT-4o, Claude Sonnet 4 y Gemini 2 siguen un escalón por encima. La conclusión práctica: si tu caso de uso es 80% del trabajo típico de pyme, los open source bastan; si necesitas razonamiento puntero, sigue API comercial.

Question 5

¿Cuánto cuesta montar un LLM open source self-hosted?

Accepted Answer

Para uso ligero (modelo 7B-8B, hasta 50.000 peticiones/día) un VPS con GPU pequeña cuesta 50-150 €/mes (Hetzner, OVH). Para uso medio (modelo 70B, hasta 500.000 peticiones/día) hablamos de 800-1.500 €/mes con GPU L40S o A100. Montaje técnico inicial son 3-8 días de trabajo (3.000-8.000 € externalizado). Comparado con la API: a partir de unas 100M tokens/mes el break-even empieza a favorecer self-hosted.

Question 6

¿Cómo verifico que el proveedor realmente no entrena con mis datos?

Accepted Answer

Confianza más cláusulas contractuales. En la práctica: (1) leer el DPA y los Terms of Service comerciales, donde lo afirman explícitamente; (2) confirmar que estás en endpoint API o "for business", no en versión consumer; (3) si dudas, pedir certificación SOC 2 Type II al proveedor y revisar la sección de data handling. OpenAI, Anthropic, Microsoft y AWS publican esos documentos. La cuenta consumer gratuita de ChatGPT/Claude sí puede entrenar con tus datos salvo opt-out manual.

Question 7

¿Y si la respuesta del LLM me dice algo erróneo sobre un cliente?

Accepted Answer

Eso entra en el principio RGPD de exactitud (art. 5.1.d). Si el LLM alucina datos sobre una persona física y tu sistema actúa sobre esa alucinación (manda un email, toma una decisión, registra en CRM), tu empresa es responsable. Mitigación práctica: (1) supervisión humana antes de acciones críticas; (2) RAG contra base de datos verdadera en vez de pedir al LLM que recuerde; (3) registro de prompts y respuestas para auditar fallos; (4) derecho de rectificación del titular siempre operativo en tu sistema.

Question 8

¿Cómo encaja esto con el AI Act?

Accepted Answer

GDPR y AI Act se aplican en paralelo. RGPD regula el procesamiento de datos personales; AI Act regula el sistema IA en sí. Una configuración correcta de LLM cubre buena parte de los requisitos de transparencia del AI Act para sistemas de riesgo limitado. Para sistemas de alto riesgo (selección personal, scoring crédito), AI Act exige obligaciones extra: evaluación de impacto, supervisión humana, registro. Detalle completo en nuestro post sobre AI Act y pymes.

GDPR + LLMs: cómo configurar Anthropic, OpenAI y Azure sin filtrar datos.

Los LLM populares no son GDPR-compliant por defecto.

Cómo dejar cada LLM GDPR-compliant

Anthropic (Claude)

OpenAI (GPT)

Azure OpenAI

AWS Bedrock

Lo que sí guarda el proveedor y lo que no.

Lo que tu pyme debe tener firmado y configurado antes de meter datos reales

DPA (Data Processing Agreement) firmado

Zero data retention activado

Residencia de datos documentada

Cláusula de subprocesadores cubierta

Información al usuario actualizada

Anonimización o minimización en el prompt

LLM open source en VPS europeo.

Qué configuración encaja con tu pyme.

Pyme con datos no sensibles (marketing, ventas, ops)

Pyme con datos personales sensibles ocasionales

Pyme en sector regulado (sanidad, jurídico, banca)

Pyme con uso mixto (algunos flujos sensibles, otros no)

Dudas que nos hacéis llegar

¿Quieres dejar tu stack LLM blindado en RGPD?