Q: ¿Cuánto cuesta cada vector almacenado?

En pgvector : 0 € adicionales más allá del coste de Postgres. En Qdrant self-hosted : ~0 € por vector, pagas el servidor. En Pinecone : el plan Standard (~70 €/mes) incluye ~100.000 vectores con dimensión 1.536, escala progresivamente. El coste por vector individual es despreciable hasta volúmenes de millones.

Q: ¿Qué dimensión de embeddings usar?

Lo decide el modelo de embeddings, no la vector DB. text-embedding-3-small de OpenAI: 1.536 dimensiones (configurable a 512 o 768 para ahorrar coste). voyage-3 de Voyage AI: 1.024. bge-m3 (open-source): 1.024. Para pyme normal: 1.024-1.536 es estándar. Dimensiones más bajas = más rápido y barato, pero pierdes precisión.

Question 1

¿Necesito una vector database si solo tengo 50 documentos?

Accepted Answer

Probablemente no. Con menos de ~100 chunks puedes meterlos directamente en el contexto del prompt o usar búsqueda lineal en memoria (cosine similarity en numpy o equivalente). Vector database empieza a justificarse a partir de ~1.000 chunks o cuando la latencia importa.

Question 2

¿Cuánto cuesta cada vector almacenado?

Accepted Answer

En pgvector: 0 € adicionales más allá del coste de Postgres. En Qdrant self-hosted: ~0 € por vector, pagas el servidor. En Pinecone: el plan Standard (~70 €/mes) incluye ~100.000 vectores con dimensión 1.536, escala progresivamente. El coste por vector individual es despreciable hasta volúmenes de millones.

Question 3

¿Qué dimensión de embeddings usar?

Accepted Answer

Lo decide el modelo de embeddings, no la vector DB. text-embedding-3-small de OpenAI: 1.536 dimensiones (configurable a 512 o 768 para ahorrar coste). voyage-3 de Voyage AI: 1.024. bge-m3 (open-source): 1.024. Para pyme normal: 1.024-1.536 es estándar. Dimensiones más bajas = más rápido y barato, pero pierdes precisión.

Question 4

¿Puedo migrar de una vector DB a otra después?

Accepted Answer

Sí, sin gran fricción. Los embeddings ya calculados se pueden exportar como JSON o Parquet y reimportar en cualquier otra base. Lo que NO se migra fácilmente son los filtros y queries: cada base tiene su DSL. Cambiar de proveedor lleva típicamente 1-5 días de ingeniería.

Question 5

¿Pgvector aguanta producción real o es solo para prototipos?

Accepted Answer

Aguanta producción muy bien hasta 1-5 millones de vectores con índice HNSW. Por encima de ese rango el rendimiento empieza a degradarse y migrar a Qdrant o Milvus suele compensar. Notion, Supabase y muchos chatbots públicos corren sobre pgvector sin problemas. La narrativa de "pgvector solo para POC" es marketing de competidores.

Question 6

¿Qué pasa con los datos cuando uso una vector DB cloud?

Accepted Answer

Pinecone, Qdrant Cloud y Weaviate Cloud tienen DPA RGPD y permiten elegir región europea. Para sectores muy regulados o datos críticos, self-hosted en VPS propio (Qdrant en Hetzner, pgvector en tu Postgres) es la opción más segura: los vectores no salen nunca de tu infraestructura.

Question 7

¿La vector DB sirve para imágenes o solo texto?

Accepted Answer

Sirve para cualquier dato que pueda representarse como vector: texto, imágenes (modelos CLIP), audio (Whisper embeddings), código (modelos de embedding de código), incluso productos con sus atributos. La vector DB es agnóstica al tipo — lo que cambia es el modelo de embedding que usas para convertir el dato.

Question 8

¿Cuándo migrar de pgvector a Qdrant o Pinecone?

Accepted Answer

Cuando la latencia de búsqueda supera ~200ms con tu índice HNSW bien afinado, cuando pasas de 5 millones de chunks, cuando necesitas multi-tenancy con colecciones separadas y aislamiento estricto, o cuando tu Postgres principal sufre por el peso adicional de los embeddings. Antes de eso, migrar es prematuro.

¿Qué es una vector database y por qué la necesitas para hacer RAG?

Vector database: el motor de búsqueda semántica que hace funcionar a RAG.

pgvector vs Qdrant vs Pinecone en mayo 2026

pgvector (Postgres)

Qdrant

Pinecone

Weaviate

Chroma

Milvus

Cómo elegir la vector database adecuada para tu pyme.

Volumen estimado de chunks

Stack existente

Latencia exigida

Presupuesto recurrente

Plan de escalado

Cinco errores típicos al elegir y montar vector database

Empezar con Pinecone "por si acaso"

No filtrar metadatos al consultar

Chunks demasiado grandes o pequeños

No actualizar el índice cuando cambia la fuente

Confiar solo en similitud vectorial sin reranking

Vector database en el ecosistema de IA empresarial.

Dudas que nos hacéis llegar

¿Necesitas montar RAG con tu documentación?