rag-service/RAG/docs/SISTEMA_RAG_BASE.md

# Sistema RAG base

**Proyecto:** Workspace de tools IA para empresas
**Modulo:** RAG
**Ultima actualizacion:** 2026-04-05
**Ultima modificacion por:** Agente tools IA para potenciar servicios empresariales
**Estado:** V1 operativa desplegada

---

## Proposito

Definir un sistema RAG base, bien planteado y reutilizable, que pueda integrarse con rapidez en proyectos de clientes y tambien servir como base para tools internas del workspace.

La prueba inicial con la carpeta `docs/` de este workspace se utilizara solo como ejemplo practico y entorno real de validacion, no como limite del sistema.

Desde la v1, el sistema debe contemplar tambien PDFs como parte valida de las fuentes documentales de entrada.

---

## Que es lo que queremos lograr

Queremos construir una base RAG que permita:

- indexar informacion relevante de un proyecto
- recuperar contexto util en funcion de una consulta
- entregar ese contexto a un agente o servicio para mejorar sus respuestas o decisiones
- integrarse con rapidez en otros proyectos sin rehacer la arquitectura cada vez

En terminos practicos, el objetivo es disponer de una pieza reutilizable que convierta documentacion, conocimiento interno y otras fuentes en contexto accesible para agentes y servicios de IA.

---

## Vision del sistema

Este sistema RAG debe quedar preparado para trabajar con diferentes tipos de fuentes, por ejemplo:

- documentacion de proyecto
- bases de conocimiento internas
- contenido operativo de clientes
- archivos tecnicos
- datos exportados desde otros sistemas

La carpeta `docs/` del workspace servira como primer caso real de prueba porque permite validar resultados con un conjunto de informacion pequeno, claro y facil de revisar.

---

## Objetivos principales

1. Diseñar una base RAG reutilizable y desacoplada del proyecto de prueba.
2. Permitir que pueda conectarse a otros servicios de IA o agentes con una integracion sencilla.
3. Hacer que el sistema funcione con fuentes reales, empezando por `docs/`.
4. Facilitar continuidad entre sesiones, agentes y proyectos gracias a recuperacion de contexto relevante.
5. Dejar lista una arquitectura que luego pueda crecer hacia casos mas complejos.

---

## Caso de prueba inicial

La primera validacion se hara con la carpeta `docs/` de este workspace.

La idea es comprobar si un agente puede:

- localizar rapidamente informacion relevante
- entender que se ha hecho y que queda pendiente
- responder con base documental sin releer todo manualmente
- usar la documentacion del workspace como conocimiento ampliado en tiempo de consulta

Esto servira para evaluar si la base conceptual y tecnica del RAG esta bien construida.

---

## Principios del sistema

- Reutilizable: debe servir para este workspace y para proyectos de clientes.
- Modular: ingesta, indexacion, recuperacion y consumo deben poder evolucionar por separado.
- Simple al inicio: la primera version debe ser pequena y validable.
- Escalable: debe poder crecer a nuevas fuentes y nuevos casos de uso.
- Trazable: el contexto recuperado debe indicar de donde sale.
- Facil de integrar: debe poder conectarse rapidamente a agentes, tools o servicios.

---

## Resultado esperado

Si el sistema esta bien planteado, deberiamos poder usarlo como una capa de contexto ampliado para agentes y servicios, logrando que consulten conocimiento relevante de forma rapida y util, sin depender de tener toda la informacion cargada manualmente en cada sesion.

---

## Estado actual de la v1

La v1 ya ha alcanzado un estado operativo real.

Estado confirmado:
- desplegada en `VPS2`
- dominio activo: `https://rag.por-correo.com`
- conexion operativa con `Qdrant`
- soporte funcional para `documental` y `codigo`
- endpoints operativos: `GET /health`, `POST /ingest`, `POST /retrieve`, `POST /answer`

Pruebas funcionales ya superadas:
- consulta documental sobre pendientes del workspace
- consulta conceptual sobre caracteristicas del RAG
- consulta tecnica en modo codigo sobre la construccion de `source_id`

Pendientes de evolucion de esta base:
- sustituir el modelo actual de `answer` por una alternativa alineada con la decision de no depender de OpenAI en esa capa
- seguir refinando retrieval y answer segun resultados de uso real

---

## Alcance de este documento

Este documento define el que y el para que del sistema RAG base.

En documentos posteriores de esta carpeta se podran detallar, por separado:

- arquitectura propuesta
- flujo de ingesta
- estrategia de chunking
- embeddings y almacenamiento
- interfaz de consulta
- pruebas con `docs/`
- criterios de evaluacion de resultados