# Sistema RAG base **Proyecto:** Workspace de tools IA para empresas **Modulo:** RAG **Ultima actualizacion:** 2026-04-05 **Ultima modificacion por:** Agente tools IA para potenciar servicios empresariales **Estado:** V1 operativa desplegada --- ## Proposito Definir un sistema RAG base, bien planteado y reutilizable, que pueda integrarse con rapidez en proyectos de clientes y tambien servir como base para tools internas del workspace. La prueba inicial con la carpeta `docs/` de este workspace se utilizara solo como ejemplo practico y entorno real de validacion, no como limite del sistema. Desde la v1, el sistema debe contemplar tambien PDFs como parte valida de las fuentes documentales de entrada. --- ## Que es lo que queremos lograr Queremos construir una base RAG que permita: - indexar informacion relevante de un proyecto - recuperar contexto util en funcion de una consulta - entregar ese contexto a un agente o servicio para mejorar sus respuestas o decisiones - integrarse con rapidez en otros proyectos sin rehacer la arquitectura cada vez En terminos practicos, el objetivo es disponer de una pieza reutilizable que convierta documentacion, conocimiento interno y otras fuentes en contexto accesible para agentes y servicios de IA. --- ## Vision del sistema Este sistema RAG debe quedar preparado para trabajar con diferentes tipos de fuentes, por ejemplo: - documentacion de proyecto - bases de conocimiento internas - contenido operativo de clientes - archivos tecnicos - datos exportados desde otros sistemas La carpeta `docs/` del workspace servira como primer caso real de prueba porque permite validar resultados con un conjunto de informacion pequeno, claro y facil de revisar. --- ## Objetivos principales 1. DiseƱar una base RAG reutilizable y desacoplada del proyecto de prueba. 2. Permitir que pueda conectarse a otros servicios de IA o agentes con una integracion sencilla. 3. Hacer que el sistema funcione con fuentes reales, empezando por `docs/`. 4. Facilitar continuidad entre sesiones, agentes y proyectos gracias a recuperacion de contexto relevante. 5. Dejar lista una arquitectura que luego pueda crecer hacia casos mas complejos. --- ## Caso de prueba inicial La primera validacion se hara con la carpeta `docs/` de este workspace. La idea es comprobar si un agente puede: - localizar rapidamente informacion relevante - entender que se ha hecho y que queda pendiente - responder con base documental sin releer todo manualmente - usar la documentacion del workspace como conocimiento ampliado en tiempo de consulta Esto servira para evaluar si la base conceptual y tecnica del RAG esta bien construida. --- ## Principios del sistema - Reutilizable: debe servir para este workspace y para proyectos de clientes. - Modular: ingesta, indexacion, recuperacion y consumo deben poder evolucionar por separado. - Simple al inicio: la primera version debe ser pequena y validable. - Escalable: debe poder crecer a nuevas fuentes y nuevos casos de uso. - Trazable: el contexto recuperado debe indicar de donde sale. - Facil de integrar: debe poder conectarse rapidamente a agentes, tools o servicios. --- ## Resultado esperado Si el sistema esta bien planteado, deberiamos poder usarlo como una capa de contexto ampliado para agentes y servicios, logrando que consulten conocimiento relevante de forma rapida y util, sin depender de tener toda la informacion cargada manualmente en cada sesion. --- ## Estado actual de la v1 La v1 ya ha alcanzado un estado operativo real. Estado confirmado: - desplegada en `VPS2` - dominio activo: `https://rag.por-correo.com` - conexion operativa con `Qdrant` - soporte funcional para `documental` y `codigo` - endpoints operativos: `GET /health`, `POST /ingest`, `POST /retrieve`, `POST /answer` Pruebas funcionales ya superadas: - consulta documental sobre pendientes del workspace - consulta conceptual sobre caracteristicas del RAG - consulta tecnica en modo codigo sobre la construccion de `source_id` Pendientes de evolucion de esta base: - sustituir el modelo actual de `answer` por una alternativa alineada con la decision de no depender de OpenAI en esa capa - seguir refinando retrieval y answer segun resultados de uso real --- ## Alcance de este documento Este documento define el que y el para que del sistema RAG base. En documentos posteriores de esta carpeta se podran detallar, por separado: - arquitectura propuesta - flujo de ingesta - estrategia de chunking - embeddings y almacenamiento - interfaz de consulta - pruebas con `docs/` - criterios de evaluacion de resultados