3.7 KiB
Sistema RAG base
Proyecto: Workspace de tools IA para empresas
Modulo: RAG
Ultima actualizacion: 2026-04-02
Ultima modificacion por: Agente tools IA para potenciar servicios empresariales
Estado: En definicion
Proposito
Definir un sistema RAG base, bien planteado y reutilizable, que pueda integrarse con rapidez en proyectos de clientes y tambien servir como base para tools internas del workspace.
La prueba inicial con la carpeta docs/ de este workspace se utilizara solo como ejemplo practico y entorno real de validacion, no como limite del sistema.
Desde la v1, el sistema debe contemplar tambien PDFs como parte valida de las fuentes documentales de entrada.
Que es lo que queremos lograr
Queremos construir una base RAG que permita:
- indexar informacion relevante de un proyecto
- recuperar contexto util en funcion de una consulta
- entregar ese contexto a un agente o servicio para mejorar sus respuestas o decisiones
- integrarse con rapidez en otros proyectos sin rehacer la arquitectura cada vez
En terminos practicos, el objetivo es disponer de una pieza reutilizable que convierta documentacion, conocimiento interno y otras fuentes en contexto accesible para agentes y servicios de IA.
Vision del sistema
Este sistema RAG debe quedar preparado para trabajar con diferentes tipos de fuentes, por ejemplo:
- documentacion de proyecto
- bases de conocimiento internas
- contenido operativo de clientes
- archivos tecnicos
- datos exportados desde otros sistemas
La carpeta docs/ del workspace servira como primer caso real de prueba porque permite validar resultados con un conjunto de informacion pequeno, claro y facil de revisar.
Objetivos principales
- Diseñar una base RAG reutilizable y desacoplada del proyecto de prueba.
- Permitir que pueda conectarse a otros servicios de IA o agentes con una integracion sencilla.
- Hacer que el sistema funcione con fuentes reales, empezando por
docs/. - Facilitar continuidad entre sesiones, agentes y proyectos gracias a recuperacion de contexto relevante.
- Dejar lista una arquitectura que luego pueda crecer hacia casos mas complejos.
Caso de prueba inicial
La primera validacion se hara con la carpeta docs/ de este workspace.
La idea es comprobar si un agente puede:
- localizar rapidamente informacion relevante
- entender que se ha hecho y que queda pendiente
- responder con base documental sin releer todo manualmente
- usar la documentacion del workspace como conocimiento ampliado en tiempo de consulta
Esto servira para evaluar si la base conceptual y tecnica del RAG esta bien construida.
Principios del sistema
- Reutilizable: debe servir para este workspace y para proyectos de clientes.
- Modular: ingesta, indexacion, recuperacion y consumo deben poder evolucionar por separado.
- Simple al inicio: la primera version debe ser pequena y validable.
- Escalable: debe poder crecer a nuevas fuentes y nuevos casos de uso.
- Trazable: el contexto recuperado debe indicar de donde sale.
- Facil de integrar: debe poder conectarse rapidamente a agentes, tools o servicios.
Resultado esperado
Si el sistema esta bien planteado, deberiamos poder usarlo como una capa de contexto ampliado para agentes y servicios, logrando que consulten conocimiento relevante de forma rapida y util, sin depender de tener toda la informacion cargada manualmente en cada sesion.
Alcance de este documento
Este documento define el que y el para que del sistema RAG base.
En documentos posteriores de esta carpeta se podran detallar, por separado:
- arquitectura propuesta
- flujo de ingesta
- estrategia de chunking
- embeddings y almacenamiento
- interfaz de consulta
- pruebas con
docs/ - criterios de evaluacion de resultados