Sistema RAG base

Proyecto: Workspace de tools IA para empresas
Modulo: RAG
Ultima actualizacion: 2026-04-02
Ultima modificacion por: Agente tools IA para potenciar servicios empresariales
Estado: En definicion

Proposito

Definir un sistema RAG base, bien planteado y reutilizable, que pueda integrarse con rapidez en proyectos de clientes y tambien servir como base para tools internas del workspace.

La prueba inicial con la carpeta docs/ de este workspace se utilizara solo como ejemplo practico y entorno real de validacion, no como limite del sistema.

Desde la v1, el sistema debe contemplar tambien PDFs como parte valida de las fuentes documentales de entrada.

Que es lo que queremos lograr

Queremos construir una base RAG que permita:

indexar informacion relevante de un proyecto
recuperar contexto util en funcion de una consulta
entregar ese contexto a un agente o servicio para mejorar sus respuestas o decisiones
integrarse con rapidez en otros proyectos sin rehacer la arquitectura cada vez

En terminos practicos, el objetivo es disponer de una pieza reutilizable que convierta documentacion, conocimiento interno y otras fuentes en contexto accesible para agentes y servicios de IA.

Vision del sistema

Este sistema RAG debe quedar preparado para trabajar con diferentes tipos de fuentes, por ejemplo:

documentacion de proyecto
bases de conocimiento internas
contenido operativo de clientes
archivos tecnicos
datos exportados desde otros sistemas

La carpeta docs/ del workspace servira como primer caso real de prueba porque permite validar resultados con un conjunto de informacion pequeno, claro y facil de revisar.

Objetivos principales

Diseñar una base RAG reutilizable y desacoplada del proyecto de prueba.
Permitir que pueda conectarse a otros servicios de IA o agentes con una integracion sencilla.
Hacer que el sistema funcione con fuentes reales, empezando por docs/.
Facilitar continuidad entre sesiones, agentes y proyectos gracias a recuperacion de contexto relevante.
Dejar lista una arquitectura que luego pueda crecer hacia casos mas complejos.

Caso de prueba inicial

La primera validacion se hara con la carpeta docs/ de este workspace.

La idea es comprobar si un agente puede:

localizar rapidamente informacion relevante
entender que se ha hecho y que queda pendiente
responder con base documental sin releer todo manualmente
usar la documentacion del workspace como conocimiento ampliado en tiempo de consulta

Esto servira para evaluar si la base conceptual y tecnica del RAG esta bien construida.

Principios del sistema

Reutilizable: debe servir para este workspace y para proyectos de clientes.
Modular: ingesta, indexacion, recuperacion y consumo deben poder evolucionar por separado.
Simple al inicio: la primera version debe ser pequena y validable.
Escalable: debe poder crecer a nuevas fuentes y nuevos casos de uso.
Trazable: el contexto recuperado debe indicar de donde sale.
Facil de integrar: debe poder conectarse rapidamente a agentes, tools o servicios.

Resultado esperado

Si el sistema esta bien planteado, deberiamos poder usarlo como una capa de contexto ampliado para agentes y servicios, logrando que consulten conocimiento relevante de forma rapida y util, sin depender de tener toda la informacion cargada manualmente en cada sesion.

Alcance de este documento

Este documento define el que y el para que del sistema RAG base.

En documentos posteriores de esta carpeta se podran detallar, por separado:

arquitectura propuesta
flujo de ingesta
estrategia de chunking
embeddings y almacenamiento
interfaz de consulta
pruebas con docs/
criterios de evaluacion de resultados

3.7 KiB Raw Blame History