rag-service/RAG/docs/SALIDA.md
2026-04-05 17:49:35 +02:00

8.2 KiB

Salida

Proyecto: Workspace de tools IA para empresas
Modulo: RAG
Ultima actualizacion: 2026-04-02
Ultima modificacion por: Agente tools IA para potenciar servicios empresariales
Estado: En definicion


Proposito

Definir como sale el conocimiento del sistema RAG hacia los consumidores, especialmente en forma de contexto util para agentes, aplicaciones y soluciones con IA.


Vision general

La salida del RAG no se limita a responder preguntas.

El sistema debe poder:

  • recuperar contexto util
  • ofrecer un mapa inicial de conocimiento
  • devolver respuesta apoyada en contexto cuando haga falta

Esto responde a los dos grandes casos de uso aceptados:

  • agentes expertos en empresa
  • agentes expertos en proyecto o desarrollo

Tipos de salida contemplados

Se consideran validos estos tipos de salida conceptuales:

  1. retrieve
  • devuelve contexto recuperado
  1. answer
  • devuelve una respuesta apoyada en contexto
  1. context_plus_summary
  • devuelve contexto mas una sintesis util

En la practica, retrieve es la pieza clave para la v1, porque es la base que permite contextualizar agentes y otras herramientas.


Modo answer

answer se apoya en retrieve.

Flujo aplicado:

  1. recuperar contexto relevante
  2. construir un prompt con resumen y citas del contexto recuperado
  3. pedir a un modelo de respuesta que conteste usando solo ese contexto
  4. devolver la respuesta junto con citas y trazabilidad minima

Estructura esperada

  • mode
  • intent
  • answer
  • summary
  • topics
  • criticalPoints
  • citations
  • scope

Por que se diseña asi

  • mantiene a retrieve como nucleo del sistema
  • evita que la respuesta se desconecte del contexto recuperado
  • permite que el mismo RAG sirva tanto para cargar contexto como para responder directamente
  • conserva trazabilidad para revisar de donde sale la respuesta

Limite importante

La calidad de answer depende directamente de la calidad de retrieve.

Si la recuperacion no trae el fragmento concreto adecuado, la respuesta puede quedar demasiado prudente o incompleta aunque el modo answer funcione correctamente.

En modo codigo, answer incluye tambien sectionTitle y rango de lineas cuando estan disponibles.


Mejora aplicada a retrieve specific

Para consultas operativas frecuentes, retrieve specific ya no se limita a una sola busqueda semantica directa.

Se ha mejorado con:

  • subconsultas internas segun la intencion detectada
  • reordenacion por alineacion con la pregunta
  • refuerzo de documentos especialmente relevantes para ciertos casos, como backlog, reglas, historial o indice documental

Objetivo de esta mejora:

  • que preguntas practicas como "que tenemos pendiente" o "cuales son las reglas" lleguen antes a los fragmentos verdaderamente utiles
  • mejorar answer sin tener que cambiar su arquitectura

Tambien se ha ampliado para consultas tecnicas o conceptuales del modo codigo, por ejemplo preguntas sobre funciones, IDs, servicios, endpoints o flujo interno.


Retrieve inicial y retrieve especifico

Se adopta esta separacion conceptual:

  1. retrieve inicial o de arranque
  • entrega un mapa general del dominio
  • orienta al agente sobre el panorama del conocimiento disponible
  • no busca profundizar en exceso
  1. retrieve especifico
  • profundiza en un tema, duda o necesidad concreta
  • recupera contenido mas cercano a la consulta puntual

Estructura acordada para retrieve inicial

Se adopta esta estructura base para el retrieve inicial.

1. mode

Indica el modo de recuperacion aplicado.

Valores previstos:

  • documental
  • codigo
  • auto

Por que se incluye:

  • permite trazabilidad de como se hizo la recuperacion
  • ayuda al consumidor a entender el tipo de lectura aplicada

2. intent

Indica la intencion de la recuperacion.

Valores previstos:

  • bootstrap
  • specific

Para el retrieve inicial, el valor esperado es bootstrap.

Por que se incluye:

  • separa claramente el mapa inicial de una consulta puntual
  • evita confundir una carga de contexto general con una busqueda de detalle

3. summary

Resumen corto del contexto recuperado.

Por que se incluye:

  • da una lectura rapida del panorama general
  • permite al agente orientarse sin tener que leer todos los fragmentos completos de inmediato

4. topics

Lista de temas principales detectados.

Por que se incluye:

  • ayuda a que el agente tenga un mapa tematico del dominio
  • sirve como guia para decidir en que profundizar despues

5. critical_points

Lista de puntos criticos o prioritarios.

Estos puntos pueden salir de dos vias:

  • inferidos por el sistema
  • marcados explicitamente como criticos en las fuentes o durante la ingesta

Por que se incluye:

  • algunos temas deben mantenerse visibles aunque el resumen general sea breve
  • permite priorizar conocimiento especialmente sensible o importante

6. items

Lista de fragmentos o piezas recuperadas.

Cada item debe poder incluir como minimo:

  • chunk_id
  • document_id
  • source_id
  • title
  • content
  • score

Por que se incluye:

  • es la parte trazable y reutilizable del contexto
  • permite que un agente o sistema no dependa solo de una sintesis
  • mantiene acceso a las piezas concretas del conocimiento recuperado

7. follow_up_refs

Referencias o pistas para profundizar despues.

Pueden apuntar a:

  • temas
  • documentos
  • secciones
  • preguntas sugeridas

Por que se incluye:

  • convierte el retrieve inicial en una guia de navegacion
  • facilita pasar de un mapa general a una consulta especifica sin perder el hilo

8. scope

Permite acotar la recuperacion a una fuente, workspace, proyecto o conjunto de tags concreto.

Campos previstos:

  • sourceId
  • sourceRef
  • tags

Por que se incluye:

  • evita que el bootstrap o la consulta especifica carguen contexto de todo el sistema cuando solo interesa un workspace o proyecto
  • prepara el RAG para convivir con multiples fuentes sin mezclar panoramas
  • hace util el retrieve inicial como carga contextual enfocada, no solo global

Que representa realmente este retrieve inicial

No es una respuesta final.

Es un paquete de contexto de arranque pensado para:

  • dar orientacion general
  • volver experto al agente en ese dominio durante la sesion de trabajo
  • servir como base para posteriores consultas especificas

Su papel es parecido al de una carga inicial de contexto o mapa operativo del conocimiento.


Estrategia aplicada al retrieve inicial

El bootstrap no debe limitarse a ejecutar una sola busqueda semantica amplia.

Se adopta una estrategia de recuperacion orientada a mapa inicial:

  • lanzar varias subconsultas relacionadas con panorama general, documentacion principal, pendientes y reglas del dominio
  • fusionar resultados sin duplicar chunks
  • ordenar los fragmentos priorizando relevancia y utilidad panoramica
  • sintetizar un resumen final que ayude a orientarse rapido

Por que se decide asi:

  • un retrieve inicial necesita mas cobertura que una consulta puntual
  • una sola consulta suele dejar fuera piezas clave del mapa general
  • combinar subconsultas mejora la calidad del contexto de arranque sin cambiar el modelo de embeddings ni la base vectorial

Resultado esperado:

  • mejor identificacion de documentos base
  • mejor panorama del workspace o proyecto
  • referencias mas utiles para profundizar despues

Por que se ha elegido esta estructura

  • porque el RAG debe servir para mucho mas que preguntas aisladas
  • porque el usuario quiere que un agente pueda arrancar con una vision rica del tema o proyecto
  • porque un mapa inicial ayuda a profundizar despues sin saturar contexto desde el principio
  • porque mezcla panorama, criticidad, trazabilidad y capacidad de profundizacion posterior

Ajustes futuros posibles

Aunque esta estructura queda aceptada para la v1, se asume que en la practica podria requerir ajustes.

Posibles cambios futuros:

  • afinar el nivel de detalle de summary
  • separar mejor topics y critical_points
  • enriquecer items con mas metadatos
  • hacer que follow_up_refs sea mas estructurado
  • incorporar niveles de confianza o explicacion de relevancia

La estructura actual se acepta como una base suficientemente clara para empezar a construir y evaluar.