OpenCode 7600f36f48 Add functional RAG service with code mode

2026-04-05 17:49:35 +02:00

8.2 KiB

Raw Blame History

Salida

Proyecto: Workspace de tools IA para empresas
Modulo: RAG
Ultima actualizacion: 2026-04-02
Ultima modificacion por: Agente tools IA para potenciar servicios empresariales
Estado: En definicion

Proposito

Definir como sale el conocimiento del sistema RAG hacia los consumidores, especialmente en forma de contexto util para agentes, aplicaciones y soluciones con IA.

Vision general

La salida del RAG no se limita a responder preguntas.

El sistema debe poder:

recuperar contexto util
ofrecer un mapa inicial de conocimiento
devolver respuesta apoyada en contexto cuando haga falta

Esto responde a los dos grandes casos de uso aceptados:

agentes expertos en empresa
agentes expertos en proyecto o desarrollo

Tipos de salida contemplados

Se consideran validos estos tipos de salida conceptuales:

retrieve

devuelve contexto recuperado

answer

devuelve una respuesta apoyada en contexto

context_plus_summary

devuelve contexto mas una sintesis util

En la practica, retrieve es la pieza clave para la v1, porque es la base que permite contextualizar agentes y otras herramientas.

Modo `answer`

answer se apoya en retrieve.

Flujo aplicado:

recuperar contexto relevante
construir un prompt con resumen y citas del contexto recuperado
pedir a un modelo de respuesta que conteste usando solo ese contexto
devolver la respuesta junto con citas y trazabilidad minima

Estructura esperada

mode
intent
answer
summary
topics
criticalPoints
citations
scope

Por que se diseña asi

mantiene a retrieve como nucleo del sistema
evita que la respuesta se desconecte del contexto recuperado
permite que el mismo RAG sirva tanto para cargar contexto como para responder directamente
conserva trazabilidad para revisar de donde sale la respuesta

Limite importante

La calidad de answer depende directamente de la calidad de retrieve.

Si la recuperacion no trae el fragmento concreto adecuado, la respuesta puede quedar demasiado prudente o incompleta aunque el modo answer funcione correctamente.

En modo codigo, answer incluye tambien sectionTitle y rango de lineas cuando estan disponibles.

Mejora aplicada a `retrieve specific`

Para consultas operativas frecuentes, retrieve specific ya no se limita a una sola busqueda semantica directa.

Se ha mejorado con:

subconsultas internas segun la intencion detectada
reordenacion por alineacion con la pregunta
refuerzo de documentos especialmente relevantes para ciertos casos, como backlog, reglas, historial o indice documental

Objetivo de esta mejora:

que preguntas practicas como "que tenemos pendiente" o "cuales son las reglas" lleguen antes a los fragmentos verdaderamente utiles
mejorar answer sin tener que cambiar su arquitectura

Tambien se ha ampliado para consultas tecnicas o conceptuales del modo codigo, por ejemplo preguntas sobre funciones, IDs, servicios, endpoints o flujo interno.

Retrieve inicial y retrieve especifico

Se adopta esta separacion conceptual:

retrieve inicial o de arranque

entrega un mapa general del dominio
orienta al agente sobre el panorama del conocimiento disponible
no busca profundizar en exceso

retrieve especifico

profundiza en un tema, duda o necesidad concreta
recupera contenido mas cercano a la consulta puntual

Estructura acordada para `retrieve` inicial

Se adopta esta estructura base para el retrieve inicial.

1. `mode`

Indica el modo de recuperacion aplicado.

Valores previstos:

documental
codigo
auto

Por que se incluye:

permite trazabilidad de como se hizo la recuperacion
ayuda al consumidor a entender el tipo de lectura aplicada

2. `intent`

Indica la intencion de la recuperacion.

Valores previstos:

bootstrap
specific

Para el retrieve inicial, el valor esperado es bootstrap.

Por que se incluye:

separa claramente el mapa inicial de una consulta puntual
evita confundir una carga de contexto general con una busqueda de detalle

3. `summary`

Resumen corto del contexto recuperado.

Por que se incluye:

da una lectura rapida del panorama general
permite al agente orientarse sin tener que leer todos los fragmentos completos de inmediato

4. `topics`

Lista de temas principales detectados.

Por que se incluye:

ayuda a que el agente tenga un mapa tematico del dominio
sirve como guia para decidir en que profundizar despues

5. `critical_points`

Lista de puntos criticos o prioritarios.

Estos puntos pueden salir de dos vias:

inferidos por el sistema
marcados explicitamente como criticos en las fuentes o durante la ingesta

Por que se incluye:

algunos temas deben mantenerse visibles aunque el resumen general sea breve
permite priorizar conocimiento especialmente sensible o importante

6. `items`

Lista de fragmentos o piezas recuperadas.

Cada item debe poder incluir como minimo:

chunk_id
document_id
source_id
title
content
score

Por que se incluye:

es la parte trazable y reutilizable del contexto
permite que un agente o sistema no dependa solo de una sintesis
mantiene acceso a las piezas concretas del conocimiento recuperado

7. `follow_up_refs`

Referencias o pistas para profundizar despues.

Pueden apuntar a:

temas
documentos
secciones
preguntas sugeridas

Por que se incluye:

convierte el retrieve inicial en una guia de navegacion
facilita pasar de un mapa general a una consulta especifica sin perder el hilo

8. `scope`

Permite acotar la recuperacion a una fuente, workspace, proyecto o conjunto de tags concreto.

Campos previstos:

sourceId
sourceRef
tags

Por que se incluye:

evita que el bootstrap o la consulta especifica carguen contexto de todo el sistema cuando solo interesa un workspace o proyecto
prepara el RAG para convivir con multiples fuentes sin mezclar panoramas
hace util el retrieve inicial como carga contextual enfocada, no solo global

Que representa realmente este `retrieve` inicial

No es una respuesta final.

Es un paquete de contexto de arranque pensado para:

dar orientacion general
volver experto al agente en ese dominio durante la sesion de trabajo
servir como base para posteriores consultas especificas

Su papel es parecido al de una carga inicial de contexto o mapa operativo del conocimiento.

Estrategia aplicada al `retrieve` inicial

El bootstrap no debe limitarse a ejecutar una sola busqueda semantica amplia.

Se adopta una estrategia de recuperacion orientada a mapa inicial:

lanzar varias subconsultas relacionadas con panorama general, documentacion principal, pendientes y reglas del dominio
fusionar resultados sin duplicar chunks
ordenar los fragmentos priorizando relevancia y utilidad panoramica
sintetizar un resumen final que ayude a orientarse rapido

Por que se decide asi:

un retrieve inicial necesita mas cobertura que una consulta puntual
una sola consulta suele dejar fuera piezas clave del mapa general
combinar subconsultas mejora la calidad del contexto de arranque sin cambiar el modelo de embeddings ni la base vectorial

Resultado esperado:

mejor identificacion de documentos base
mejor panorama del workspace o proyecto
referencias mas utiles para profundizar despues

Por que se ha elegido esta estructura

porque el RAG debe servir para mucho mas que preguntas aisladas
porque el usuario quiere que un agente pueda arrancar con una vision rica del tema o proyecto
porque un mapa inicial ayuda a profundizar despues sin saturar contexto desde el principio
porque mezcla panorama, criticidad, trazabilidad y capacidad de profundizacion posterior

Ajustes futuros posibles

Aunque esta estructura queda aceptada para la v1, se asume que en la practica podria requerir ajustes.

Posibles cambios futuros:

afinar el nivel de detalle de summary
separar mejor topics y critical_points
enriquecer items con mas metadatos
hacer que follow_up_refs sea mas estructurado
incorporar niveles de confianza o explicacion de relevancia

La estructura actual se acepta como una base suficientemente clara para empezar a construir y evaluar.

8.2 KiB Raw Blame History

Salida

Proposito

Vision general

Tipos de salida contemplados

Modo answer

Estructura esperada

Por que se diseña asi

Limite importante

Mejora aplicada a retrieve specific

Retrieve inicial y retrieve especifico

Estructura acordada para retrieve inicial

1. mode

2. intent

3. summary

4. topics

5. critical_points

6. items

7. follow_up_refs

8. scope

Que representa realmente este retrieve inicial

Estrategia aplicada al retrieve inicial

Por que se ha elegido esta estructura

Ajustes futuros posibles

8.2 KiB

Raw Blame History

Modo `answer`

Mejora aplicada a `retrieve specific`

Estructura acordada para `retrieve` inicial

1. `mode`

2. `intent`

3. `summary`

4. `topics`

5. `critical_points`

6. `items`

7. `follow_up_refs`

8. `scope`

Que representa realmente este `retrieve` inicial

Estrategia aplicada al `retrieve` inicial