2.5 KiB
Logs de evaluacion del RAG
Proyecto: Workspace de tools IA para empresas
Modulo: RAG
Ultima actualizacion: 2026-04-06
Ultima modificacion por: Agente tools IA para potenciar servicios empresariales
Estado: Implementado en codigo, pendiente de redeploy
Donde se guardan
Los logs de evaluacion se guardan en Qdrant.
Coleccion usada:
rag_eval_logs
Se eligio Qdrant porque:
- ya forma parte de la infraestructura activa del RAG
- ofrece persistencia sin depender del filesystem efimero del contenedor
- permite busqueda semantica posterior sobre las consultas o incidencias registradas
Estructura del log
Cada log guarda, como minimo:
idtrigger:automaticomanualoperation:retrieve,answerochatreasonquerymodeintentmodelnotecreatedAtscopeusedBootstrapContextusedAdditionalRetrieveresponseSummaryretrievedItemsCountchunkIdsdocumentIds
Y ahora tambien campos de seguimiento:
reviewStatus:pending,in_progress,resolved,ignoredseverity:low,medium,highreviewedAtreviewedByresolutionNotefixReferencesupersedesLogId
Tipos de log
1. Automatico
Se genera cuando el sistema detecta que:
- el contexto recuperado es insuficiente
- la respuesta deja claro que no hay suficiente contexto
Objetivo:
- detectar huecos en ingesta, chunking, embeddings, retrieval o prompting
2. Manual
Se genera cuando el usuario lo pide explicitamente desde el playground o por API.
En este caso la nota siempre deja constancia de que fue:
Log solicitado por el usuario.
Y si el usuario añade una nota, se concatena a ese texto base.
Seguimiento del log
El sistema ya permite marcar cada log como:
- pendiente
- en progreso
- resuelto
- ignorado
Y asociarle:
- quien lo reviso
- nota de resolucion
- referencia al fix o commit
Esto permite saber:
- que logs ya se han considerado
- cuales siguen pendientes
- cuales quedaron resueltos por una mejora concreta
- cuales se decidio ignorar conscientemente
Endpoints relacionados
GET /logs/recentPOST /logs/manualPATCH /logs/:id
Uso previsto
Estos logs estan pensados para que el usuario, este agente u otros agentes puedan revisarlos juntos y decidir mejoras del RAG de forma mas fiable.
No sustituyen una evaluacion formal completa, pero si dan una base practica para:
- detectar limitaciones reales
- priorizar correcciones
- vincular mejoras con incidencias concretas