Rúbricas de evaluación

Rúbricas que hacen la evaluación de LLM consistente, auditable e mejorable.
Publicado:
Admin User
Updated:
published

Rúbricas de Evaluación

Las rúbricas hacen que la evaluación sea consistente: se califican los resultados según criterios definidos.

Las rúbricas empresariales también definen qué evidencia se requiere para tareas de alto riesgo.

Ver también

Métricas de Evaluación de LLM Human-in-the-Loop Puertas de Calidad

Preguntas Frecuentes

¿Qué es una rúbrica de evaluación?
Un marco de puntuación que hace que la calidad del resultado sea medible y consistente.

¿Qué dimensiones deben incluir las rúbricas?
Corrección, claridad, seguridad, exhaustividad y utilidad de la tarea.

¿Cómo manejamos la puntuación subjetiva?
Defina ejemplos y anclas para cada puntuación; calibre a los revisores.

¿Cómo se convierten las rúbricas en puertas?
Defina umbrales de aprobación y aplíquelos durante el lanzamiento de cambios en prompts/modelos.

¿Cuál es la primera mejora?
Defina 3-5 dimensiones de rúbrica y califique un pequeño conjunto de pruebas de referencia.