Rúbricas de evaluación
Rúbricas de Evaluación
Las rúbricas hacen que la evaluación sea consistente: se califican los resultados según criterios definidos.
Las rúbricas empresariales también definen qué evidencia se requiere para tareas de alto riesgo.
Ver también
Métricas de Evaluación de LLM Human-in-the-Loop Puertas de CalidadPreguntas Frecuentes
¿Qué es una rúbrica de evaluación?
Un marco de puntuación que hace que la calidad del resultado sea medible y consistente.
¿Qué dimensiones deben incluir las rúbricas?
Corrección, claridad, seguridad, exhaustividad y utilidad de la tarea.
¿Cómo manejamos la puntuación subjetiva?
Defina ejemplos y anclas para cada puntuación; calibre a los revisores.
¿Cómo se convierten las rúbricas en puertas?
Defina umbrales de aprobación y aplíquelos durante el lanzamiento de cambios en prompts/modelos.
¿Cuál es la primera mejora?
Defina 3-5 dimensiones de rúbrica y califique un pequeño conjunto de pruebas de referencia.