Rubriche di Valutazione
Rubriche di Valutazione
Le rubriche rendono la valutazione coerente: si valutano gli output rispetto a criteri definiti.
Le rubriche aziendali definiscono anche quali prove sono richieste per attività ad alto rischio.
Vedi anche
Metriche di Valutazione LLM Umano nel Ciclo Gates di QualitàFAQ
Cos'è una rubrica di valutazione?
Un framework di punteggio che rende la qualità dell'output misurabile e coerente.
Quali dimensioni dovrebbero includere le rubriche?
Correttezza, chiarezza, sicurezza, completezza e utilità del compito.
Come gestiamo il punteggio soggettivo?
Definire esempi e ancoraggi per ogni punteggio; calibrare i revisori.
Come le rubriche diventano gate?
Definire soglie di superamento e applicarle durante il rilascio di modifiche a prompt/modelli.
Qual è il primo miglioramento?
Definire 3-5 dimensioni della rubrica e valutare un piccolo set di test di riferimento.