Rubriche di Valutazione

Rubriche che rendono la valutazione degli LLM coerente, verificabile e migliorabile.
Pubblicato:
Admin User
Updated:
published

Rubriche di Valutazione

Le rubriche rendono la valutazione coerente: si valutano gli output rispetto a criteri definiti.

Le rubriche aziendali definiscono anche quali prove sono richieste per attività ad alto rischio.

Vedi anche

Metriche di Valutazione LLM Umano nel Ciclo Gates di Qualità

FAQ

Cos'è una rubrica di valutazione?
Un framework di punteggio che rende la qualità dell'output misurabile e coerente.

Quali dimensioni dovrebbero includere le rubriche?
Correttezza, chiarezza, sicurezza, completezza e utilità del compito.

Come gestiamo il punteggio soggettivo?
Definire esempi e ancoraggi per ogni punteggio; calibrare i revisori.

Come le rubriche diventano gate?
Definire soglie di superamento e applicarle durante il rilascio di modifiche a prompt/modelli.

Qual è il primo miglioramento?
Definire 3-5 dimensioni della rubrica e valutare un piccolo set di test di riferimento.