Stratégie de repli
Stratégie de repli
Les mécanismes de repli protègent les systèmes lorsque les LLM échouent ou se dégradent.
Modèles d'entreprise : délais d'attente, routage étagé, réponses mises en cache et modes de dégradation sécurisés.
Voir aussi
Routage de modèles Contrôles des coûts et de la latence Guide de restauration de l'IAFAQ
Qu'est-ce qu'un repli ?
Un chemin alternatif plus sûr lorsque le LLM échoue, se dégrade ou expire.
Quels sont les modes de repli courants ?
Modèle plus simple, réponses mises en cache, réponses basées sur des règles, ou refus/escalade à un humain.
Comment savoir si les replis fonctionnent ?
Mesurer le taux de repli, le taux de succès et l'impact sur les résultats et les coûts.
Quel est un mode de défaillance courant ?
Pas de repli → l'utilisateur voit des erreurs ou un comportement instable sous charge.
Quelle est la première amélioration ?
Ajouter des délais d'attente et un chemin de repli déterministe pour les flux critiques.