Aller au contenu principal

Évaluation des Feedbacks

Vue d'ensemble​

L'évaluation des feedbacks vous permet de tester la façon dont votre assistant ou chatbot répond aux questions après avoir modifié sa configuration. Au lieu d'attendre de nouvelles interactions utilisateurs, elle rejoue les conversations passées où des utilisateurs ont laissé des feedbacks et régénère les réponses avec votre configuration actuelle (ou proposée). Un score de similarité est ensuite calculé pour mesurer dans quelle mesure les nouvelles réponses diffèrent des originales.

Cette fonctionnalité est disponible pour :

  • Les administrateurs d'organisation — pour Ă©valuer les rĂ©ponses du playground du chatbot après avoir modifiĂ© sa configuration.

Quand l'utiliser​

Utilisez l'évaluation des feedbacks chaque fois que vous apportez une modification à votre assistant ou chatbot et souhaitez comprendre son impact sur la qualité des réponses :

  • Vous avez mis Ă  jour le prompt système et voulez savoir si les rĂ©ponses se sont amĂ©liorĂ©es.
  • Vous avez changĂ© de modèle d'IA et souhaitez comparer les rĂ©sultats.
  • Vous avez ajustĂ© les paramètres de rĂ©cupĂ©ration et voulez vĂ©rifier que les rĂ©ponses restent cohĂ©rentes.
  • Vous voulez une mesure de rĂ©fĂ©rence de la fiabilitĂ© des rĂ©ponses de votre assistant aux questions rĂ©currentes.

Fonctionnement​

  1. Déclencher une évaluation — Dans l'assistant ou dans le panneau d'administration, dans l'onglet feedback, vous pouvez déclencher l'évaluation pour un seul feedback en cliquant sur

    ou pour tous les feedbacks en cliquant sur
    RECOMPUTE ALL ANSWERS
    .

  2. Les réponses sont régénérées — le système rejoue chaque conversation de votre historique de feedbacks, en posant à nouveau les mêmes questions à l'assistant ou au chatbot avec la configuration actuelle (ou fournie).

  3. La similarité est mesurée — pour chaque feedback évalué positivement, la réponse régénérée est comparée à l'originale. Un score de 0 à 1 est attribué :

    • 1.0 — la nouvelle rĂ©ponse est essentiellement identique Ă  l'originale.
    • 0.0 — la nouvelle rĂ©ponse est complètement diffĂ©rente.
    • Pour les feedbacks Ă©valuĂ©s nĂ©gativement, les rĂ©ponses sont rĂ©gĂ©nĂ©rĂ©es mais aucun score n'est calculĂ©, car l'originale Ă©tait dĂ©jĂ  marquĂ©e comme incorrecte.
  4. Les résultats arrivent en temps réel — les scores apparaissent au fur et à mesure que chaque feedback est traité. Vous n'avez pas à attendre que tous les feedbacks soient terminés.

Historique des évaluations​

Une fois qu'une nouvelle réponse est générée, vous pouvez la sélectionner comme meilleure réponse en cliquant sur le bouton

THIS ANSWER IS BETTER
pour l'enregistrer dans les feedbacks. Ceci est utile pour orienter les réponses de l'assistant ou du chatbot dans la direction souhaitée.

Explication du score de similarité​

ScoreSignification
0,9 – 1,0Les réponses sont presque identiques — l'assistant est très cohérent.
0,6 – 0,9Les réponses partagent la même intention mais peuvent différer dans la formulation ou les détails.
0,3 – 0,6Différences notables — mérite d'être examiné.
0,0 – 0,3Les réponses sont substantiellement différentes — le changement de configuration a un fort impact.
-1L'évaluation n'a pas pu être complétée pour cet élément (erreur).

Un score plus bas n'est pas toujours mauvais — si la réponse originale était médiocre, une réponse régénérée très différente peut en réalité être une amélioration. Combinez les scores de similarité avec les évaluations de feedback originales pour interpréter correctement les résultats.

Join Us

We value your feedback and are always here to assist you.
If you need additionnal help, feel free to join our Discord server. We look forward to hearing from you!

Discord Community Server