Aller au contenu principal

Tester et evaluer

En bref

Testez votre agent avec des questions reelles avant de le mettre a disposition.

Avant de commencer

Etapes

1. Ouvrir le panneau de test

Depuis l'editeur de l'agent, utilisez le panneau de test (a droite de l'ecran). Saisissez une question representative de votre cas d'usage.

Exemples de questions de test :

  • "Quels sont nos principaux fournisseurs ?"
  • "Cree une entite Produit avec le nom Capteur X200."
  • "Combien de commandes sont en cours ?"

2. Lancer le test

Cliquez sur Envoyer pour lancer le test. L'agent traite la question en utilisant les outils et le contexte que vous avez configures.

Test succes

3. Evaluer la reponse

Verifiez la qualite de la reponse sur plusieurs criteres :

  • Pertinence : la reponse correspond-elle a la question posee ?
  • Outils utilises : l'agent a-t-il mobilise les bons outils (recherche ontologie, documents, etc.) ?
  • Ton et format : la reponse respecte-t-elle les instructions systeme ?
  • Exactitude : les donnees citees sont-elles correctes ?

4. Diagnostiquer les erreurs

En cas d'erreur ou de reponse insatisfaisante, identifiez la cause a l'aide du detail d'execution.

Test erreur

SymptomeCause probableSolution
Reponse vide ou hors sujetContexte ontologie trop restreintElargir le perimetre d'entites accessibles
L'agent n'utilise pas l'outil attenduOutil non activeVerifier la configuration des outils
Erreur d'executionProbleme de connexion ou de permissionsVerifier le workspace et les cles API
Reponse trop longue ou trop vagueInstructions systeme insuffisantesPreciser le format et les limites dans le prompt

5. Ajuster et re-tester

Corrigez la configuration (outils, contexte, instructions systeme) en fonction des resultats, puis relancez le test. Repetez jusqu'a obtenir des reponses satisfaisantes.

Astuce
Testez au moins 3 scenarios differents avant de considerer l'agent comme pret : une question simple, une question complexe et une question hors perimetre (pour verifier que l'agent repond correctement qu'il ne peut pas aider).

Resultat attendu

Ce que vous obtenez
Votre agent est teste et valide sur des scenarios representatifs. Vous avez confiance dans la qualite de ses reponses et il est pret a etre utilise en conditions reelles.

Limites et erreurs frequentes

  • Le temps de reponse depend de la complexite de la question et du nombre d'outils actives. Un agent avec peu d'outils repond plus vite.
  • Si l'agent retourne systematiquement des erreurs, verifiez que votre workspace contient des donnees (entites, documents) dans le perimetre configure.
  • Les modifications de configuration sont prises en compte immediatement pour le test suivant, sans besoin de recharger la page.

Prochaines etapes

Besoin d'aide ?

Ecrivez-nous : Support et contact.