Chargement en cours

Entraîner des agents web à l’échelle d’Internet : une approche révolutionnaire

L’entraînement d’agents capables de naviguer sur le web représente un défi majeur dans le domaine de l’intelligence artificielle. Traditionnellement, cette formation reposait sur des démonstrations humaines fastidieuses et limitées à quelques sites populaires. Cependant, une nouvelle approche, détaillée dans l’article InSTA (Towards Internet-Scale Training For Agents), propose une solution révolutionnaire pour surmonter ces limitations.

L’innovation InSTA : Au-delà des données humaines

InSTA utilise une approche novatrice basée sur les modèles linguistiques de grande taille (LLM) pour automatiser le processus d’entraînement. L’idée principale est de lever la dépendance à la coûteuse annotation humaine, en confiant la tâche aux LLM eux-mêmes.

  • ✓ **Annotation automatique:** Un LLM a été utilisé pour annoter 150 000 sites web avec des tâches spécifiques pour les agents.
  • ✓ **Exécution et génération de trajectoires:** D’autres LLM, agissant comme agents, ont ensuite exécuté ces tâches et généré des trajectoires de navigation.
  • ✓ **Filtrage intelligent:** Enfin, un troisième LLM a filtré ces trajectoires, en évaluant leur succès avec une précision remarquable (82.6%).

Cette approche a permis de créer un pipeline d’entraînement entièrement automatisé, ouvrant la voie à l’entraînement d’agents à une échelle sans précédent.

Résultats impressionnants et perspectives

Les résultats obtenus sont tout simplement remarquables. Les agents entraînés avec cette méthode, basés sur le modèle Qwen 3 1.7B, se montrent très compétitifs, surpassant même des modèles bien plus grands. L’agent le plus performant atteint un taux de réussite de 56.9%, dépassant Llama 4 Maverick (235 fois plus grand) et atteignant 94.7% des performances de Gemini 2.5 Flash.

L’aspect le plus significatif réside dans la capacité des LLM à gérer la curation de données, identifiant les contenus nuisibles avec une précision de 97%. Cette précision est essentielle pour garantir la sécurité et la fiabilité des agents entraînés.

Points clés à retenir

  • ✓ InSTA permet un entraînement d’agents web à grande échelle sans annotation humaine extensive.
  • ✓ Les LLM jouent un rôle crucial dans l’annotation, l’exécution des tâches et le filtrage des trajectoires.
  • ✓ Les agents entraînés avec InSTA sont compétitifs avec des modèles beaucoup plus grands.
  • ✓ L’approche assure une meilleure sécurité et fiabilité grâce au filtrage efficace des contenus nuisibles.

Le code, les modèles et les données sont disponibles publiquement à l’adresse suivante : https://data-for-agents.github.io. Cette initiative ouvre des perspectives extrêmement intéressantes pour le développement futur d’agents web plus performants et plus robustes.

Share this content:

Laisser un commentaire