Améliorer la généralisation en apprentissage par renforcement grâce aux ensembles de politiques distillées
L'apprentissage par renforcement (RL) vise à entraîner des agents capables de s'adapter à des environnements inconnus. Une approche prometteuse est le transfert de politique à zéro coup, où l'agent est…