Des robots capables de faire face à des environnements ouverts - Interstices

Des robots capables de faire face à des environnements ouverts - Interstices

Le domaine de l’apprentissage machine a connu de nombreuses évolutions ces dernières années, permettant le développement de nouveaux algorithmes « censés » gérer une telle variabilité, tant dans la définition de la tâche que dans le contexte de son exécution. Par exemple, la branche de l’apprentissage appelée « apprentissage par renforcement », permet de découvrir un comportement approprié à partir du moment où la tâche est décrite par une récompense : un algorithme d’apprentissage par renforcement explore les comportements possibles pour maximiser cette récompense et donc résoudre la tâche posée. Ces algorithmes nécessitent cependant de définir des éléments de base sur lesquels ils vont s’appuyer, éléments que l’on peut regrouper sous la forme d’un processus de décision Markovien.

Aucun commentaire: