{"id":4595,"date":"2021-03-22T16:52:35","date_gmt":"2021-03-22T15:52:35","guid":{"rendered":"https:\/\/pages2.isir.upmc.fr\/sdoncieux\/?page_id=4595"},"modified":"2021-03-30T17:09:10","modified_gmt":"2021-03-30T15:09:10","slug":"recherche","status":"publish","type":"page","link":"https:\/\/pages.isir.upmc.fr\/sdoncieux\/recherche\/","title":{"rendered":"Recherche"},"content":{"rendered":"\n<p>Je m&rsquo;int\u00e9resse \u00e0 des m\u00e9thodes d&rsquo;adaptation permettant \u00e0 des robots de faire face \u00e0 des situations qui n&rsquo;ont pas \u00e9t\u00e9 compl\u00e8tement anticip\u00e9es par leur concepteur. Des m\u00e9thodes de type apprentissage par renforcement ont pour but de d\u00e9couvrir comment r\u00e9soudre un probl\u00e8me d\u00e9crit sous la forme d&rsquo;une maximisation de la r\u00e9compense: ce qu&rsquo;il faut faire est indiqu\u00e9 (maximiser la r\u00e9compense), mais pas la fa\u00e7on de le faire. Les algorithmes d&rsquo;apprentissage doivent le d\u00e9couvrir en explorant les comportements possibles.<\/p>\n\n\n\n<p>Les actions possibles d&rsquo;un robot sont infinies de m\u00eame que les \u00e9tats dans lesquels il peut \u00eatre, il n&rsquo;est donc pas possible d&rsquo;explorer toutes les possibilit\u00e9s. De plus, beaucoup d&rsquo;interactions sont rares et donc difficiles \u00e0 d\u00e9couvrir par exploration. Saisir un objet avec un bras robotique, par exemple, n\u00e9cessite de bouger le bras pour toucher l&rsquo;objet d&rsquo;une fa\u00e7on particuli\u00e8re et de nombreux mouvements ne toucheront m\u00eame pas l&rsquo;objet. Le robot ne dispose \u00e9galement que de ses capteurs pour d\u00e9terminer l&rsquo;information lui permettant de d\u00e9cider quoi faire, mais ces perceptions peuvent \u00eatre bruit\u00e9es et incompl\u00e8tes (en cas d&rsquo;occlusions, par exemple). Elles sont de plus souvent de grande dimension, comme dans le cas d&rsquo;images. La robotique pose donc de nombreux d\u00e9fis aux m\u00e9thodes d&rsquo;apprentissage par renforcement.<\/p>\n\n\n\n<p>J&rsquo;aborde cette probl\u00e9matique avec une approche d\u00e9veloppementale et modulaire dans laquelle le robot est dot\u00e9 d&rsquo;algorithmes permettant de construire progressivement les comp\u00e9tences dont il a besoin pour r\u00e9soudre les t\u00e2ches auxquelles il est confront\u00e9 par apprentissage et planification.<\/p>\n\n\n\n<p><strong>Mots cl\u00e9s:<\/strong> robotique d\u00e9veloppementale, robotique \u00e9volutionniste, apprentissage par renforcement, apprentissage direct dans l&rsquo;espace des politiques, recherche de nouveaut\u00e9, algorithmes Qualit\u00e9-Diversit\u00e9.<\/p>\n\n\n\n<p>Pour plus de d\u00e9tails:<\/p>\n\n\n\n<ul class=\"wp-block-list\"><li><a href=\"https:\/\/pages2.isir.upmc.fr\/sdoncieux\/apprentissage-ouvert\/\" data-type=\"page\" data-id=\"4658\">Apprentissage ouvert<\/a><\/li><li><a href=\"https:\/\/pages2.isir.upmc.fr\/sdoncieux\/exploration-et-recompenses-rares\/\" data-type=\"page\" data-id=\"4662\">Exploration et r\u00e9compenses rares<\/a><\/li><li><a href=\"https:\/\/pages2.isir.upmc.fr\/sdoncieux\/acquisition-de-repertoires-dactions\/\" data-type=\"page\" data-id=\"4665\">Acquisition de r\u00e9pertoires d\u2019actions<\/a><\/li><li><a href=\"https:\/\/pages2.isir.upmc.fr\/sdoncieux\/de-la-simulation-a-la-realite\/\" data-type=\"page\" data-id=\"4667\">De la simulation \u00e0 la r\u00e9alit\u00e9<\/a><\/li><\/ul>\n\n\n\n<p><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Je m&rsquo;int\u00e9resse \u00e0 des m\u00e9thodes d&rsquo;adaptation permettant \u00e0 des robots de faire face \u00e0 des situations qui n&rsquo;ont pas \u00e9t\u00e9 compl\u00e8tement anticip\u00e9es par leur concepteur. Des m\u00e9thodes de type apprentissage par renforcement ont pour but de d\u00e9couvrir comment r\u00e9soudre un probl\u00e8me d\u00e9crit sous la forme d&rsquo;une maximisation de la r\u00e9compense: ce qu&rsquo;il faut faire est [&hellip;]<\/p>\n","protected":false},"author":9,"featured_media":4610,"parent":0,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"footnotes":""},"class_list":["post-4595","page","type-page","status-publish","has-post-thumbnail","hentry"],"_links":{"self":[{"href":"https:\/\/pages.isir.upmc.fr\/sdoncieux\/wp-json\/wp\/v2\/pages\/4595","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/pages.isir.upmc.fr\/sdoncieux\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/pages.isir.upmc.fr\/sdoncieux\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/pages.isir.upmc.fr\/sdoncieux\/wp-json\/wp\/v2\/users\/9"}],"replies":[{"embeddable":true,"href":"https:\/\/pages.isir.upmc.fr\/sdoncieux\/wp-json\/wp\/v2\/comments?post=4595"}],"version-history":[{"count":15,"href":"https:\/\/pages.isir.upmc.fr\/sdoncieux\/wp-json\/wp\/v2\/pages\/4595\/revisions"}],"predecessor-version":[{"id":4711,"href":"https:\/\/pages.isir.upmc.fr\/sdoncieux\/wp-json\/wp\/v2\/pages\/4595\/revisions\/4711"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/pages.isir.upmc.fr\/sdoncieux\/wp-json\/wp\/v2\/media\/4610"}],"wp:attachment":[{"href":"https:\/\/pages.isir.upmc.fr\/sdoncieux\/wp-json\/wp\/v2\/media?parent=4595"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}