Academic literature on the topic 'Apprentissage par reinforcement'

Create a spot-on reference in APA, MLA, Chicago, Harvard, and other styles

Select a source type:

Consult the lists of relevant articles, books, theses, conference reports, and other scholarly sources on the topic 'Apprentissage par reinforcement.'

Next to every source in the list of references, there is an 'Add to bibliography' button. Press on it, and we will generate automatically the bibliographic reference to the chosen work in the citation style you need: APA, MLA, Harvard, Chicago, Vancouver, etc.

You can also download the full text of the academic publication as pdf and read online its abstract whenever available in the metadata.

Journal articles on the topic "Apprentissage par reinforcement"

1

Diumi Omokoko, Delvin. "Apprentissage par renforcement multi-agents pour la régulation de la circulation routière dans les carrefours : application à la mobilité urbaine dans la ville de Kinshasa." Journal Africain des Sciences 1, no. 2 (2024): 36–47. https://doi.org/10.70237/jafrisci.2024.v1.i2.05.

Full text
Abstract:
Urban mobility in the city of Kinshasa is becoming a serious problem given the congestion of the roads by vehicles and pedestrians, leaving its users with various concerns. How can road traffic be regulated in such a way as to make automobile traffic smooth and safe? Several techniques or methods have been developed to solve this problem, such as light signals, variable message signs, presence of traffic police, etc. In this article we plan to propose the technique of light lights integrated into intelligent transport systems. This regulation technique works in a multi-agent environment, the m
APA, Harvard, Vancouver, ISO, and other styles
2

Noulawe Tchamanbe, Landry Steve, and Paulin MELATAGIA YONTA. "Algorithms to get out of Boring Area Trap in Reinforcement Learning." Revue Africaine de la Recherche en Informatique et Mathématiques Appliquées Volume 34 - 2020 - Special... (July 2, 2021). http://dx.doi.org/10.46298/arima.6748.

Full text
Abstract:
International audience Reinforcement learning algorithms have succeeded over the years in achieving impressive results in a variety of fields. However, these algorithms suffer from certain weaknesses highlighted by Refael Vivanti and al. that may explain the regression of even well-trained agents in certain environments : the difference in variance on rewards between areas of the environment. This difference in variance leads to two problems : Boring Area Trap and Manipulative consultant. We note that the Adaptive Symmetric Reward Noising (ASRN) algorithm proposed by Refael Vivanti and al. has
APA, Harvard, Vancouver, ISO, and other styles
3

Abraich, Ayoub. "Apprentissage par renforcement profond pour la réponse visuelle aux questions (Deep Reinforcement Learning for Visual Question Answering)." SSRN Electronic Journal, 2019. http://dx.doi.org/10.2139/ssrn.3530241.

Full text
APA, Harvard, Vancouver, ISO, and other styles
4

LACHEGUER, Abdennacer, and Mohcine BAKHAT. "Le Rôle De La Formation Entrepreneuriale Dans Le Développement Des Capacités D'anticipation Chez Les Jeunes." International Journal Of Applied Management And Economics Vol 02, N°14 (2025). https://doi.org/10.5281/zenodo.15520812.

Full text
Abstract:
<strong>R&eacute;sum&eacute; : </strong> L&rsquo;anticipation est devenue une comp&eacute;tence incontournable pour les jeunes entrepreneurs &eacute;voluant dans des environnements incertains et dynamiques. Cette communication examine le r&ocirc;le central de la formation entrepreneuriale dans le d&eacute;veloppement des capacit&eacute;s d&rsquo;anticipation, en s&rsquo;appuyant sur une revue de litt&eacute;rature syst&eacute;matique. Les r&eacute;sultats mettent en lumi&egrave;re que les approches p&eacute;dagogiques bas&eacute;es sur l&rsquo;apprentissage exp&eacute;rientiel, telles que les
APA, Harvard, Vancouver, ISO, and other styles
5

Sabahi, Kamran, Mohsin Jamil, Yaser Shokri-Kalandaragh, Mehdi Tavan, and Yogendra Arya. "Deep Deterministic Policy Gradient Reinforcement Learning Based Adaptive PID Load Frequency Control of an AC Micro-Grid Apprentissage par renforcement du gradient de la politique déterministe profonde basé sur le contrôle adaptatif de la fréquence de charge PID d’un micro-réseau de courant alternatif." IEEE Canadian Journal of Electrical and Computer Engineering, 2024, 1–7. http://dx.doi.org/10.1109/icjece.2024.3353670.

Full text
APA, Harvard, Vancouver, ISO, and other styles

Dissertations / Theses on the topic "Apprentissage par reinforcement"

1

Carrara, Nicolas. "Reinforcement learning for dialogue systems optimization with user adaptation." Thesis, Lille 1, 2019. http://www.theses.fr/2019LIL1I071/document.

Full text
Abstract:
Les systèmes d’intelligence artificielle les plus puissants utilisent désormais des modèles statistiques. Afin de construire des modèles efficaces, ces systèmes doivent collecter une quantité substantielle de données issues de l’environnement. Les assistants personnels, maisons connectées, serveurs vocaux et autres systèmes de dialogue ne font pas exception. Ces systèmes ont pour vocation d’interagir avec des humains, et pour cela, leurs données d’apprentissage se doivent d’être collectées avec ces mêmes humains. Parce que le nombre d’interactions avec une seule personne est assez faible, l’ap
APA, Harvard, Vancouver, ISO, and other styles
2

Akrour, Riad. "Robust Preference Learning-based Reinforcement Learning." Thesis, Paris 11, 2014. http://www.theses.fr/2014PA112236/document.

Full text
Abstract:
Les contributions de la thèse sont centrées sur la prise de décisions séquentielles et plus spécialement sur l'Apprentissage par Renforcement (AR). Prenant sa source de l'apprentissage statistique au même titre que l'apprentissage supervisé et non-supervisé, l'AR a gagné en popularité ces deux dernières décennies en raisons de percées aussi bien applicatives que théoriques. L'AR suppose que l'agent (apprenant) ainsi que son environnement suivent un processus de décision stochastique Markovien sur un espace d'états et d'actions. Le processus est dit de décision parce que l'agent est appelé à ch
APA, Harvard, Vancouver, ISO, and other styles
3

Fournier, Pierre. "Intrinsically Motivated and Interactive Reinforcement Learning : a Developmental Approach." Electronic Thesis or Diss., Sorbonne université, 2019. http://www.theses.fr/2019SORUS634.

Full text
Abstract:
L'apprentissage par renforcement est aujourd'hui plus populaire que jamais, mais plusieurs compétences simples lui restent hors de portée: manipulation d'objets, contrôle sensorimoteur, interaction naturelle avec d'autres agents. Une approche possible pour aborder ces défis consiste à s'inspirer du développement humain, voire de tenter de le reproduire. Dans cette thèse, nous étudions l'intersection de deux sujets cruciaux en sciences du développement, et leur application à l'apprentissage par renforcement dans le but d'aborder ces défis: l'apprentissage social et la motivation intrinsèque. L'
APA, Harvard, Vancouver, ISO, and other styles
4

Garcelon, Evrard. "Constrained Exploration in Reinforcement Learning." Electronic Thesis or Diss., Institut polytechnique de Paris, 2022. http://www.theses.fr/2022IPPAG007.

Full text
Abstract:
Une application majeure de l'apprentissage machine automatisée est la personnalisation des différents contenus recommandé à différents utilisateurs. Généralement, les algorithmes étant à la base de ces systèmes sont dit supervisé. C'est-à-dire que les données utilisées lors de la phase d'apprentissage sont supposées provenir de la même distribution. Cependant, ces données sont générées par des interactions entre un utilisateur et ces mêmes algorithmes. Ainsi, les recommandations pour un utilisateur à un instant t peuvent modifier l'ensemble des recommandations pertinentes à un instant ultérieu
APA, Harvard, Vancouver, ISO, and other styles
5

Blier, Léonard. "Some Principled Methods for Deep Reinforcement Learning." Electronic Thesis or Diss., université Paris-Saclay, 2022. http://www.theses.fr/2022UPASG040.

Full text
Abstract:
Cette thèse développe et étudie certaines méthodes de principe pour l'apprentissage profond (DL) et l'apprentissage par renforcement (RL).Dans la partie II, nous étudions le DL selon le point de vue du “Minimum Description Length” principe, qui formalise le rasoir d'Occam, et postule qu'un bon modèle prédictif est un modèle capable de compresser sans perte les données (en prenant en compte le coût de la description du modèle lui-même). Les modèles de DL, par le nombre de paramètres à encoder, semblent aller à l'encontre de ce principe. Nous démontrons expérimentalement la capacité de compressi
APA, Harvard, Vancouver, ISO, and other styles
6

Chatzilygeroudis, Konstantinos. "Micro-Data Reinforcement Learning for Adaptive Robots." Thesis, Université de Lorraine, 2018. http://www.theses.fr/2018LORR0276/document.

Full text
Abstract:
Les robots opèrent dans le monde réel, dans lequel essayer quelque chose prend beaucoup de temps. Pourtant, les methodes d’apprentissage par renforcement actuels (par exemple, deep reinforcement learning) nécessitent de longues périodes d’interaction pour trouver des politiques efficaces. Dans cette thèse, nous avons exploré des algorithmes qui abordent le défi de l’apprentissage par essai-erreur en quelques minutes sur des robots physiques. Nous appelons ce défi “Apprentissage par renforcement micro-data”. Dans la première contribution, nous avons proposé un nouvel algorithme d’appr
APA, Harvard, Vancouver, ISO, and other styles
7

Chatzilygeroudis, Konstantinos. "Micro-Data Reinforcement Learning for Adaptive Robots." Electronic Thesis or Diss., Université de Lorraine, 2018. http://www.theses.fr/2018LORR0276.

Full text
Abstract:
Les robots opèrent dans le monde réel, dans lequel essayer quelque chose prend beaucoup de temps. Pourtant, les methodes d’apprentissage par renforcement actuels (par exemple, deep reinforcement learning) nécessitent de longues périodes d’interaction pour trouver des politiques efficaces. Dans cette thèse, nous avons exploré des algorithmes qui abordent le défi de l’apprentissage par essai-erreur en quelques minutes sur des robots physiques. Nous appelons ce défi “Apprentissage par renforcement micro-data”. Dans la première contribution, nous avons proposé un nouvel algorithme d’appr
APA, Harvard, Vancouver, ISO, and other styles
8

Achab, Mastane. "Ranking and risk-aware reinforcement learning." Electronic Thesis or Diss., Institut polytechnique de Paris, 2020. http://www.theses.fr/2020IPPAT020.

Full text
Abstract:
Les travaux de cette thèse se situent à l’interface de deux thématiques de l'apprentissage automatique : l’apprentissage de préférences d'une part, et l’apprentissage par renforcement de l'autre. La première consiste à percoler différents classements d’un même ensemble d’objets afin d’en extraire un ordre général, la seconde à identifier séquentiellement une stratégie optimale en observant des récompenses sanctionnant chaque action essayée. La structure de la thèse suit ce découpage thématique. En première partie, le paradigme de minimisation du risque empirique est utilisé à des fins d'ordonn
APA, Harvard, Vancouver, ISO, and other styles
9

Zimmer, Matthieu. "Apprentissage par renforcement développemental." Thesis, Université de Lorraine, 2018. http://www.theses.fr/2018LORR0008/document.

Full text
Abstract:
L'apprentissage par renforcement permet à un agent d'apprendre un comportement qui n'a jamais été préalablement défini par l'homme. L'agent découvre l'environnement et les différentes conséquences de ses actions à travers des interactions avec celui-ci : il apprend de sa propre expérience, sans avoir de connaissances préétablies des buts ni des effets de ses actions. Cette thèse s'intéresse à la façon dont l'apprentissage profond peut aider l'apprentissage par renforcement à gérer des espaces continus et des environnements ayant de nombreux degrés de liberté dans l'optique de résoudre des prob
APA, Harvard, Vancouver, ISO, and other styles
10

Tréca, Maxime. "Designing traffic signal control systems using reinforcement learning." Electronic Thesis or Diss., université Paris-Saclay, 2022. http://www.theses.fr/2022UPASG043.

Full text
Abstract:
Ces travaux de thèse étudient en détail la problématique d'optimisation du trafic par le biais du contrôle des feux de signalisation d'un réseau routier. Cette optimisation passe par l'utilisation de techniques d'apprentissage par renforcement, branche du machine learning permettant à un agent de résoudre une tâche dans un environment en maximisant ses signaux de récompenses.Dans un premier temps, les champs respectifs du contrôle de feux et de l'apprentissage par renforcement sont présentés, permettant ensuite d'introduire le domaine du contrôle de feu par apprentissage par renforcement. Dans
APA, Harvard, Vancouver, ISO, and other styles
More sources

Books on the topic "Apprentissage par reinforcement"

1

Sutton, Richard S. Reinforcement learning: An introduction. MIT Press, 1998.

Find full text
APA, Harvard, Vancouver, ISO, and other styles
2

Deep Reinforcement Learning Hands-On: Apply modern RL methods, with deep Q-networks, value iteration, policy gradients, TRPO, AlphaGo Zero and more. Packt Publishing, 2018.

Find full text
APA, Harvard, Vancouver, ISO, and other styles
We offer discounts on all premium plans for authors whose works are included in thematic literature selections. Contact us to get a unique promo code!