Log in

Relevant bibliographies by topics / Apprentissage par renforcement profond multi-agent / Dissertations / Theses

To see the other types of publications on this topic, follow the link: Apprentissage par renforcement profond multi-agent.

Dissertations / Theses on the topic 'Apprentissage par renforcement profond multi-agent'

Author: Grafiati

Published: 31 August 2024

Last updated: 31 July 2025

Create a spot-on reference in APA, MLA, Chicago, Harvard, and other styles

Select a source type:

Consult the top 15 dissertations / theses for your research on the topic 'Apprentissage par renforcement profond multi-agent.'

Next to every source in the list of references, there is an 'Add to bibliography' button. Press on it, and we will generate automatically the bibliographic reference to the chosen work in the citation style you need: APA, MLA, Harvard, Chicago, Vancouver, etc.

You can also download the full text of the academic publication as pdf and read online its abstract whenever available in the metadata.

Browse dissertations / theses on a wide variety of disciplines and organise your bibliography correctly.

1

Pageaud, Simon. "SmartGov : architecture générique pour la co-construction de politiques urbaines basée sur l'apprentissage par renforcement multi-agent." Thesis, Lyon, 2019. http://www.theses.fr/2019LYSE1128.

Full text

Abstract:

Dans cette thèse, nous proposons un outil SmartGov, mixant simulation multi-agents et apprentissage multi-agents par renforcement profond, pour permettre la co-construction de politiques urbaines et inscrire les acteurs de la ville dans la boucle de conception. La Smart City permet à l’outil d’intégrer les données collectées par les capteurs présents dans la ville pour la modéliser de façon réaliste. Notre première contribution est une architecture générique pour construire une simulation multi-agents représentant la ville, et étudier l’émergence de comportement globaux avec des agents réalist

APA, Harvard, Vancouver, ISO, and other styles

2

Tréca, Maxime. "Designing traffic signal control systems using reinforcement learning." Electronic Thesis or Diss., université Paris-Saclay, 2022. http://www.theses.fr/2022UPASG043.

Full text

Abstract:

Ces travaux de thèse étudient en détail la problématique d'optimisation du trafic par le biais du contrôle des feux de signalisation d'un réseau routier. Cette optimisation passe par l'utilisation de techniques d'apprentissage par renforcement, branche du machine learning permettant à un agent de résoudre une tâche dans un environment en maximisant ses signaux de récompenses.Dans un premier temps, les champs respectifs du contrôle de feux et de l'apprentissage par renforcement sont présentés, permettant ensuite d'introduire le domaine du contrôle de feu par apprentissage par renforcement. Dans

APA, Harvard, Vancouver, ISO, and other styles

3

Marza, Pierre. "Learning spatial representations for single-task navigation and multi-task policies." Electronic Thesis or Diss., Lyon, INSA, 2024. http://www.theses.fr/2024ISAL0105.

Full text

Abstract:

Agir de manière autonome dans notre monde 3D requiert un large éventail de compétences, parmi lesquelles se trouvent la perception du milieu environnant, sa représentation précise et suffisamment efficace pour garder une trace du passé, la prise de décisions et l’action en vue d’atteindre des objectifs. Les animaux, par exemple les humains, se distinguent par leur robustesse lorsqu’il s’agit d’agir dans le monde. En particulier, ils savent s’adapter efficacement à de nouveaux environnements, mais sont aussi capables de maîtriser rapidement de nombreuses tâches à partir de quelques exemples. Ce

APA, Harvard, Vancouver, ISO, and other styles

4

Nguyen, Van-Thai. "AI-based maintenance planning for multi-component systems considering different kinds of dependencies." Electronic Thesis or Diss., Université de Lorraine, 2023. http://www.theses.fr/2023LORR0070.

Full text

Abstract:

Le maintien en condition opérationnel de systèmes industriels reste un challenge important en regard des dépendances multiples entre composants (ex. dépendance économique, stochastique et structurelle) et du grand nombre de variables de décision en maintenance à optimiser.Pour faire face à ce défi, cette thèse vise à proposer une approche d'optimisation de la maintenance basée sur l'intelligence artificielle permettant de prendre en compte différents types de dépendances entre composants. En particulier, l'approche de maintenance proposée intègre un modèle de prédiction basé sur des réseaux de

APA, Harvard, Vancouver, ISO, and other styles

5

Tran, Trung-Minh. "Contributions to Agent-Based Modeling and Its Application in Financial Market." Electronic Thesis or Diss., Université Paris sciences et lettres, 2023. http://www.theses.fr/2023UPSLP022.

Full text

Abstract:

L'analyse de modèles complexes tels que les marchés financiers aide les gestionnaires à élaborer des politiques raisonnables et les commerçants à choisir des stratégies de négociation efficaces. La modélisation basée sur les agents est une méthodologie de calcul pour modéliser des systèmes complexes et analyser l'influence de différentes hypothèses sur les comportements des agents. Dans le cadre de cette thèse, nous considérons un modèle de marché financier qui comprend 3 types d'agents : les agents techniques, les agents fondamentaux et les agents de bruit. Nous commençons par l'agent techniq

APA, Harvard, Vancouver, ISO, and other styles

6

Alliche, Abderrahmane Redha. "Contrôle du réseau cloud basé intelligence artificielle." Electronic Thesis or Diss., Université Côte d'Azur, 2024. http://www.theses.fr/2024COAZ4022.

Full text

Abstract:

L'explosion du nombre d'utilisateurs d'Internet et du volume de trafic constitue un défi majeur pour la gestion efficace des réseaux de diffusion de contenu (CDN). Bien que ces réseaux aient amélioré leur temps de réponse en exploitant la mise en cache dans des serveurs cloud proches des utilisateurs, les services non mis en cache continuent de poser des problèmes de gestion de trafic. Pour répondre à cette problématique, les réseaux overlay cloud ont émergé, mais ils introduisent des complexités telles que les violations d'inégalités triangulaires (TIV). Dans ce contexte, l'application du par

APA, Harvard, Vancouver, ISO, and other styles

7

Younes, Walid. "Un système multi-agent pour la composition logicielle opportuniste en environnement ambiant et dynamique." Thesis, Toulouse 3, 2021. http://www.theses.fr/2021TOU30025.

Full text

Abstract:

Les systèmes cyber-physiques et ambiants sont constitués d'appareils fixes ou mobiles reliés par des réseaux de communication. Ces appareils hébergent des composants logiciels qui fournissent des services et peuvent nécessiter d'autres services pour fonctionner. Ces composants logiciels sont généralement développés, installés et activés indépendamment les uns des autres et, avec la mobilité des utilisateurs et des appareils, ils peuvent apparaître ou disparaître avec une dynamique imprévisible. Ceci donne aux systèmes cyber-physiques et ambiants une nature ouverte et changeante. Les composants

APA, Harvard, Vancouver, ISO, and other styles

8

Robaglia, Benoît-Marie. "Reinforcement Learning for Uncoordinated Multiple Access." Electronic Thesis or Diss., Institut polytechnique de Paris, 2024. http://www.theses.fr/2024IPPAT010.

Full text

Abstract:

Les protocoles de contrôle d'accès au support (MAC) distribués sont fondamentaux dans la communication sans fil, mais les protocoles traditionnels basés sur l'accès aléatoire sont confrontés à des limitations importantes dans le cas d'utilisation de l'internet des objets (IoT). En effet, ils ont du mal à garantir la latence, ce qui les rend inadaptés aux communications ultra-fiables à faible latence (URLLC). Cette thèse aborde ces défis en exploitant le potentiel de l'apprentissage par renforcement profond (DRL), un paradigme dans lequel les agents optimisent leurs actions en interagissant ave

APA, Harvard, Vancouver, ISO, and other styles

9

Bono, Guillaume. "Deep multi-agent reinforcement learning for dynamic and stochastic vehicle routing problems." Thesis, Lyon, 2020. http://www.theses.fr/2020LYSEI096.

Full text

Abstract:

La planification de tournées de véhicules dans des environnements urbains denses est un problème difficile qui nécessite des solutions robustes et flexibles. Les approches existantes pour résoudre ces problèmes de planification de tournées dynamiques et stochastiques (DS-VRPs) sont souvent basés sur les mêmes heuristiques utilisées dans le cas statique et déterministe, en figeant le problème à chaque fois que la situation évolue. Au lieu de cela, nous proposons dans cette thèse d’étudier l’application de méthodes d’apprentissage par renforcement multi-agent (MARL) aux DS-VRPs en s’appuyant sur

APA, Harvard, Vancouver, ISO, and other styles

10

Hamon, Gautier. "Vers des dynamiques ouvertes en vie artificielle et intelligence artificielle : une perspective eco-evo-devo." Electronic Thesis or Diss., Bordeaux, 2025. http://www.theses.fr/2025BORD0032.

Full text

Abstract:

L’évolution naturelle a, au fil de milliards d’années, généré progressivement l’impressionnante diversité de formes de vie complexes qui peuplent notre planète. Ce phénomène illustre ce que nous appelons un processus ouvert (open-ended): un système capable de générer continuellement des structures de plus en plus diversifiées et complexes. Inspiré par ce phénomène ainsi que par d’autres processus ouverts tels que l’apprentissage développemental humain et l’évolution culturelle, cette thèse explore les mécanismes clés qui supportent les processus ouverts et la complexité émergente. Située à l’i

APA, Harvard, Vancouver, ISO, and other styles

11

Dinneweth, Joris. "Vers des approches hybrides fondées sur l'émergence et l'apprentissage : prise en compte des véhicules autonomes dans le trafic." Electronic Thesis or Diss., université Paris-Saclay, 2024. http://www.theses.fr/2024UPASG099.

Full text

Abstract:

Selon l'Organisation mondiale de la santé, les accidents de la route causent près de 1,2 million de décès et 40 millions de blessés chaque année. Dans les pays riches, des normes de sécurité permettent de prévenir une grande partie des accidents. Les accidents restants trouvent leur cause dans le comportement humain.Ainsi, certains envisagent d'automatiser le trafic, c'est-à-dire de substituer aux humains la conduite de leurs véhicules. Cependant, l'automatisation du trafic routier peut difficilement s'effectuer du jour au lendemain. Ainsi, robots de conduite (RC) et conducteurs humains pourra

APA, Harvard, Vancouver, ISO, and other styles

12

Basso, Gillian. "Approche à base d'agents pour l'ingénierie et le contrôle de micro-réseaux." Phd thesis, Université de Technologie de Belfort-Montbeliard, 2013. http://tel.archives-ouvertes.fr/tel-00982342.

Full text

Abstract:

La gestion d'énergie est un sujet de plus en plus important dans notre société. Nous faisons actuellement face à un nombre croissant de problèmes tels que l'épuisement des réserves pétrolières, le réchauffement climatique ou encore la diminution de la qualité de l'énergie (principalement due aux coupures pendant les pics de consommation). Les smartgrids sont une des solutions à ces problèmes. En ajoutant une communication bidirectionnelle et de nouvelles capacités en matière de technologies de l'information et de la communication, il est possible de créer un système autonome de gestion intelli

APA, Harvard, Vancouver, ISO, and other styles

13

Ajmi, Faiza. "Optimisation collaborative par des agents auto-adaptatifs pour résoudre les problèmes d'ordonnancement des patients en inter-intra urgences hospitalières." Thesis, Centrale Lille Institut, 2021. http://www.theses.fr/2021CLIL0019.

Full text

Abstract:

Cette thèse s’attaque à des problèmes d’ordonnancement des patients aux urgences, avec prise en compte des contraintes d’aval, en utilisant des approches d’optimisation collaboratives optimisant le temps d’attente global moyen des patients. Ces approches sont utilisées en intégrant, dans le comportement de chaque agent,une métaheuristique qui évolue efficacement, grâce à deux protocoles d’interaction "amis" et "ennemis". En outre, chaque agent s’auto-adapte à l’aide d’un algorithme d’apprentissage par renforcement adapté a unproblème étudié. Cette auto-adaptation tient compte d’expériences des

APA, Harvard, Vancouver, ISO, and other styles

14

Noukhovitch, Mikhail. "Emerging communication between competitive agents." Thesis, 2019. http://hdl.handle.net/1866/24330.

Full text

Abstract:

Nous utilisons l’apprentissage automatique pour répondre à une question fondamentale: comment les individus peuvent apprendre à communiquer pour partager de l'information et se coordonner même en présence de conflits? Cette th\`ese essaie de corriger l'idée qui prévaut à l'heure actuelle dans la communauté de l'apprentissage profond que les agents compétitifs ne peuvent pas apprendre à communiquer efficacement. Dans ce travail de recherche, nous étudions l’émergence de la communication dans les jeux coopératifs-compétitifs à travers un jeu expéditeur-receveur que nous construisons. Nous porton

APA, Harvard, Vancouver, ISO, and other styles

15

Nabli, Adel. "The multilevel critical node problem : theoretical intractability and a curriculum learning approach." Thesis, 2020. http://hdl.handle.net/1866/24329.

Full text

Abstract:

Évaluer la vulnérabilité des réseaux est un enjeu de plus en plus critique. Dans ce mémoire, nous nous penchons sur une approche étudiant la défense d’infrastructures stratégiques contre des attaques malveillantes au travers de problèmes d'optimisations multiniveaux. Plus particulièrement, nous analysons un jeu séquentiel en trois étapes appelé le « Multilevel Critical Node problem » (MCN). Ce jeu voit deux joueurs s'opposer sur un graphe: un attaquant et un défenseur. Le défenseur commence par empêcher préventivement que certains nœuds soient attaqués durant une phase de vaccination. Ensuite,

APA, Harvard, Vancouver, ISO, and other styles

We offer discounts on all premium plans for authors whose works are included in thematic literature selections. Contact us to get a unique promo code!