Kliknij ten link, aby zobaczyć inne rodzaje publikacji na ten temat: Apprentissage par renforcement profond multi-agent.

Rozprawy doktorskie na temat „Apprentissage par renforcement profond multi-agent”

Utwórz poprawne odniesienie w stylach APA, MLA, Chicago, Harvard i wielu innych

Wybierz rodzaj źródła:

Sprawdź 15 najlepszych rozpraw doktorskich naukowych na temat „Apprentissage par renforcement profond multi-agent”.

Przycisk „Dodaj do bibliografii” jest dostępny obok każdej pracy w bibliografii. Użyj go – a my automatycznie utworzymy odniesienie bibliograficzne do wybranej pracy w stylu cytowania, którego potrzebujesz: APA, MLA, Harvard, Chicago, Vancouver itp.

Możesz również pobrać pełny tekst publikacji naukowej w formacie „.pdf” i przeczytać adnotację do pracy online, jeśli odpowiednie parametry są dostępne w metadanych.

Przeglądaj rozprawy doktorskie z różnych dziedzin i twórz odpowiednie bibliografie.

1

Pageaud, Simon. "SmartGov : architecture générique pour la co-construction de politiques urbaines basée sur l'apprentissage par renforcement multi-agent." Thesis, Lyon, 2019. http://www.theses.fr/2019LYSE1128.

Pełny tekst źródła
Streszczenie:
Dans cette thèse, nous proposons un outil SmartGov, mixant simulation multi-agents et apprentissage multi-agents par renforcement profond, pour permettre la co-construction de politiques urbaines et inscrire les acteurs de la ville dans la boucle de conception. La Smart City permet à l’outil d’intégrer les données collectées par les capteurs présents dans la ville pour la modéliser de façon réaliste. Notre première contribution est une architecture générique pour construire une simulation multi-agents représentant la ville, et étudier l’émergence de comportement globaux avec des agents réalist
Style APA, Harvard, Vancouver, ISO itp.
2

Tréca, Maxime. "Designing traffic signal control systems using reinforcement learning." Electronic Thesis or Diss., université Paris-Saclay, 2022. http://www.theses.fr/2022UPASG043.

Pełny tekst źródła
Streszczenie:
Ces travaux de thèse étudient en détail la problématique d'optimisation du trafic par le biais du contrôle des feux de signalisation d'un réseau routier. Cette optimisation passe par l'utilisation de techniques d'apprentissage par renforcement, branche du machine learning permettant à un agent de résoudre une tâche dans un environment en maximisant ses signaux de récompenses.Dans un premier temps, les champs respectifs du contrôle de feux et de l'apprentissage par renforcement sont présentés, permettant ensuite d'introduire le domaine du contrôle de feu par apprentissage par renforcement. Dans
Style APA, Harvard, Vancouver, ISO itp.
3

Marza, Pierre. "Learning spatial representations for single-task navigation and multi-task policies." Electronic Thesis or Diss., Lyon, INSA, 2024. http://www.theses.fr/2024ISAL0105.

Pełny tekst źródła
Streszczenie:
Agir de manière autonome dans notre monde 3D requiert un large éventail de compétences, parmi lesquelles se trouvent la perception du milieu environnant, sa représentation précise et suffisamment efficace pour garder une trace du passé, la prise de décisions et l’action en vue d’atteindre des objectifs. Les animaux, par exemple les humains, se distinguent par leur robustesse lorsqu’il s’agit d’agir dans le monde. En particulier, ils savent s’adapter efficacement à de nouveaux environnements, mais sont aussi capables de maîtriser rapidement de nombreuses tâches à partir de quelques exemples. Ce
Style APA, Harvard, Vancouver, ISO itp.
4

Nguyen, Van-Thai. "AI-based maintenance planning for multi-component systems considering different kinds of dependencies." Electronic Thesis or Diss., Université de Lorraine, 2023. http://www.theses.fr/2023LORR0070.

Pełny tekst źródła
Streszczenie:
Le maintien en condition opérationnel de systèmes industriels reste un challenge important en regard des dépendances multiples entre composants (ex. dépendance économique, stochastique et structurelle) et du grand nombre de variables de décision en maintenance à optimiser.Pour faire face à ce défi, cette thèse vise à proposer une approche d'optimisation de la maintenance basée sur l'intelligence artificielle permettant de prendre en compte différents types de dépendances entre composants. En particulier, l'approche de maintenance proposée intègre un modèle de prédiction basé sur des réseaux de
Style APA, Harvard, Vancouver, ISO itp.
5

Tran, Trung-Minh. "Contributions to Agent-Based Modeling and Its Application in Financial Market." Electronic Thesis or Diss., Université Paris sciences et lettres, 2023. http://www.theses.fr/2023UPSLP022.

Pełny tekst źródła
Streszczenie:
L'analyse de modèles complexes tels que les marchés financiers aide les gestionnaires à élaborer des politiques raisonnables et les commerçants à choisir des stratégies de négociation efficaces. La modélisation basée sur les agents est une méthodologie de calcul pour modéliser des systèmes complexes et analyser l'influence de différentes hypothèses sur les comportements des agents. Dans le cadre de cette thèse, nous considérons un modèle de marché financier qui comprend 3 types d'agents : les agents techniques, les agents fondamentaux et les agents de bruit. Nous commençons par l'agent techniq
Style APA, Harvard, Vancouver, ISO itp.
6

Alliche, Abderrahmane Redha. "Contrôle du réseau cloud basé intelligence artificielle." Electronic Thesis or Diss., Université Côte d'Azur, 2024. http://www.theses.fr/2024COAZ4022.

Pełny tekst źródła
Streszczenie:
L'explosion du nombre d'utilisateurs d'Internet et du volume de trafic constitue un défi majeur pour la gestion efficace des réseaux de diffusion de contenu (CDN). Bien que ces réseaux aient amélioré leur temps de réponse en exploitant la mise en cache dans des serveurs cloud proches des utilisateurs, les services non mis en cache continuent de poser des problèmes de gestion de trafic. Pour répondre à cette problématique, les réseaux overlay cloud ont émergé, mais ils introduisent des complexités telles que les violations d'inégalités triangulaires (TIV). Dans ce contexte, l'application du par
Style APA, Harvard, Vancouver, ISO itp.
7

Younes, Walid. "Un système multi-agent pour la composition logicielle opportuniste en environnement ambiant et dynamique." Thesis, Toulouse 3, 2021. http://www.theses.fr/2021TOU30025.

Pełny tekst źródła
Streszczenie:
Les systèmes cyber-physiques et ambiants sont constitués d'appareils fixes ou mobiles reliés par des réseaux de communication. Ces appareils hébergent des composants logiciels qui fournissent des services et peuvent nécessiter d'autres services pour fonctionner. Ces composants logiciels sont généralement développés, installés et activés indépendamment les uns des autres et, avec la mobilité des utilisateurs et des appareils, ils peuvent apparaître ou disparaître avec une dynamique imprévisible. Ceci donne aux systèmes cyber-physiques et ambiants une nature ouverte et changeante. Les composants
Style APA, Harvard, Vancouver, ISO itp.
8

Robaglia, Benoît-Marie. "Reinforcement Learning for Uncoordinated Multiple Access." Electronic Thesis or Diss., Institut polytechnique de Paris, 2024. http://www.theses.fr/2024IPPAT010.

Pełny tekst źródła
Streszczenie:
Les protocoles de contrôle d'accès au support (MAC) distribués sont fondamentaux dans la communication sans fil, mais les protocoles traditionnels basés sur l'accès aléatoire sont confrontés à des limitations importantes dans le cas d'utilisation de l'internet des objets (IoT). En effet, ils ont du mal à garantir la latence, ce qui les rend inadaptés aux communications ultra-fiables à faible latence (URLLC). Cette thèse aborde ces défis en exploitant le potentiel de l'apprentissage par renforcement profond (DRL), un paradigme dans lequel les agents optimisent leurs actions en interagissant ave
Style APA, Harvard, Vancouver, ISO itp.
9

Bono, Guillaume. "Deep multi-agent reinforcement learning for dynamic and stochastic vehicle routing problems." Thesis, Lyon, 2020. http://www.theses.fr/2020LYSEI096.

Pełny tekst źródła
Streszczenie:
La planification de tournées de véhicules dans des environnements urbains denses est un problème difficile qui nécessite des solutions robustes et flexibles. Les approches existantes pour résoudre ces problèmes de planification de tournées dynamiques et stochastiques (DS-VRPs) sont souvent basés sur les mêmes heuristiques utilisées dans le cas statique et déterministe, en figeant le problème à chaque fois que la situation évolue. Au lieu de cela, nous proposons dans cette thèse d’étudier l’application de méthodes d’apprentissage par renforcement multi-agent (MARL) aux DS-VRPs en s’appuyant sur
Style APA, Harvard, Vancouver, ISO itp.
10

Hamon, Gautier. "Vers des dynamiques ouvertes en vie artificielle et intelligence artificielle : une perspective eco-evo-devo." Electronic Thesis or Diss., Bordeaux, 2025. http://www.theses.fr/2025BORD0032.

Pełny tekst źródła
Streszczenie:
L’évolution naturelle a, au fil de milliards d’années, généré progressivement l’impressionnante diversité de formes de vie complexes qui peuplent notre planète. Ce phénomène illustre ce que nous appelons un processus ouvert (open-ended): un système capable de générer continuellement des structures de plus en plus diversifiées et complexes. Inspiré par ce phénomène ainsi que par d’autres processus ouverts tels que l’apprentissage développemental humain et l’évolution culturelle, cette thèse explore les mécanismes clés qui supportent les processus ouverts et la complexité émergente. Située à l’i
Style APA, Harvard, Vancouver, ISO itp.
11

Dinneweth, Joris. "Vers des approches hybrides fondées sur l'émergence et l'apprentissage : prise en compte des véhicules autonomes dans le trafic." Electronic Thesis or Diss., université Paris-Saclay, 2024. http://www.theses.fr/2024UPASG099.

Pełny tekst źródła
Streszczenie:
Selon l'Organisation mondiale de la santé, les accidents de la route causent près de 1,2 million de décès et 40 millions de blessés chaque année. Dans les pays riches, des normes de sécurité permettent de prévenir une grande partie des accidents. Les accidents restants trouvent leur cause dans le comportement humain.Ainsi, certains envisagent d'automatiser le trafic, c'est-à-dire de substituer aux humains la conduite de leurs véhicules. Cependant, l'automatisation du trafic routier peut difficilement s'effectuer du jour au lendemain. Ainsi, robots de conduite (RC) et conducteurs humains pourra
Style APA, Harvard, Vancouver, ISO itp.
12

Basso, Gillian. "Approche à base d'agents pour l'ingénierie et le contrôle de micro-réseaux." Phd thesis, Université de Technologie de Belfort-Montbeliard, 2013. http://tel.archives-ouvertes.fr/tel-00982342.

Pełny tekst źródła
Streszczenie:
La gestion d'énergie est un sujet de plus en plus important dans notre société. Nous faisons actuellement face à un nombre croissant de problèmes tels que l'épuisement des réserves pétrolières, le réchauffement climatique ou encore la diminution de la qualité de l'énergie (principalement due aux coupures pendant les pics de consommation). Les smartgrids sont une des solutions à ces problèmes. En ajoutant une communication bidirectionnelle et de nouvelles capacités en matière de technologies de l'information et de la communication, il est possible de créer un système autonome de gestion intelli
Style APA, Harvard, Vancouver, ISO itp.
13

Ajmi, Faiza. "Optimisation collaborative par des agents auto-adaptatifs pour résoudre les problèmes d'ordonnancement des patients en inter-intra urgences hospitalières." Thesis, Centrale Lille Institut, 2021. http://www.theses.fr/2021CLIL0019.

Pełny tekst źródła
Streszczenie:
Cette thèse s’attaque à des problèmes d’ordonnancement des patients aux urgences, avec prise en compte des contraintes d’aval, en utilisant des approches d’optimisation collaboratives optimisant le temps d’attente global moyen des patients. Ces approches sont utilisées en intégrant, dans le comportement de chaque agent,une métaheuristique qui évolue efficacement, grâce à deux protocoles d’interaction "amis" et "ennemis". En outre, chaque agent s’auto-adapte à l’aide d’un algorithme d’apprentissage par renforcement adapté a unproblème étudié. Cette auto-adaptation tient compte d’expériences des
Style APA, Harvard, Vancouver, ISO itp.
14

Noukhovitch, Mikhail. "Emerging communication between competitive agents." Thesis, 2019. http://hdl.handle.net/1866/24330.

Pełny tekst źródła
Streszczenie:
Nous utilisons l’apprentissage automatique pour répondre à une question fondamentale: comment les individus peuvent apprendre à communiquer pour partager de l'information et se coordonner même en présence de conflits? Cette th\`ese essaie de corriger l'idée qui prévaut à l'heure actuelle dans la communauté de l'apprentissage profond que les agents compétitifs ne peuvent pas apprendre à communiquer efficacement. Dans ce travail de recherche, nous étudions l’émergence de la communication dans les jeux coopératifs-compétitifs à travers un jeu expéditeur-receveur que nous construisons. Nous porton
Style APA, Harvard, Vancouver, ISO itp.
15

Nabli, Adel. "The multilevel critical node problem : theoretical intractability and a curriculum learning approach." Thesis, 2020. http://hdl.handle.net/1866/24329.

Pełny tekst źródła
Streszczenie:
Évaluer la vulnérabilité des réseaux est un enjeu de plus en plus critique. Dans ce mémoire, nous nous penchons sur une approche étudiant la défense d’infrastructures stratégiques contre des attaques malveillantes au travers de problèmes d'optimisations multiniveaux. Plus particulièrement, nous analysons un jeu séquentiel en trois étapes appelé le « Multilevel Critical Node problem » (MCN). Ce jeu voit deux joueurs s'opposer sur un graphe: un attaquant et un défenseur. Le défenseur commence par empêcher préventivement que certains nœuds soient attaqués durant une phase de vaccination. Ensuite,
Style APA, Harvard, Vancouver, ISO itp.
Oferujemy zniżki na wszystkie plany premium dla autorów, których prace zostały uwzględnione w tematycznych zestawieniach literatury. Skontaktuj się z nami, aby uzyskać unikalny kod promocyjny!