To see the other types of publications on this topic, follow the link: Apprentissage actf.

Dissertations / Theses on the topic 'Apprentissage actf'

Create a spot-on reference in APA, MLA, Chicago, Harvard, and other styles

Select a source type:

Consult the top 50 dissertations / theses for your research on the topic 'Apprentissage actf.'

Next to every source in the list of references, there is an 'Add to bibliography' button. Press on it, and we will generate automatically the bibliographic reference to the chosen work in the citation style you need: APA, MLA, Harvard, Chicago, Vancouver, etc.

You can also download the full text of the academic publication as pdf and read online its abstract whenever available in the metadata.

Browse dissertations / theses on a wide variety of disciplines and organise your bibliography correctly.

1

Скарлупіна, Юлія Анатоліївна, Юлия Анатольевна Скарлупина та Yuliia Anatoliivna Skarlupina. "Оптимізація вивчення французької мови як другої іноземної". Thesis, Харківський національний університет імені Каразіна, 2013. http://essuir.sumdu.edu.ua/handle/123456789/64048.

Full text
Abstract:
Одним із ефективних засобів сприяння активному вивченню іноземної мови з професійно метою є науково–дослідницька робота студентів, яка стимулює професійний інтерес студентів, їх пізнавальну активність і самостійність.<br>L'activité de recherche est un des moyens efficaces de l'optimisation de l'apprentissage de'une langue étrangère pour le but professionnel, elle stymule l'intret professionnel des étudiants, leur activité cognitive et leur indépendance.
APA, Harvard, Vancouver, ISO, and other styles
2

Bondu, Alexis. "Apprentissage actif par modèles locaux." Phd thesis, Université d'Angers, 2008. http://tel.archives-ouvertes.fr/tel-00450124.

Full text
Abstract:
Les méthodes d'apprentissage statistiques exploitent des exemples, pour enseigner un comportement à un modèle prédictif. La classification supervisée requiert des exemples étiquetés. En pratique, l'étiquetage des exemples peut se révélé coûteux. Dans certain cas, l'étiquetage implique un expert humain, un instrument de mesure, un temps de calcul élevé...etc. Les méthodes d'apprentissage actif réduisent le coût de préparation des données d'apprentissage. Ces méthodes cherchent à étiqueter uniquement les exemples les plus utiles à l'apprentissage d'un modèle. Les travaux présentés dans ce manuscrit sont réalisés dans le cadre de l'échantillonnage sélectif, qui n'autorise pas les stratégies actives à générer de nouveaux exemples d'apprentissage. Les stratégies actives de la littérature utilisent généralement des modèles globaux à l'espace des variables d'entrées. Nous proposons dans ce manuscrit une stratégie originale qui effectue un partitionnement dichotomique récursif de l'espace d'entrée. Cette stratégie met en compétition les modèles locaux à chacune des zones, pour choisir les exemples à étiqueter. Notre stratégie décide “quand” couper une zone et “où” la couper. Une amélioration possible consiste `a exploiter une méthode de discrétisation pour prendre ces deux décisions. L'extension de l'approche de discrétisation MODL au cas de l'apprentissage semi-supervisé constitue un des apports majeurs de cette thèse. Nous proposons une deuxième amélioration qui consiste à sélectionner, localement à la meilleure zone, l'exemple le plus utile à l'apprentissage du modèle local. Nous proposons une stratégie active originale, qui maximise la probabilité des modèles de discrétisation connaissant les données et l'exemple candidat à l'étiquetage.
APA, Harvard, Vancouver, ISO, and other styles
3

Gandar, Benoît. "Apprentissage actif pour l'approximation de variétés." Phd thesis, Université Blaise Pascal - Clermont-Ferrand II, 2012. http://tel.archives-ouvertes.fr/tel-00954409.

Full text
Abstract:
L'apprentissage statistique cherche à modéliser un lien fonctionnel entre deux variables X et Y à partir d'un échantillon aléatoire de réalisations de (X,Y ). Lorsque la variable Y prend un nombre binaire de valeurs, l'apprentissage s'appelle la classification (ou discrimination en français) et apprendre le lien fonctionnel s'apparente à apprendre la frontière d'une variété dans l'espace de la variable X. Dans cette thèse, nous nous plaçons dans le contexte de l'apprentissage actif, i.e. nous supposons que l'échantillon d'apprentissage n'est plus aléatoire et que nous pouvons, par l'intermédiaire d'un oracle, générer les points sur lesquels l'apprentissage de la variété va s'effectuer. Dans le cas où la variable Y est continue (régression), des travaux précédents montrent que le critère de la faible discrépance pour générer les premiers points d'apprentissage est adéquat. Nous montrons, de manière surprenante, que ces résultats ne peuvent pas être transférés à la classification. Dans ce manuscrit, nous proposons alors le critère de la dispersion pour la classification. Ce critère étant difficile à mettre en pratique, nous proposons un nouvel algorithme pour générer un plan d'expérience à faible dispersion dans le carré unité. Après une première approximation de la variété, des approximations successives peuvent être réalisées afin d'affiner la connaissance de celle-ci. Deux méthodes d'échantillonnage sont alors envisageables : le " selective sampling " qui choisit les points à présenter à un oracle parmi un ensemble fini de candidats et l'" adaptative sampling " qui permet de choisir n'importe quels points de l'espace de la variable X. Le deuxième échantillonnage peut être vu comme un passage à la limite du premier. Néanmoins, en pratique, il n'est pas raisonnable d'utiliser cette méthode. Nous proposons alors un nouvel algorithme basé sur le critère de dispersion, menant de front exploitation et exploration, pour approximer une variété.
APA, Harvard, Vancouver, ISO, and other styles
4

Vu, Viet-Vu. "Clustering semi-supervisé et apprentissage actif." Paris 6, 2011. http://www.theses.fr/2011PA066607.

Full text
APA, Harvard, Vancouver, ISO, and other styles
5

Cámara, Chávez Guillermo Philipp-Foliguet Sylvie. "Analyse du contenu vidéo par apprentissage actif." [s.l.] : [s.n.], 2009. http://biblioweb.u-cergy.fr/theses/07CERG0380.pdf.

Full text
Abstract:
Reproduction de : Thèse doctorat : Traitement de l'image et du signal : Université de Cergy-Pontoise : 2007. Reproduction de : Thèse doctorat : Traitement de l'image et du signal : Universidade Federal de Minas Gerais (Brésil) : 2007.<br>Thèse soutenue en co-tutelle. Titre provenant de l'écran titre. Bibliogr. p. 157-174.
APA, Harvard, Vancouver, ISO, and other styles
6

Cámara, Chávez Guillermo. "Analyse du contenu vidéo par apprentissage actif." Cergy-Pontoise, 2007. http://www.theses.fr/2007CERG0380.

Full text
Abstract:
L’objet de cette thèse est de proposer un système d’indexation semi-automatique et de recherche interactive pour la vidéo. Nous avons développé un algorithme de détection des plans automatique sans paramètre, ni seuil. Nous avons choisi un classifieur SVM pour sa capacité à traiter des caractéristiques de grandes dimensions tout en préservant des garanties de généralisation pour peu d’exemples d’apprentissage. Nous avons étudié plusieurs combinaisons de caractéristiques et de fonctions noyaux et présenté des résultats intéressants pour la tâche de détection de plan de TRECVID 2006. Nous avons proposé un système interactif de recherche de contenu vidéo : RETINVID, qui permet de réduire le nombre d’images à annoter par l’utilisateur. Ces images sont sélectionnées pour leur capacité à accroître la connaissance sur les données. Nous avons effectué de nombreuses simulations sur les données de la tâche de concepts haut-niveaux de TRECVID 2005<br>This thesis presents work towards a unified framework for semi-automated video indexing and interactive retrieval. To create an efficient index, a set of representative key frames are selected from the entire video content. We developed an automatic shot boundary detection algorithm to get rid of parameters and thresholds. We adopted a SVM classifier due to its ability to use very high dimensional feature spaces while at the same time keeping strong generalization guarantees from few training examples. We deeply evaluated the combination of features and kernels and present interesting results obtained, for shot extraction TRECVID 2006 Task. We then propose an interactive video retrieval system: RETINVID, to significantly reduce the number of key frames annotated by the user. The key frames are selected based on their ability to increase the knowledge of the data. We perform an experiment against the 2005 TRECVID benchmark for high-level task
APA, Harvard, Vancouver, ISO, and other styles
7

Goëau, Hervé. "Structuration de collections d'images par apprentissage actif crédibiliste." Phd thesis, Université Joseph Fourier (Grenoble), 2009. http://tel.archives-ouvertes.fr/tel-00410380.

Full text
Abstract:
L'indexation des images est une étape indispensable pour valoriser un fond d'archive professionnel ou des collections d'images personnelles. Le "documentaliste" se doit de décrire précisément chaque document collecté dans la perspective de le retrouver. La difficulté est alors d'interpréter les contenus visuels et de les associer entre eux afin de couvrir différentes catégories qui peuvent être souvent très subjectives. Dans ce travail, nous nous inspirons du principe de l'apprentissage actif pour aider un utilisateur dans cette tâche de structuration de collections d'images. A partir de l'analyse des contenus visuels des images, différentes stratégies de sélection active sont développées afin d'aider un utilisateur à identifier et cerner des catégories pertinentes selon son point de vue. Nous proposons d'exprimer ce problème de classification d'images avec apprentissage actif dans le cadre du Modèle des Croyances Transférables (MCT). Ce formalisme facilite la combinaison, la révision et la représentation des connaissances que l'on peut extraire des images et des classes existantes à un moment donné. La méthode proposée dans ce cadre permet ainsi une représentation détaillée de la connaissance, notamment en représentant explicitement les cas d'appartenances à aucune ou à de multiples catégories, tout en quantifiant l'incertitude (liée entre autre au fossé sémantique) et le conflit entrainé par l'analyse des images selon différentes modalités (couleurs, orientations). Une interface homme-machine a été développée afin de valider notre approche sur des jeux de tests de référence, des collections d'images personnelles et des photographies professionnelles issues de l'Institut National de l'Audiovisuel. Une évaluation a été conduite auprès d'utilisateurs professionnels et a montré des résultats très positifs en termes d'utilité, d'utilisabilité et de satisfaction.
APA, Harvard, Vancouver, ISO, and other styles
8

Safadi, Bahjat. "Indexation sémantique des images et des vidéos par apprentissage actif." Phd thesis, Université de Grenoble, 2012. http://tel.archives-ouvertes.fr/tel-00766904.

Full text
Abstract:
Le cadre général de cette thèse est l'indexation sémantique et la recherche d'informations, appliquée à des documents multimédias. Plus précisément, nous nous intéressons à l'indexation sémantique des concepts dans des images et vidéos par les approches d'apprentissage actif, que nous utilisons pour construire des corpus annotés. Tout au long de cette thèse, nous avons montré que les principales difficultés de cette tâche sont souvent liées, en général, à l'fossé sémantique. En outre, elles sont liées au problème de classe-déséquilibre dans les ensembles de données à grande échelle, où les concepts sont pour la plupart rares. Pour l'annotation de corpus, l'objectif principal de l'utilisation de l'apprentissage actif est d'augmenter la performance du système en utilisant que peu d'échantillons annotés que possible, ainsi minimisant les coûts de l'annotations des données (par exemple argent et temps). Dans cette thèse, nous avons contribué à plusieurs niveaux de l'indexation multimédia et nous avons proposé trois approches qui succèdent des systèmes de l'état de l'art: i) l'approche multi-apprenant (ML) qui surmonte le problème de classe-déséquilibre dans les grandes bases de données, ii) une méthode de reclassement qui améliore l'indexation vidéo, iii) nous avons évalué la normalisation en loi de puissance et de l'APC et a montré son efficacité dans l'indexation multimédia. En outre, nous avons proposé l'approche ALML qui combine le multi-apprenant avec l'apprentissage actif, et nous avons également proposé une méthode incrémentale qui accélère l'approche proposé (ALML). En outre, nous avons proposé l'approche de nettoyage actif, qui aborde la qualité des annotations. Les méthodes proposées ont été tous validées par plusieurs expériences, qui ont été menées et évaluées sur des collections à grande échelle de l'indice de benchmark internationale bien connue, appelés TRECVID. Enfin, nous avons présenté notre système d'annotation dans le monde réel basé sur l'apprentissage actif, qui a été utilisé pour mener les annotations de l'ensemble du développement de la campagne TRECVID en 2011, et nous avons présenté notre participation à la tâche d'indexation sémantique de cette campagne, dans laquelle nous nous sommes classés à la 3ème place sur 19 participants.
APA, Harvard, Vancouver, ISO, and other styles
9

Lecerf, Loïc. "L' apprentissage machine pour assister l'annotation de documents : clustering visuel interactif, apprentissage actif et extraction automatique des descripteurs." Paris 6, 2009. http://www.theses.fr/2009PA066186.

Full text
Abstract:
Ce mémoire porte sur l’apprentissage machine pour l’annotation. L’objectif de l’annotation est d’insérer une information additionnelle à un objet (e. G. Images, documents, vidéos, données biologiques, etc. ). Ces informations permettent une meilleure compréhension ou organisation de ces objets par une machine. Alors que l’annotation manuelle est le plus souvent coûteuse, les travaux récents de la littérature proposent d’utiliser les méthodes d’apprentissage machine pour automatiser la tâche d’annotation. L’apprentissage machine a connu une progression très importante et son application à l’annotation a montré expérimentalement son efficacité pour de nombreux domaines. Au cours de notre travail de thèse, nous avons cherché à faire évoluer l’apprentissage machine afin de rendre son utilisation plus facile (définition des descripteurs et élaboration du corpus d’apprentissage) ou plus flexible afin de permettre à un utilisateur de s’impliquer et guider le processus d’apprentissage machine. Dans la première partie de ce mémoire, nous introduisons l’apprentissage machine interactif. Nous proposons plusieurs approches dans lesquelles nous combinons des outils de visualisation scientifique à l’apprentissage machine. Ces approches se présentent comme une alternative à l’apprentissage automatique, particulièrement pertinente lorsque le coût d’annotation ou le coût d’erreur de prédiction est élevé et lorsque l’utilisateur possède des connaissances du domaine utiles pour guider l’apprentissage machine. Dans une deuxième partie de nos travaux, nous avons cherché à réduire le travail de définition des descripteurs. Nous avons d’une part étudié et amélioré les méthodes pour la sélection automatique de grands ensembles de descripteurs génériques, puis nous avons proposé une nouvelle approche pour la génération automatique de ces descripteurs pour des données de type séquentielle. Notre travail de thèse a été motivé par la tâche spécifique d’annotation sémantique de documents semi-structurés. Nos travaux ont été évalués expérimentalement sur des collections de documents mais aussi sur d’autres ensembles de données issues de domaines divers. De même, afin de vérifier la pertinence de nos méthodes, nous avons déployé un prototype pour l’annotation sémantique de documents par apprentissage actif, ainsi qu’une application Web, pour l’annotation interactive
APA, Harvard, Vancouver, ISO, and other styles
10

Boisson, Arthur. "Motricité et intégration multi-sensorielle : apprentissage des représentations grapho-phonémiques." Thesis, Lyon, 2018. http://www.theses.fr/2018LYSE2126/document.

Full text
Abstract:
Nous sommes, dans notre vie quotidienne entourés d'associations audio-visuelles : nous les percevons et les mémorisons tout au long de notre vie. Pourtant, les mécanismes impliqués dans leur apprentissage restent abscons. En particulier, les facteurs comme la motricité permettant de favoriser de tels apprentissages, sont rarement étudiés d'un point de vue mnésique.Ainsi, les objectifs généraux de cette thèse visent à : i) étudier les mécanismes cognitifs à la base de l'apprentissage d'associations audio-visuelles, ii) mieux comprendre l'impact de la motricité dans l'efficacité de ses mécanismes, et iii) proposer des méthodologies originales susceptibles d'augmenter l'efficacité de ces mécanismes et/ou de compenser d'éventuels déficits.Plus précisément, ce travail de thèse s'intéresse au bénéfice de la motricité dans l'apprentissage des correspondances grapho-phonémiques (CGP). En plus de l'intérêt purement théorique que suscite l'étude de cet apprentissage, l'importance de cette acquisition chez les jeunes enfants pré-lecteurs ajoute une portée pratique et pédagogique à ce travail. L’originalité de ce travail de thèse est de vouloir rapprocher deux grands domaines d'études, celui de l’apprentissage de la lecture/écriture et celui de la mémoire. Bien que les deux domaines traitent d'apprentissage et donc de mémoire, il n'y a jamais eu de véritable tentative d'application des modèles de la mémoire pour aider à la compréhension des mécanismes d'apprentissage de la lecture-écriture de mots, et inversement, les travaux sur la mémoire ont rarement regardé du côté des recherches sur l'apprentissage de la lecture-écriture pour valider leurs hypothèses. Or, l’un des intérêts du modèle Act-In servant de support à cette thèse est justement de proposer une approche intégrée du fonctionnement cognitif et pas seulement de la mémoire<br>In our daily lives, we are surrounded by audiovisual associations: we perceive and memorize them throughout our lives. However, the mechanisms involved in their learning are not fully understood. In particular, factors such as motor skills that promote such learning are rarely studied from a memory point of view.Thus, the general objectives of this thesis are to: i) study the cognitive mechanisms underlying the learning of audio-visual associations, ii) better understand the impact of motor skills on the effectiveness of its mechanisms, and iii) propose original methodologies likely to increase the effectiveness of these mechanisms and/or compensate for possible deficits.More precisely, this thesis work focuses on the benefit of motor exploration in learning grapho-phonemic correspondences (GPC). In addition to the purely theoretical interest in studying this learning, the importance of this acquisition for young pre-readers adds a practical and pedagogical dimension to this work. What stands out from this thesis is that two areas of study, the one of learning to read and the one of memory are combined. Though both of them deal with learning hence memory, there has never been a real attempt to apply memory models to help understand the mechanisms of learning word reading and writing, and conversely, memory research has rarely looked to research on learning to read and write to validate their assumptions. However, one of the interests of the Act-In model used to support this thesis is precisely to propose an integrated approach to cognitive functioning and not only to memory
APA, Harvard, Vancouver, ISO, and other styles
11

Král, Pavel. "Automatic Recognition of Dialogue Acts." Thesis, Nancy 1, 2007. http://www.theses.fr/2007NAN10114/document.

Full text
Abstract:
Ce mémoire concerne la reconnaissance automatique des Actes de Dialogues (ADs) en tchéque et en français. Les ADs sont des unités au niveau de la phrase qui représentent des différents états d’un dialogue, comme par exemple les questions, les affirmations, les hésitations, etc. La première contribution de ce travail est de proposer et comparer plusieurs approches de reconnaissance des ADs qui sont basées sur trois types d’informations : lexical, prosodique et relative à la position des mots dans une phrase. Ces approches ont eté testées sur un corpus tchèque de dialogues homme-homme. Ce corpus a été transcris en mots manuellement, et avec un moteur de reconnaissance automatique afin de valider les approches dans des conditions réelles. Les résultats expérimentaux confirment que chaque type d’attributs apporte des informations pertinentes et complémentaires. Les méthodes proposées qui exploitent la position des mots sont particulièrement intéresantes, parce qu’elles utilisent une information globale sur la structure de la phrase. Une autre contribution conséquente, relative au manque de corpus étiquettés dans le domaine de la reconnaissance automatique des ADs, concerne le développement et l’étude de méthodes d’étiquetage semi-automatique de nouveaux corpus. Cette méthode est basée sur l’algorithme d’Espérance-Maximisation avec des ADs prédéfinis spécifiques à la tâche visée. Nous proposons deux mesures de confiance pour sélectionner les exemples qui ont le plus de chance d’être classifiés correctement. Les résultats expérimentaux démontrent que la méthode proposée est une approche intéressante pour la création de nouveaux corpus d’actes de dialogues à moindre coût<br>This thesis deals with automatic Dialogue Act (DA) recognition in Czech and in French. Dialogue acts are sentence-level labels that represent different states of a dialogue, such as questions, statements, hesitations, etc. The first main contribution of this work is to propose and compare several approaches that recognize dialogue acts based on three types of information: lexical, prosodic and word positions. These approaches are tested on the Czech Railways corpus that contains human-human dialogues, which are transcribed both manually and with an automatic speech recognizer for comparison. The experimental results confirmed that every type of feature (lexical, prosodic and word positions) bring relevant and somewhat complementary information. The proposed methods that take into account word positions are especially interesting, as they bring global information about the structure of a sentence, at the opposite of traditional n-gram models that only capture local cues. One of the main issue in the domain of automatic dialogue act recognition concerns the design of a fast and cheap method to label new corpora. The next main contribution is to apply the general semi-supervised training approach based on the Expectation Maximization algorithm to the task of labeling a new corpus with the pre-defined DAs. We further proposed to filter out the examples that might be incorrect by two confidence measures, namely the maximum a posteriori probability and the a posteriori probability difference methods. Experimental results showed that the proposed method is an efficient approach to create new dialogue act corpora at low costs
APA, Harvard, Vancouver, ISO, and other styles
12

Bouillon, Manuel. "Apprentissage actif en-ligne d'un classifieur évolutif, application à la reconnaissance de commandes gestuelles." Thesis, Rennes, INSA, 2016. http://www.theses.fr/2016ISAR0019/document.

Full text
Abstract:
L'utilisation de commandes gestuelles est une nouvelle méthode d'interaction sur interface tactile. Une bonne méthode pour faciliter la mémorisation de ces commandes gestuelles est de laisser l'utilisateur les personnaliser. Ce contexte applicatif induit une situation d'apprentissage croisé, où l'utilisateur doit mémoriser le jeu de symboles elle système doit apprendre à reconnaître les différents symboles. Cela implique un certain nombre de contraintes, à la fois sur le système de reconnaissance de symboles ct sur le système de supervision de son apprentissage. Il faut par exemple que le classifieur puisse apprendre à partir de peu de données, continuer à apprendre pendant son utilisation et suivre toute évolution des données indéfiniment. Le superviseur doit quant à lui optimiser la coopération entre l'utilisateur et le système de reconnaissance pour minimiser les interactions tout en maximisant l'apprentissage. Cette thèse présente d'une part, le système d'apprentissage évolutif Evolve oo, capable d'apprendre rapidement il partir de peu de données et de suivre les changements de concepts. D'autre part, elle introduit le superviseur actif en-ligne lntuiSup qui permet d'optimiser la coopération entre le système et l'utilisateur, lors de l'utilisation de commandes gestuelles personnalisées notamment Evolve oo est un système d'inférence floue, capable d'apprendre rapidement grâce aux capacités génératrices des prémisses des règles, tout en permettant d'obtenir une précision élevée grâce aux capacités discriminantes des conclusions d'ordre un. L'intégration d'oubli dans le processus d'apprentissage permet de maintenir le gain de l'apprentissage indéfiniment, permettant ainsi l'ajout de classes à n'importe quel moment de l'utilisation du système ct garantissant son évolutivité « à vie». Le superviseur actif en-ligne lntuiSup permet d'optimiser les interactions avec l'utilisateur pour entraîner un système d'apprentissage lorsque l'utilisateur est dans la boucle. Il permet de faire évoluer la proportion de données que l'utilisateur doit étiqueter en fonction de la difficulté du problème et de l'évolution de l'environnement (changements de concepts). L'utilisation d'une méthode de« dopage» de l'apprentissage permet d'optimiser la répartition de ces interactions avec l'utilisateur pour maximiser leur impact sur l'apprentissage<br>Using gesture commands is a new way of interacting with touch sensitive interfaces. In order to facilitate user memorization of several commands, it is essential to let the user customize the gestures. This applicative context gives rise to a crosslearning situation, where the user has to memorize the set of commands and the system has to learn and recognize the different gestures. This situation implies several requirements, from the recognizer and from the system that supervizes its learning process. For instance, the recognizer has to be able to learn from few data samples, to keep learning during its use and to follow indefinitely any change of the data now. The supervisor has to optimize the cooperation between the recognizer and the system to minimize user interactions while maximizing recognizer learning. This thesis presents on the one hand the evolving recognition system Evolve oo, that is capable of fast teaming from few data samples, and that follows concept drifts. On the other hand, this thesis also presents the on line active supervisor lntuiSup, that optimizes user-system cooperation when the user is in the training loop, as during customized gesture command use for instance. The evolving classifier Evolve oo is a fuzzy inference system that is fast learning thanks to the generative capacity of rule premises, and at the same time giving high precision thanks to the discriminative capacity of first order rule conclusion. The use of forgetting in the learning process allows to maintain the learning gain indefinitely, enabling class adding at any stage of system learning, and guaranteeing lifelong evolving capacity. The on line active supervisor IntuiSup optimizes user interactions to train a classifier when the user is in the training loop. The proportion of data that is labeled by the user evolves to adapt to problem difficulty and to follow environment evolution (concept drift s). The use of a boosting method optimizes the timing of user interactions to maximize their impact on classifier learning process
APA, Harvard, Vancouver, ISO, and other styles
13

Fernandez, Jonathan. "Favoriser un apprentissage actif : Effets des tests d’entraînement sur les processus cognitifs et métacognitifs." Thesis, Rennes 2, 2017. http://www.theses.fr/2017REN20047/document.

Full text
Abstract:
Il est aujourd’hui reconnu que la réussite des étudiants à l’université repose sur leurs capacités à autoréguler leur apprentissage, c’est-à-dire à 1) fixer des objectifs adaptés à la tâche, 2) déployer des stratégies d’apprentissage efficaces et 3) vérifier régulièrement si ces objectifs ont été atteints. Or, lorsqu’ils apprennent des documents complexes, ceux-ci ont tendance à traiter passivement l’information et à surestimer la qualité de leur apprentissage. Cette thèse vise à déterminer si le fait d’insérer des tests d’entraînement au sein d’un document multimédia amène les étudiants à traiter plus activement les informations. Pour ce faire, nous avons réalisé quatre expériences au cours desquelles des étudiants recevaient ou non des tests d’entraînement pendant qu’ils apprenaient un cours de neurosciences. Afin d’évaluer les effets des tests sur l’activité cognitive et métacognitive des participants, nous avons combiné un questionnaire d’estimation de l’apprentissage à un protocole de verbalisation. Nos résultats montrent que les participants qui bénéficient de tests estiment plus précisément la qualité de leur apprentissage et obtiennent de meilleures performances que les participants non testés. Par ailleurs, ces meilleures performances s’expliquent par un déploiement de stratégies d’apprentissage plus adaptées à l’exigence de la tâche. Enfin, ces effets bénéfiques disparaissent lorsque l’exigence des tests d’entraînement diffère de celles de l’évaluation finale. L’ensemble de nos résultats permet de mieux comprendre les mécanismes sous-tendant l’effet des tests sur l’apprentissage ainsi que d’identifier les conditions qui favorisent leur efficacité<br>It is generally accepted that students need to effectively self-regulate their learning to succeed in university, that is to 1) establish appropriate goals, 2) use effective learning strategies and 3) frequently monitor if their goals have been met. Unfortunately, when students learn complex document, they tend to process the information in a passive way and be overconfident regarding the quality of their learning. The purpose of this thesis is to study if inserting regular practice tests in a multimedia document can promote a more active learning. To pursue this thesis’ aim, four experiments were conducted whereby students were exposed to a neuroscience course and were provided with or not, different types of practice tests. We used a judgment of learning questionnaire and a think aloud protocol to assess the impact of practices tests on cognitive and metacognitive processes. Results showed that, compared with control groups, participants in the practice testing groups were significantly less overconfident in their ability to recall recently learned information and performed better on a post-test questionnaire. Furthermore, enhanced learning performance was explained by the use of more efficient learning strategies. However, when test requirement mismatched those of the final test, practice tests brought none of these beneficial effects and was therefore unhelpful for students learning. Overall, the studies’ results gave us a better insight into the psychological mechanism underlying the testing effect on learning and identify the conditions that favor it
APA, Harvard, Vancouver, ISO, and other styles
14

Cherdieu, Mélaine. "Effet du sommeil sur un apprentissage implicite : transfert vers une mémoire explicite ?" Thesis, Lyon 2, 2014. http://www.theses.fr/2014LYO20061/document.

Full text
Abstract:
De nombreuses études ses sont intéressées à l’influence du sommeil sur la mémoire. Une période de sommeil comparée à une période d’éveil permet de réduire l’oubli, d’améliorer les performances mais également de réorganiser les traces mnésiques, favorisant ainsi la créativité et l’extraction de règles. Ces études se basent sur les modèles classiques de la mémoire et expliquent ces observations par une interaction entre les processus implicites et explicites au cours du sommeil. Cependant, les modèles classiques de la mémoire semblent limités pour décrire la totalité des processus de réorganisation des traces mnésiques observés après une période de sommeil. Dans ce travail de thèse, nous avons tenté de comprendre l’influence du sommeil sur la réorganisation des traces à travers le modèle Act-In, un modèle de mémoire à traces multiples se plaçant dans la lignée de la cognition incarnée.Nous avons développé notre recherche autour de quatre axes expérimentaux. Dans un premier temps nous souhaitions vérifier si une période de sommeil permet de transformer passivement une trace implicite en trace explicite. Nous souhaitions par la suite étudier l’effet du sommeil sur les processus d’intégration multi-composants et d’activation inter-traces. Selon nous, le sommeil permettrait de renforcer l’intégration des composants au sein d’une trace et il permettrait également de favoriser la mise en relation de plusieurs traces, conduisant à l’émergence d’éléments communs. Enfin, dans le dernier axe de ce travail de recherche, nous nous sommes intéressés aux conséquences des modifications nocturnes liées à l’âge sur la consolidation mnésique au cours du sommeil<br>Numerous studies have been interested in the effect of sleep on memory. For instance, a period of sleep as compared to a similar period of wakefulness protects memories from interferences, improves performances, but also reorganizes memory traces favoring creativity and rules extraction. These studies are based on classical memory models and explain these observations by an interaction between implicit and explicit processes. However, these models seem to be limited to describe all the processes involved in memory reorganization. In this thesis, we tried to understand the influence of sleep on memory reorganization within Act-In memory model, a multiple traces memory model in the line of grounded cognition. We developed our research within four experimental axes. First of all, we wanted to verify if sleep could transform an implicit trace into an explicit one. We also wanted to study the effect of sleep on multi-components integration and inter-traces activation. We assumed that sleep could transform memory traces enhancing the integration of the trace components and could favor the link between different traces leading to the emergence of common elements. Finally, we were interested in the consequences of nocturnal modifications during aging on memory consolidation
APA, Harvard, Vancouver, ISO, and other styles
15

Bouguelia, Mohamed-Rafik. "Classification et apprentissage actif à partir d'un flux de données évolutif en présence d'étiquetage incertain." Thesis, Université de Lorraine, 2015. http://www.theses.fr/2015LORR0034/document.

Full text
Abstract:
Cette thèse traite de l’apprentissage automatique pour la classification de données. Afin de réduire le coût de l’étiquetage, l’apprentissage actif permet de formuler des requêtes pour demander à un opérateur d’étiqueter seulement quelques données choisies selon un critère d’importance. Nous proposons une nouvelle mesure d’incertitude qui permet de caractériser l’importance des données et qui améliore les performances de l’apprentissage actif par rapport aux mesures existantes. Cette mesure détermine le plus petit poids nécessaire à associer à une nouvelle donnée pour que le classifieur change sa prédiction concernant cette donnée. Nous intégrons ensuite le fait que les données à traiter arrivent en continu dans un flux de longueur infinie. Nous proposons alors un seuil d’incertitude adaptatif qui convient pour un apprentissage actif à partir d’un flux de données et qui réalise un compromis entre le nombre d’erreurs de classification et le nombre d’étiquettes de classes demandées. Les méthodes existantes d’apprentissage actif à partir de flux de données, sont initialisées avec quelques données étiquetées qui couvrent toutes les classes possibles. Cependant, dans de nombreuses applications, la nature évolutive du flux fait que de nouvelles classes peuvent apparaître à tout moment. Nous proposons une méthode efficace de détection active de nouvelles classes dans un flux de données multi-classes. Cette méthode détermine de façon incrémentale une zone couverte par les classes connues, et détecte les données qui sont extérieures à cette zone et proches entre elles, comme étant de nouvelles classes. Enfin, il est souvent difficile d’obtenir un étiquetage totalement fiable car l’opérateur humain est sujet à des erreurs d’étiquetage qui réduisent les performances du classifieur appris. Cette problématique a été résolue par l’introduction d’une mesure qui reflète le degré de désaccord entre la classe donnée manuellement et la classe prédite et une nouvelle mesure d’"informativité" permettant d’exprimer la nécessité pour une donnée mal étiquetée d’être réétiquetée par un opérateur alternatif<br>This thesis focuses on machine learning for data classification. To reduce the labelling cost, active learning allows to query the class label of only some important instances from a human labeller.We propose a new uncertainty measure that characterizes the importance of data and improves the performance of active learning compared to the existing uncertainty measures. This measure determines the smallest instance weight to associate with new data, so that the classifier changes its prediction concerning this data. We then consider a setting where the data arrives continuously from an infinite length stream. We propose an adaptive uncertainty threshold that is suitable for active learning in the streaming setting and achieves a compromise between the number of classification errors and the number of required labels. The existing stream-based active learning methods are initialized with some labelled instances that cover all possible classes. However, in many applications, the evolving nature of the stream implies that new classes can appear at any time. We propose an effective method of active detection of novel classes in a multi-class data stream. This method incrementally maintains a feature space area which is covered by the known classes, and detects those instances that are self-similar and external to that area as novel classes. Finally, it is often difficult to get a completely reliable labelling because the human labeller is subject to labelling errors that reduce the performance of the learned classifier. This problem was solved by introducing a measure that reflects the degree of disagreement between the manually given class and the predicted class, and a new informativeness measure that expresses the necessity for a mislabelled instance to be re-labeled by an alternative labeller
APA, Harvard, Vancouver, ISO, and other styles
16

Krithara, Anastasia. "Learning aspect models with partially labeled data." Paris 6, 2008. http://www.theses.fr/2008PA066059.

Full text
Abstract:
L'apprentissage automatique a été utilisé pour diverses tâches d'accès à l'information, tels que la catégorisation, le clustering ou l'extraction d'information. Acquérir les données annotées nécessaires pour appliquer les techniques d'apprentissage supervisé est un défi majeur pour cesapplications, en particulier pour les très grandes collections. Au coursdes dernières années, deux grandes approches ont été explorées dans cesens, l'apprentissage semi-supervisé et l'apprentissage actif. Les deuxparadigmes abordent la question du coût d'annotation, mais de deux pointsde vue différents. D'une part, apprentissage semi-supervisé essaied'apprendre en tenant compte à la fois des données annotées etnon-annotées. D'autre part, l'apprentissage actif tente de trouver lesmeilleurs exemples à annoter, afin de réduire au minimum le nombre d'exemples annotés nécessaire. Dans ce travail, nous étudions des extensions de modèles d'aspect pour la tâche de la classification, où les données sont partiellement annotées.
APA, Harvard, Vancouver, ISO, and other styles
17

Nguyen, Sao Mai. "Un robot curieux pour l'apprentissage actif par babillage d'objectifs : choisir de manière stratégique quoi, comment, quand et de qui apprendre." Phd thesis, Université Sciences et Technologies - Bordeaux I, 2013. http://tel.archives-ouvertes.fr/tel-00977385.

Full text
Abstract:
Les défis pour voir des robots opérant dans l'environnement de tous les jours des humains et sur unelongue durée soulignent l'importance de leur adaptation aux changements qui peuvent être imprévisiblesau moment de leur construction. Ils doivent être capable de savoir quelles parties échantillonner, et quelstypes de compétences il a intérêt à acquérir. Une manière de collecter des données est de décider par soi-même où explorer. Une autre manière est de se référer à un mentor. Nous appelons ces deux manièresde collecter des données des modes d'échantillonnage. Le premier mode d'échantillonnage correspondà des algorithmes développés dans la littérature pour automatiquement pousser l'agent vers des partiesintéressantes de l'environnement ou vers des types de compétences utiles. De tels algorithmes sont appelésdes algorithmes de curiosité artificielle ou motivation intrinsèque. Le deuxième mode correspond au guidagesocial ou l'imitation, où un partenaire humain indique où explorer et où ne pas explorer.Nous avons construit une architecture algorithmique intrinsèquement motivée pour apprendre commentproduire par ses actions des effets et conséquences variées. Il apprend de manière active et en ligne encollectant des données qu'il choisit en utilisant plusieurs modes d'échantillonnage. Au niveau du metaapprentissage, il apprend de manière active quelle stratégie d'échantillonnage est plus efficace pour améliorersa compétence et généraliser à partir de son expérience à un grand éventail d'effets. Par apprentissage parinteraction, il acquiert de multiples compétences de manière structurée, en découvrant par lui-même lesséquences développementale.
APA, Harvard, Vancouver, ISO, and other styles
18

Baskiotis, Nicolas. "Evaluation d'algorithmes pour et par l'apprentissage." Paris 11, 2008. http://www.theses.fr/2008PA112275.

Full text
Abstract:
Une des principales difficultés concernant les applications issues de l’apprentissage automatique est le choix a priori de l’algorithme susceptible de fournir les meilleures performances en termes de classification. Nos travaux se sont inspirés des recherches dans le domaine de l’optimisation combinatoire portant sur la notion de transition de phase pour proposer une approche duale au traitement usuel de ce problème par le méta-apprentissage. Notre objectif est d’établir une carte de compétence d’un système d’apprentissage selon des descripteurs sur l’espace des problèmes, permettant d’identifier les régimes dans lesquels les performances du système sont stables. Nous illustrons notre approche sur le système C4. 5. La deuxième partie de nos travaux concerne les problèmes d’apprentissage posés par le test logiciel, plus précisément par une méthode de test statistique structurel de logiciel, utilisant l’échantillonnage de chemins dit faisables dans le graphe de contrôle du programme à tester. Dans certains cas, la fraction de chemins faisables est très faible, pénalisant cette méthode. Notre objectif est de proposer un système d’apprentissage et d’optimisation permettant de construire un générateur aléatoire biaisé vers les chemins faisables et garantissant un bon échantillonage du concept cible. Nous proposons le système MLST réalisant de l’apprentissage actif dans un graphe. Nos travaux ont été évalués à la fois sur des problèmes réels et artificiels montrant un gain significatif en termes de couverture des concepts cibles par rapport aux données initiales<br>One of the main concerns involving machine learning applications is the a priori choice of an algorithm likely to yield the best classification performances. Our work is inspired by research in combinatorial optimisation on the phase transition problem. We suggest a dual approach to the standard view on this problem through metaleraning. Our goal is to build a competence map according to descriptors on the problem space which enables to identify the regimes where the system’s performance are steady. We assess this approach on C 4. 5. The second part of our work deals with machine learning problems in software testing. More precisely, we study a statistical structural method of software testing that uses the sampling of the so-called feasible paths in the control graph of the problems that is to be tested. In certain cases, the portion of feasible paths is very low, which hinders this method. Our goal is to design a learning and optimisation system that yields a random generator biaised towards the feasible paths and that warrantees a suitable sampling of the target concept. We designed the MLST system that implements active learning in a graph. We tested our work on both real and artificial problems and showed that our system achieves significantly improvement regarding the coverage of target concepts with respect to the initial data
APA, Harvard, Vancouver, ISO, and other styles
19

Contardo, Gabriella. "Machine learning under budget constraints." Thesis, Paris 6, 2017. http://www.theses.fr/2017PA066203/document.

Full text
Abstract:
Cette thèse propose de s'intéresser au problème de la prédiction en apprentissage statistique sous contrainte de coût, notamment du coût de l'information utilisée par le système de prédiction. Les approches classiques d'apprentissage statistique utilisent généralement le seul aspect de la performance en prédiction pour évaluer la qualité d'un modèle, ignorant le coût potentiel du modèle, par exemple en quantité de données utilisées en apprentissage (nombre d'exemples, nombre d'étiquette, mémoire) ou en inférence (quantité de features -ou caractéristiques-). Nous proposons plus particulièrement dans ce manuscrit plusieurs approches pour l'inférence sous contrainte de coût en terme de caractéristiques. Nous développons trois modèles qui intègrent pendant l'apprentissage une notion du coût de l'information utilisée pour la prédiction, avec pour objectif de contraindre le coût de la prédiction en inférence. Nous présentons un modèle de sélection de features appliqué au démarrage à froid en recommendation, puis deux méthodes adaptatives d'acquisition de caractéristiques, qui permettent un meilleur compromis coût/prédiction, dans un cadre plus général. Nous utilisons des méthodes d'apprentissage de représentations avec des architectures type réseau de neurones récurrents et des algorithmes par descente de gradient pour l'apprentissage. La dernière partie du manuscrit s'intéresse au coût lié aux étiquettes, usuellement dénommé apprentissage actif dans la littérature. Nous présentons nos travaux pour une approche nouvelle de ce problème en utilisant le méta-apprentissage ainsi qu'une première instanciation basée sur des réseaux récurrents bi-directionnels<br>This thesis studies the problem of machine learning under budget constraints, in particular we propose to focus on the cost of the information used by the system to predict accurately. Most methods in machine learning usually defines the quality as the performance (e.g accuracy) on the task at hand, but ignores the cost of the model itself: for instance, the number of examples and/or labels needed during learning, the memory used, or the number of features required to predict at test-time. We propose more specifically in this manuscript several methods for cost-sensitive prediction w.r.t. the quantity of features used. We present three models that learn to predict under such constraint, i.e that learn a strategy to gather only the necessary information in order to predict well but with a small cost. The first model is a static approach applied on cold-start recommendation. We then define two adaptive methods that allow for a better trade-off between cost and accuracy, in a more generic setting. We rely on representation learning techniques, along with recurrent neural networks architecture and gradient descent algorithms for learning. In the last part of the thesis, we propose to study the problem of active-learning, where one aims at constraining the amount of labels used to train a model. We present our work for a novel approach of the problem using meta-learning, with an instantiation using bi-directional recurrent neural networks
APA, Harvard, Vancouver, ISO, and other styles
20

Mezine, Adel. "Conduite d'expériences par apprentissage actif pour l'identification de systèmes dynamiques biologiques : application à l'estimation de paramètres d'équations différentielles ordinaires." Thesis, Université Paris-Saclay (ComUE), 2016. http://www.theses.fr/2016SACLE030/document.

Full text
Abstract:
Ces dernières années, les progrès continuels des techniques de criblage et de séquençage à haut débit ont nourri la biologie des systèmes, ouvrant la voie à l’identification de systèmes dynamiques biologiques tels que des réseaux de régulation génique. Cependant, l’insuffisance et la mauvaise qualité des données expérimentales se traduisent trop souvent par des estimations incertaines des paramètres d’intérêt des systèmes étudiés : ces incertitudes peuvent être levées en produisant de nouvelles données dans des conditions expérimentales variées, ce qui implique un coût potentiellement élevé. Dans cette thèse, nous proposons un nouvel algorithme d’apprentissage actif, destiné à recommander de manière séquentielle les expériences les plus utiles à l’identification de systèmes dynamiques biologiques modélisés par des équations différentielles. Le problème est formulé sous la forme d’un jeu à un joueur : le joueur se voit attribuer un budget dédié aux expérimentations, et un coût spécifique est affecté à chaque expérience ; à chaque tour, il est amené à choisir une, voire plusieurs expériences réalisées sur le système étudié dans le but de maximiser la qualité de l’estimation, une fois le budget épuisé. Notre approche, intitulée « ExperimentalDEsign for Network inference » (EDEN), s’appuie sur la classe d’algorithme UCT (Upper Confidence bounds for Trees search) qui allie la souplesse de la recherche arborescente de Monte-Carlo à l’efficacité des algorithmes de bandits multi-bras pour parcourir l’ensemble des séquences d’expériences possibles en privilégiant surtout celles qui sont les plus prometteuses. EDEN présente le grand avantage d’anticiper les expériences suivantes en sélectionnant à chaque tour des expériences sachant qu’elles seront suivies par un certain nombre d’autres expériences. Illustrée sur deux cas d’étude, le réseau de signalisation JAK/STAT et un des réseaux de régulation génique proposé dans la compétition internationale DREAM7, EDEN, entièrement automatique, obtient de très bonnes performances pour un budget limité et un large choix d’expériences (perturbations, mesures)<br>Continuous progress in screening and high-throughput sequencing techniques in recent years paves the way for the identification of dynamic biological systems such as gene regulatory networks. However, the scarcity of the experimental data often leads to anuncertain estimation of parameters of interest. These uncertainties can be solved by generating new data in different experimental conditions, which induces additional costs. This thesis proposes a general active learning approach to develop tools of sequential experimental design for the identification of dynamical biological systems. The problem is formulated as a one-player game : the player has a budget dedicated for his experiments, each experiment has a different cost ; at every turn, he chooses one or more experiments to be performed on the system with the ultimate aim of maximizing the quality of the estimate, until the available budget is exhausted. The proposed approach called Experimental DEsign for Network inference (EDEN), is based on UCT (Upper Confident bounds for Trees) algorithm which combines Monte-Carlo tree search algorithms with multi-arm bandits to perform an effective exploration of the possible sequences of experiments. A strong point of the approach is anticipation : an experiment is selected at each round, knowing that this round will be followed by a number of other experiments, according to the available budget. This generic approach is rolled out in parameter estimation in nonlinear ordinary differential equations using partial observations. EDEN is applied on two problems : signaling network and gene regulatory network identification. Compared to the competitors, it exhibits very good results on a DREAM7 challenge where a limited budget and a wide range of experiments (perturbations, measurements) are available
APA, Harvard, Vancouver, ISO, and other styles
21

Aklil, Nassim. "Apprentissage actif sous contrainte de budget en robotique et en neurosciences computationnelles. Localisation robotique et modélisation comportementale en environnement non stationnaire." Thesis, Paris 6, 2017. http://www.theses.fr/2017PA066225/document.

Full text
Abstract:
La prise de décision est un domaine très étudié en sciences, que ce soit en neurosciences pour comprendre les processus sous tendant la prise de décision chez les animaux, qu’en robotique pour modéliser des processus de prise de décision efficaces et rapides dans des tâches en environnement réel. En neurosciences, ce problème est résolu online avec des modèles de prises de décision séquentiels basés sur l’apprentissage par renforcement. En robotique, l’objectif premier est l’efficacité, dans le but d’être déployés en environnement réel. Cependant en robotique ce que l’on peut appeler le budget et qui concerne les limitations inhérentes au matériel, comme les temps de calculs, les actions limitées disponibles au robot ou la durée de vie de la batterie du robot, ne sont souvent pas prises en compte à l’heure actuelle. Nous nous proposons dans ce travail de thèse d’introduire la notion de budget comme contrainte explicite dans les processus d’apprentissage robotique appliqués à une tâche de localisation en mettant en place un modèle basé sur des travaux développés en apprentissage statistique qui traitent les données sous contrainte de budget, en limitant l’apport en données ou en posant une contrainte de temps plus explicite. Dans le but d’envisager un fonctionnement online de ce type d’algorithmes d’apprentissage budgétisé, nous discutons aussi certaines inspirations possibles qui pourraient être prises du côté des neurosciences computationnelles. Dans ce cadre, l’alternance entre recherche d’information pour la localisation et la décision de se déplacer pour un robot peuvent être indirectement liés à la notion de compromis exploration-exploitation. Nous présentons notre contribution à la modélisation de ce compromis chez l’animal dans une tâche non stationnaire impliquant différents niveaux d’incertitude, et faisons le lien avec les méthodes de bandits manchot<br>Decision-making is a highly researched field in science, be it in neuroscience to understand the processes underlying animal decision-making, or in robotics to model efficient and rapid decision-making processes in real environments. In neuroscience, this problem is resolved online with sequential decision-making models based on reinforcement learning. In robotics, the primary objective is efficiency, in order to be deployed in real environments. However, in robotics what can be called the budget and which concerns the limitations inherent to the hardware, such as computation times, limited actions available to the robot or the lifetime of the robot battery, are often not taken into account at the present time. We propose in this thesis to introduce the notion of budget as an explicit constraint in the robotic learning processes applied to a localization task by implementing a model based on work developed in statistical learning that processes data under explicit constraints, limiting the input of data or imposing a more explicit time constraint. In order to discuss an online functioning of this type of budgeted learning algorithms, we also discuss some possible inspirations that could be taken on the side of computational neuroscience. In this context, the alternation between information retrieval for location and the decision to move for a robot may be indirectly linked to the notion of exploration-exploitation compromise. We present our contribution to the modeling of this compromise in animals in a non-stationary task involving different levels of uncertainty, and we make the link with the methods of multi-armed bandits
APA, Harvard, Vancouver, ISO, and other styles
22

Nguyen, Sao Mai. "Un robot curieux pour l’apprentissage actif par babillage d’objectifs : choisir de manière stratégique quoi, comment, quand et de qui apprendre." Thesis, Bordeaux 1, 2013. http://www.theses.fr/2013BOR15223/document.

Full text
Abstract:
Les défis pour voir des robots opérant dans l’environnement de tous les jours des humains et sur unelongue durée soulignent l’importance de leur adaptation aux changements qui peuvent être imprévisiblesau moment de leur construction. Ils doivent être capable de savoir quelles parties échantillonner, et quelstypes de compétences il a intérêt à acquérir. Une manière de collecter des données est de décider par soi-même où explorer. Une autre manière est de se référer à un mentor. Nous appelons ces deux manièresde collecter des données des modes d’échantillonnage. Le premier mode d’échantillonnage correspondà des algorithmes développés dans la littérature pour automatiquement pousser l’agent vers des partiesintéressantes de l’environnement ou vers des types de compétences utiles. De tels algorithmes sont appelésdes algorithmes de curiosité artificielle ou motivation intrinsèque. Le deuxième mode correspond au guidagesocial ou l’imitation, où un partenaire humain indique où explorer et où ne pas explorer.Nous avons construit une architecture algorithmique intrinsèquement motivée pour apprendre commentproduire par ses actions des effets et conséquences variées. Il apprend de manière active et en ligne encollectant des données qu’il choisit en utilisant plusieurs modes d’échantillonnage. Au niveau du metaapprentissage, il apprend de manière active quelle stratégie d’échantillonnage est plus efficace pour améliorersa compétence et généraliser à partir de son expérience à un grand éventail d’effets. Par apprentissage parinteraction, il acquiert de multiples compétences de manière structurée, en découvrant par lui-même lesséquences développementale<br>The challenges posed by robots operating in human environments on a daily basis and in the long-termpoint out the importance of adaptivity to changes which can be unforeseen at design time. The robot mustlearn continuously in an open-ended, non-stationary and high dimensional space. It must be able to knowwhich parts to sample and what kind of skills are interesting to learn. One way is to decide what to exploreby oneself. Another way is to refer to a mentor. We name these two ways of collecting data sampling modes.The first sampling mode correspond to algorithms developed in the literature in order to autonomously drivethe robot in interesting parts of the environment or useful kinds of skills. Such algorithms are called artificialcuriosity or intrinsic motivation algorithms. The second sampling mode correspond to social guidance orimitation where the teacher indicates where to explore as well as where not to explore. Starting fromthe study of the relationships between these two concurrent methods, we ended up building an algorithmicarchitecture with a hierarchical learning structure, called Socially Guided Intrinsic Motivation (SGIM).We have built an intrinsically motivated active learner which learns how its actions can produce variedconsequences or outcomes. It actively learns online by sampling data which it chooses by using severalsampling modes. On the meta-level, it actively learns which data collection strategy is most efficient forimproving its competence and generalising from its experience to a wide variety of outcomes. The interactivelearner thus learns multiple tasks in a structured manner, discovering by itself developmental sequences
APA, Harvard, Vancouver, ISO, and other styles
23

Szilas, Nicolas. "Apprentissage dans les réseaux récurrents pour la modélisation mécanique et étude de leurs interactions avec l'environnement." Phd thesis, Grenoble INPG, 1995. http://tel.archives-ouvertes.fr/tel-00345820.

Full text
Abstract:
Issus d'une analogie avec les réseaux de neurones biologiques du cerveau, les réseaux récurrents sont utilisés pour modéliser des comportements dynamiques complexes et pour reproduire - apprendre - ces comportements. Les propriétés adaptatives de ces réseaux peuvent être exploitées par les réseaux de modélisation physique de phénomènes vibratoires dédiés à la simulation informatique d'instruments de musique. Ces réseaux de modélisation mécanique possèdent des paramètres d'inertie, d'élasticité et de viscosité que l'on souhaite déterminer automatiquement dans le but de reproduire un comportement physique donné ; cette détermination est possible grâce aux réseaux récurrents. Nous développons ainsi un certain nombre d'algorithmes de réseaux de modélisation physique adaptatifs et proposons des algorithmes originaux, inspirés de modèles mécaniques. En particulier, ce travail aborde la notion d'interaction avec l'environnement dans ce type de réseaux, et plus généralement dans les réseaux connexionnistes supervisés. A travers plusieurs expériences, nous montrons que, sous certaines conditions, l'interaction avec l'environnement permet la réussite de l'apprentissage, en particulier si cette interaction autorise un apprentissage à complexité progressive. De plus, nous établissons des rapprochements entre ce type d'apprentissage et certains apprentissages humains. Cela nous amène à poser les bases d'un système d'identification de paramètres pour la modélisation d'instruments de musique. Ce système fait interagir en temps réel un instrumentiste, un instrument de musique et un ordinateur simulant le modèle adaptatif
APA, Harvard, Vancouver, ISO, and other styles
24

Tantini, Frédéric. "Inférence grammaticale en situations bruitées." Phd thesis, Université Jean Monnet - Saint-Etienne, 2009. http://tel.archives-ouvertes.fr/tel-00411616.

Full text
Abstract:
L'inférence grammaticale s'intéresse à l'apprentissage automatique de langages formels. Ces derniers sont organisés en plusieurs classes formant la hiérarchie de Chomsky. Parmi elles, les langages réguliers, reconnus par des automates finis déterministes, forment la classe la plus « simple » à apprendre : l'apprentissage des automates a largement été étudié et a donné naissance à plusieurs algorithmes d'inférence grammaticale.<br /><br />Toutefois, un problème concernant les données est devenu crucial : celui du bruit. Des propositions d'algorithmes ont vu le jour pour essayer de résoudre ce problème, mais nous montrons que les résultats ne sont toujours pas satisfaisants, y compris pour les langages réguliers. Or, puisqu'ils forment la base de la hiérarchie de Chomsky, ce sont toutes les classes de la hiérarchie qui ne peuvent être apprises en situations bruitées.<br /><br />Aussi, nous proposons une nouvelle classe de langages qui semble ne pas souffrir de ce handicap : celle des boules de mots. Nous démontrons que cette classe, de prime abord peu orthodoxe mais utilisée dans de nombreuses applications comme la correction orthographique ou la recherche de plus proches voisins, reste identifiable à la limite même lorsque les données d'apprentissage subissent l'influence d'un bruit non statistique.<br /><br />De plus, nous introduisons les requêtes de correction basées sur la distance d'édition et nous présentons un algorithme d'apprentissage des boules de mots à partir de telles requêtes. Nous montrons expérimentalement que de simples heuristiques a posteriori suffisent à le rendre résistant lorsque l'oracle répond approximativement à de telles requêtes. Ceci justifie encore une<br />fois la robustesse des boules de mots au bruit.<br /><br />Contrairement aux idées reçues, le bruit n'est donc pas une malédiction en inférence grammaticale : les langages à base de distance offrent de nouvelles perspectives.
APA, Harvard, Vancouver, ISO, and other styles
25

Chen, Yuxin. "Apprentissage interactif de mots et d'objets pour un robot humanoïde." Thesis, Université Paris-Saclay (ComUE), 2017. http://www.theses.fr/2017SACLY003/document.

Full text
Abstract:
Les applications futures de la robotique, en particulier pour des robots de service à la personne, exigeront des capacités d’adaptation continue à l'environnement, et notamment la capacité à reconnaître des nouveaux objets et apprendre des nouveaux mots via l'interaction avec les humains. Bien qu'ayant fait d'énormes progrès en utilisant l'apprentissage automatique, les méthodes actuelles de vision par ordinateur pour la détection et la représentation des objets reposent fortement sur de très bonnes bases de données d’entrainement et des supervisions d'apprentissage idéales. En revanche, les enfants de deux ans ont une capacité impressionnante à apprendre à reconnaître des nouveaux objets et en même temps d'apprendre les noms des objets lors de l'interaction avec les adultes et sans supervision précise. Par conséquent, suivant l'approche de le robotique développementale, nous développons dans la thèse des approches d'apprentissage pour les objets, en associant leurs noms et leurs caractéristiques correspondantes, inspirées par les capacités des enfants, en particulier l'interaction ambiguë avec l’homme en s’inspirant de l'interaction qui a lieu entre les enfants et les parents.L'idée générale est d’utiliser l'apprentissage cross-situationnel (cherchant les points communs entre différentes présentations d’un objet ou d’une caractéristique) et la découverte de concepts multi-modaux basée sur deux approches de découverte de thèmes latents: la Factorisation en Natrices Non-Négatives (NMF) et l'Allocation de Dirichlet latente (LDA). Sur la base de descripteurs de vision et des entrées audio / vocale, les approches proposées vont découvrir les régularités sous-jacentes dans le flux de données brutes afin de parvenir à produire des ensembles de mots et leur signification visuelle associée (p.ex le nom d’un objet et sa forme, ou un adjectif de couleur et sa correspondance dans les images). Nous avons développé une approche complète basée sur ces algorithmes et comparé leur comportements face à deux sources d'incertitudes: ambiguïtés de références, dans des situations où plusieurs mots sont donnés qui décrivent des caractéristiques d'objets multiples; et les ambiguïtés linguistiques, dans des situations où les mots-clés que nous avons l'intention d'apprendre sont intégrés dans des phrases complètes. Cette thèse souligne les solutions algorithmiques requises pour pouvoir effectuer un apprentissage efficace de ces associations de mot-référent à partir de données acquises dans une configuration d'acquisition simplifiée mais réaliste qui a permis d'effectuer des simulations étendues et des expériences préliminaires dans des vraies interactions homme-robot. Nous avons également apporté des solutions pour l'estimation automatique du nombre de thèmes pour les NMF et LDA.Nous avons finalement proposé deux stratégies d'apprentissage actives: la Sélection par l'Erreur de Reconstruction Maximale (MRES) et l'Exploration Basée sur la Confiance (CBE), afin d'améliorer la qualité et la vitesse de l'apprentissage incrémental en laissant les algorithmes choisir les échantillons d'apprentissage suivants. Nous avons comparé les comportements produits par ces algorithmes et montré leurs points communs et leurs différences avec ceux des humains dans des situations d'apprentissage similaires<br>Future applications of robotics, especially personal service robots, will require continuous adaptability to the environment, and particularly the ability to recognize new objects and learn new words through interaction with humans. Though having made tremendous progress by using machine learning, current computational models for object detection and representation still rely heavily on good training data and ideal learning supervision. In contrast, two year old children have an impressive ability to learn to recognize new objects and at the same time to learn the object names during interaction with adults and without precise supervision. Therefore, following the developmental robotics approach, we develop in the thesis learning approaches for objects, associating their names and corresponding features, inspired by the infants' capabilities, in particular, the ambiguous interaction with humans, inspired by the interaction that occurs between children and parents.The general idea is to use cross-situational learning (finding the common points between different presentations of an object or a feature) and to implement multi-modal concept discovery based on two latent topic discovery approaches : Non Negative Matrix Factorization (NMF) and Latent Dirichlet Association (LDA). Based on vision descriptors and sound/voice inputs, the proposed approaches will find the underlying regularities in the raw dataflow to produce sets of words and their associated visual meanings (eg. the name of an object and its shape, or a color adjective and its correspondence in images). We developed a complete approach based on these algorithms and compared their behavior in front of two sources of uncertainties: referential ambiguities, in situations where multiple words are given that describe multiple objects features; and linguistic ambiguities, in situations where keywords we intend to learn are merged in complete sentences. This thesis highlights the algorithmic solutions required to be able to perform efficient learning of these word-referent associations from data acquired in a simplified but realistic acquisition setup that made it possible to perform extensive simulations and preliminary experiments in real human-robot interactions. We also gave solutions for the automatic estimation of the number of topics for both NMF and LDA.We finally proposed two active learning strategies, Maximum Reconstruction Error Based Selection (MRES) and Confidence Based Exploration (CBE), to improve the quality and speed of incremental learning by letting the algorithms choose the next learning samples. We compared the behaviors produced by these algorithms and show their common points and differences with those of humans in similar learning situations
APA, Harvard, Vancouver, ISO, and other styles
26

Rolet, Philippe. "Éléments pour l'Apprentissage et l'Optimisation de Fonctions Chères." Phd thesis, Université Paris Sud - Paris XI, 2010. http://tel.archives-ouvertes.fr/tel-00551865.

Full text
Abstract:
Ces travaux de doctorat sont centrés sur l'apprentissage artificiel et l'optimisation, c'est à dire la construction de programmes apprenant à identifier un concept, à approximer une fonction ou à trouver un optimum à partir d'exemples de ce concept (ou de points de la fonction). Le contexte applicatif est l'apprentissage et l'optimisation de modèles simplifiés en ingénierie numérique, pour des problèmes industriels pour lesquels les exemples sont coûteux à obtenir. Il est nécessaire d'en utiliser le moins possible pour l'apprentissage; c'est le principe de l'apprentissage actif et de l'optimisation de fonction chères. Mes efforts de recherche ont d'abord porté sur la conception et le développement d'une nouvelle approche de l'apprentissage Actif, fondée sur l'apprentissage par renforcement. Les fondements théoriques de l'approche ont été établis. Parallèlement, l'implémentation d'un logiciel fondé sur cette approche, BAAL, a permis une validation expérimentale (publications: CAP'09, ECML'09). Une extension de cette approche a été réalisée pour l'optimisation de fonction chères (publication: GECCO 2009). La deuxième partie de mon doctorat s'intéresse aux potentiels et aux limites de l'apprentissage actif et de l'optimisation chère d'un point de vue théorique. Une étude des bornes de complexités de l'apprentissage actif par "paquets" a été réalisée (publication: ECML 2010). Dans le domaine de l'optimisation bruitée, des résultats sur le nombre minimal d'exemples nécessaires pour trouver un optimum ont été obtenus (publications: LION 2010, EvoSTAR 2010).
APA, Harvard, Vancouver, ISO, and other styles
27

Lefebvre, Nathalie. "Étude des stratégies utilisées par les étudiantes et les étudiants du programme de génie électrique de l'Université de Sherbrooke en situation d'apprentissage par problèmes." Mémoire, Université de Sherbrooke, 2008. http://savoirs.usherbrooke.ca/handle/11143/633.

Full text
Abstract:
L'apprentissage par problèmes (APP) est une méthode pédagogique innovante utilisée à l'échelle du programme de génie électrique de l'Université de Sherbrooke. La présente recherche vise à identifier les stratégies d'apprentissage et d'étude utilisées par les étudiants de ce programme. Des observations en classe et la passation d'un questionnaire sont les outils méthodologiques qui ont été utilisés dans cette étude. Les objectifs poursuivis impliquent la description des stratégies utilisées par les étudiants lors de trois unités d'APP, en considérant les effets possiblement associés au groupe d'appartenance et aux tuteurs responsables de l'encadrement. Cette recherche vise également à identifier les perceptions des étudiants du programme de génie électrique concernant les stratégies utilisées lors de trois unités d'APP. Cette recherche vise enfin à comparer les perceptions des étudiants quant à l'utilisation de stratégies dans le cadre de la version traditionnelle par rapport aux perceptions des apprenants inscrits dans la version innovante du programme.
APA, Harvard, Vancouver, ISO, and other styles
28

Truong, Nguyen Tuong Vinh. "Apprentissage de fonctions d'ordonnancement avec peu d'exemples étiquetés : une application au routage d'information, au résumé de textes et au filtrage collaboratif." Paris 6, 2009. http://www.theses.fr/2009PA066568.

Full text
Abstract:
Dans ce mémoire, nous nous sommes intéressés à l’apprentissage de fonctions d’ordonnancement avec peu d’exemples étiquetés. Nous avons abordé cette problématique sous deux angles différents. D’une part, nous avons cherché à améliorer les performances en apprentissage supervisé en exploitant l’information contenue dans un grand nombre de données non-étiquetées. Ce cadre est connu sous le nom d’apprentissage semi-supervisé. D’autre part, nous avons considéré l’apprentissage actif, dont le but est d’inclure itérativement les exemples les plus informatifs dans la base d’apprentissage. Dans une première partie de ce mémoire, nous présentons nos modèles développés en apprentissage semi-supervisé et actif pour l’ordonnancement biparti. Nous nous sommes intéressés à des modèles de faible complexité. Dans une deuxième partie, nous validons nos modèles sur les tâches de routage d’information, de résumé automatique de textes et de filtrage collaboratif qui rentrent dans le cadre de notre étude.
APA, Harvard, Vancouver, ISO, and other styles
29

Gazut, Stéphane. "Conception et mise en œuvre de nouvelles méthodes d'élaboration de plans d'expériences pour l'apprentissage de modèles non linéaires." Paris 11, 2007. http://www.theses.fr/2007PA112071.

Full text
Abstract:
Dans le cadre de la simulation numérique, la thèse aborde le problème posé par la construction de modèles simplifiés de codes de calcul généralement complexes et lourds à mettre en oeuvre. La problématique de construction des modèles simplifiés rappelle celle des surfaces de réponse et des plans d’expériences. Dans le cadre de la simulation numérique, les expériences ”lourdes” correspondent aux calculs à réaliser. Il est donc important de disposer de méthodes permettant d’optimiser la planification des expériences simulées. Compte tenu du caractère déterministe des expériences, les méthodes proposées s’appuient sur la théorie de l’apprentissage statistique. Les modèles simplifiés sont construits en utilisant la famille des réseaux de neurones et les techniques statistiques d’estimation de l’erreur de généralisation pour contrôler l’apprentissage (leave-one-out, validation croisée, bootstrap). Il est montré que le bootstrap permet de contrôler le sur-apprentissage et d’étendre la notion de levier (mesure de l’influence des expériences sur l’estimation des paramètres), introduite en régression linéaire, aux modèles non linéaires en les paramètres. La thèse propose une procédure itérative de planification d’expériences numériques. Elle est fondée sur l’apprentissage actif en procédant à la construction de plusieurs modèles simplifiés à partir de répliques bootstrap. Par une approche de type Bagging, la variance des prédictions des modèles est analysée. Les nouvelles simulations sont planifiées de façon à réduire cette variance des prédictions. Cette procédure est comparée aux approches classiques des plans d'expériences optimaux et en particulier avec la D-optimalité<br>This thesis adresses the problem of the construction of surrogate models in numerical simulation. Whenever numerical experiments are costly, the simulation model is complex and difficult to use. It is important then to select the numerical experiments as efficiently as possible in order to minimize their number. In statistics, the selection of experiments is known as optimal experimental design. In the context of numerical simulation where no measurement uncertainty is present, we describe an alternative approach based on statistical learning theory and resampling techniques. The surrogate models are constructed using neural networks and the generalization error is estimated by leave-one-out, cross-validation and bootstrap. It is shown that the bootstrap can control the over-fitting and extend the concept of leverage for non linear in their parameters surrogate models. The thesis describes an iterative method called LDR for Learner Disagreement from experiment Resampling, based on active learning using several surrogate models constructed on bootstrap samples. The method consists in adding new experiments where the predictors constructed from bootstrap samples disagree most. We compare the LDR method with other methods of experimental design such as D-optimal selection
APA, Harvard, Vancouver, ISO, and other styles
30

Baranès, Adrien. "Motivations intrinsèques et contraintes maturationnelles pour l'apprentissage sensorimoteur." Thesis, Bordeaux 1, 2011. http://www.theses.fr/2011BOR14418/document.

Full text
Abstract:
Apprendre de nouvelles connaissances et savoir-faire sensorimoteurs dans des environnements réels entraine un grand nombre de défis majeurs pour les robots d'aujourd'hui. Pour acquérir de nouveaux comportements, ceux-ci ont besoin d'explorer des espaces sensorimoteurs qui possèdent généralement les caractéristiques d'être de grande dimensionnalité, de grands volumes, redondants, et de comporter des zones de complexités différentes. Dans cette thèse qui entre dans le cadre de la robotique développementale, nous proposons différents processus permettant de guider et contraindre une acquisition autonome de comportements sensorimoteurs nouveaux dans de tels espaces. Nous proposons une approche unifiée de résolution de ces problèmes qui prend inspiration des phénomènes de contraintes développementales présentés en biologie et psychologie, et plus particulièrement des motivations intrinsèques et des contraintes maturationnelles. Après la formalisation de cadres computationnels basés sur ces notions, nous présentons trois architectures algorithmiques différentes, chacune réutilisée de manière intégrée dans la suivante:La première, appelée RIAC, pour Robust-Intelligent Adaptive Curiosity, correspond à l'implémentation d'un algorithme d'apprentissage actif développemental permettant d'orienter l'exploration dans des espaces bornés et de dimensionnalité connue, possédant des régions de différents niveaux de complexités. Ce système, qui utilise des heuristiques prenant inspiration des mécanismes de motivations intrinsèques basées sur les connaissances, permet de diriger efficacement une exploration progressive de nouvelles connaissances sensorimotrices, qui correspondent à l'apprentissage de modèles directs. Il entraine aussi l'émergence de trajectoires développementales auto-organisées relatives à l'orientation de l'exploration sensorimotrice vers des activités de complexités intermédiaires.Ensuite, nous proposons l'algorithme SAGG-RIAC, pour Self-Adaptive Goal Generation - RIAC, en tant que mécanisme d'exploration intrinsèquement motivée basée sur les compétences, qui permet à des robots dont les espaces sensorimoteurs sont de grandes dimensions, hautement redondants, et possédant des schémas corporels différents, d'apprendre efficacement et activement de nouveaux comportements moteurs dans leurs espaces de tâches. L'idée principale de cet algorithme est d'orienter le robot à effectuer un babillage actif dans un espace des tâches de faible dimensionnalité, en opposition à un babillage moteur effectué dans un espace de contrôle de plus grande dimension, en auto-générant activement et adaptivement des objectifs dans les régions de l'espace des tâches qui fournissent les meilleures améliorations de compétences, pour l'atteinte d'objectifs précédemment tentés. Enfin, nous introduisons l'algorithme McSAGG-RIAC, pour Maturationally-Constrained SAGG-RIAC, qui repose sur le couplage de modèles computationnels de motivations intrinsèques et de contraintes maturationnelles physiologiques. Nous argumentons que ces mécanismes peuvent avoir des interactions bidirectionnelles complexes permettant le contrôle actif de l'augmentation de la complexité du développement sensorimoteur, afin de diriger une exploration et un apprentissage efficaces. Nous introduisons plus particulièrement un modèle fonctionnel des contraintes maturationnelles inspiré par le processus de myélinisation chez les humains, et montrons comment celui-ci peut être couplé avec l'algorithme SAGG-RIAC. Nous montrons qualitativement et quantitativement que cette approche intégrée des trois architectures présentées pendant cette thèse permet de répondre à certaines des problématiques des environnements réels, en contrôlant la complexité, le volume, la dimensionnalité et la redondance des comportements explorés de manière intrinsèque au robot, diminuant de manière importante la nécessité de contraindre et préparer l'environnement de manière externe<br>Learning new sensorimotor knowledge and know-how in real environments leads to an important number of challenges for today's robots. In order to learn new skills, they need to explore sensorimotor spaces which are generally high-dimensional, high-volume, redundant, and possess areas of heterogenous levels of complexity. In this thesis, introduced within the developmental robotics domain, we propose different processes in order to guide and constrain the autonomous acquisition of new sensorimotor skills in such spaces. We propose an unified approach in order to resolve these problems which takes inspiration from phenomenon of developmental constraints introduced in biology and psychology, and more particularly intrinsic motivations and maturational constraints. After formalizing a computational framework based on these notions, we present three different algorithmic architectures, each one reused in an integrated manner within the next one:The first one, called RIAC, for Robust-Intelligent Adaptive Curiosity, corresponds to the implementation of an active learning algorithm which orients the exploration in bounded spaces whose dimensionality is known and which possess regions of different levels of complexity. This system, which uses heuristics taking inspiration from knowledge based intrinsic motivations mechanisms, effectively directs a progressive exploration of new sensorimotor knowledge, which corresponds to the learning of forward models. It also leads to the emergence of self-organized developmental trajectories related to the orientation of the sensorimotor exploration toward activities of intermediate complexity. Then, we propose the SAGG-RIAC algorithm for Self-Adaptive Goal Generation - RIAC, as a competence based intrinsic motivations exploration mechanism, which allows highly-redundant robots whose sensorimotor spaces are high-dimensional to learn effectively and actively new motor skills in their task spaces. The main idea of this algorithm is to guide the robot to do active babbling in a low-dimensional task space, in contrast with a motor babbling carried out in a higher-dimensional control space, by actively and adaptively self-generating goals in regions of the task space which bring the highest improvement of competences for reaching previously attempted goals.Finally, we introduce the McSAGG-RIAC algorithm for Maturationally-Constrained SAGG-RIAC, which is based on a coupling of computational models of intrinsic motivation and physiological maturational constraints. We argue that these mechanisms may have complex bidirectional interactions allowing the active control of the increase of complexity in the sensorimotor development, in order to direct efficient learning and exploration processes. We introduce more particularly a functional model of maturational constraints inspired by the biological process of myelination, and show how this can be coupled with the SAGG-RIAC algorithm. We show qualitatively and quantitatively that this integrated approach of the three architectures introduced in this thesis answers some problematics raised by real environments, by controlling the complexity, volume, dimensionality and redundancy of skills explored in a manner intrinsic to the robot, thus decreasing in an important extent the necessity of constraining and preparing the environment in en external manner
APA, Harvard, Vancouver, ISO, and other styles
31

Blanchart, Pierre. "Apprentissage rapide adapté aux spécificités de l'utilisateur : application à l'extraction d'informations d'images de télédétection." Phd thesis, Télécom ParisTech, 2011. http://pastel.archives-ouvertes.fr/pastel-00662747.

Full text
Abstract:
Le but des systèmes de recherche d'images est de diriger rapidement l'utilisateur vers des contenus qui sont pertinents par rapport à la requête qu'il a formulée. Après une présentation de la problématique et un état d'art du domaine, cette thèse présente nos contributions dans le cadre de l'apprentissage avec très peu d'exemples qui est propre à l'imagerie satellitaire. Ces contributions se situent principalement autour de l'utilisation de méthodes semi-supervisées pour exploiter l'information contenue dans les données non-labellisées et pallier en quelque sorte la faiblesse et la non-exhaustivité des bases d'apprentissage. Nous présentons deux scénarios d'utilisation de méthodes semi-supervisées. Le premier se place dans le cadre d'un système d'annotation automatique d'images. Le but est alors de détecter les structures inconnues, c'est à dire les ensembles cohérents de données qui ne sont pas représentées dans la base d'apprentissage et ainsi de guider l'utilisateur dans son exploration de la base. Le second scénario concerne les systèmes de recherche interactive d'images. L'idée est d'exploiter une structuration des données, sous la forme d'un clustering par exemple, pour accélérer l'apprentissage (i.e. minimiser le nombre d'itérations de feedback) dans le cadre d'un système avec boucle de pertinence. La nouveauté de nos contributions se situe autour du fait que la plupart des méthodes semi-supervisées ne permettent pas de travailler avec de gros volumes de données comme on en rencontre en imagerie satellitaire ou alors ne sont pas temps-réel ce qui est problématique dans un système avec retour de pertinence où la fluidité des interactions avec l'utilisateur est à privilégier. Un autre problème qui justifie nos contributions est le fait que la plupart des méthodes semi-supervisées font l'hypothèse que la distribution des données labellisées suit la distribution des données non labellisées, hypothèse qui n'est pas vérifiée dans notre cas du fait de la non-exhaustivité des bases d'apprentissage et donc de l'existence de structures inconnues au niveau des données non labellisées. La dernière partie de cette thèse concerne un système de recherche d'objets à l'intérieur d'un schéma de type apprentissage actif. Une stratégie de type "coarse-to-fine" est introduite pour autoriser l'analyse de la base d'images à une taille de patch beaucoup plus "fine" tout en maintenant un nombre raisonnable d'évaluations de la fonction de décision du classificateur utilisé à chaque itération de la boucle d'apprentissage actif. L'idée est d' élaguer de grandes parties de la base de données à une échelle d'analyse dite "grossière'', afin de réserver un traitement plus complexe et plus coûteux sur des zones restreintes et plus prometteuses des images.
APA, Harvard, Vancouver, ISO, and other styles
32

Szilagyi, Ioan. "Technologies sémantiques pour un système actif d’apprentissage." Thesis, Besançon, 2014. http://www.theses.fr/2014BESA1008/document.

Full text
Abstract:
Les méthodes d’apprentissage évoluent et aux modèles classiques d’enseignement viennent s’ajouter de nouveaux paradigmes, dont les systèmes d’information et de communication, notamment le Web, sont une partie essentielle. Afin améliorer la capacité de traitement de l’information de ces systèmes, le Web sémantique définit un modèle de description de ressources (Resource Description Framework – RDF), ainsi qu’un langage pour la définition d’ontologies (Web Ontology Language – OWL). Partant des concepts, des méthodes, des théories d’apprentissage, en suivant une approche systémique, nous avons utilisé les technologies du Web sémantique pour réaliser une plateforme d’apprentissage capable d’enrichir et de personnaliser l’expérience de l’apprenant. Les résultats de nos travaux sont concrétisés dans la proposition d’un prototype pour un Système Actif et Sémantique d’Apprentissage (SASA). Suite à l’identification et la modélisation des entités participant à l’apprentissage, nous avons construit six ontologies, englobant les caractéristiques de ces entités. Elles sont les suivantes : (1) ontologie de l’apprenant, (2) ontologie de l’objet pédagogique, (3) ontologie de l’objectif d’apprentissage, (4) ontologie de l’objet d’évaluation, (5) ontologie de l’objet d’annotation et (6) ontologie du cadre d’enseignement. L’intégration des règles au niveau des ontologies déclarées, cumulée avec les capacités de raisonnement des moteurs d’inférences incorporés au niveau du noyau sémantique du SASA, permettent l’adaptation du contenu d’apprentissage aux particularités des apprenants. L’utilisation des technologies sémantiques facilite l’identification des ressources d’apprentissage existant sur le Web ainsi que l’interprétation et l’agrégation de ces ressources dans le cadre du SASA<br>Learning methods keep evolving and new paradigms are added to traditional teaching models where the information and communication systems, particularly the Web, are an essential part. In order to improve the processing capacity of information systems, the Semantic Web defines a model for describing resources (Resource Description Framework - RDF), and a language for defining ontologies (Web Ontology Language – OWL). Based on concepts, methods, learning theories, and following a systemic approach, we have used Semantic Web technologies in order to provide a learning system that is able to enrich and personalize the experience of the learner. As a result of our work we are proposing a prototype for an Active Semantic Learning System (SASA). Following the identification and modeling of entities involved in the learning process, we created the following six ontologies that summarize the characteristics of these entities: (1) learner ontology, (2) learning object ontology, (3) learning objective ontology, (4) evaluation object ontology, (5) annotation object ontology and (6) learning framework ontology. Integrating certain rules in the declared ontologies combined with reasoning capacities of the inference engines embedded in the kernel of the SASA, allow the adaptation of learning content to the characteristics of learners. The use of semantic technologies facilitates the identification of existing learning resources on the web as well as the interpretation and aggregation of these resources within the context of SASA
APA, Harvard, Vancouver, ISO, and other styles
33

Martins, Da Cruz José Márcio. "Contribution au classement statistique mutualisé de messages électroniques (spam)." Phd thesis, École Nationale Supérieure des Mines de Paris, 2011. http://pastel.archives-ouvertes.fr/pastel-00637173.

Full text
Abstract:
Depuis la fin des années 90, les différentes méthodes issues de l'apprentissage artificiel ont été étudiées et appliquées au problème de classement de messages électroniques (filtrage de spam), avec des résultats très bons, mais pas parfaits. Il a toujours été considéré que ces méthodes étaient adaptées aux solutions de filtrage orientées vers un seul destinataire et non pas au classement des messages d'une communauté entière. Dans cette thèse notre démarche a été, d'abord, de chercher à mieux comprendre les caractéristiques des données manipulées, à l'aide de corpus réels de messages, avant de proposer des nouveaux algorithmes. Puis, nous avons utilisé un classificateur à régression logistique avec de l'apprentissage actif en ligne - pour démontrer empiriquement qu'avec un algorithme simple et une configuration d'apprentissage mieux adaptée au contexte réel de classement, on peut obtenir des résultats aussi bons que ceux que l'on obtient avec des algorithmes plus complexes. Nous avons aussi démontré, avec des ensembles de messages d'un petit groupe d'utilisateurs, que la perte d'efficacité peut ne pas être significative dans un contexte de classement mutualisé.
APA, Harvard, Vancouver, ISO, and other styles
34

Bolduc, Marie-Jo. "L’apprentissage actif chez les enfants d’âge préscolaire : une étude collaborative sur l’évolution des pratiques d’une enseignante en contexte d’ateliers libres." Mémoire, Université de Sherbrooke, 2015. http://hdl.handle.net/11143/6841.

Full text
Abstract:
Cette recherche collaborative vise à investiguer les pratiques favorables à l’apprentissage actif, plus particulièrement en contexte d’ateliers libres. Pourquoi s’intéresser aux pratiques des enseignantes de l’éducation préscolaire? Actuellement, au Québec, les approches pédagogiques à privilégier à l’éducation préscolaire font l’objet de plusieurs questionnements. Des recherches (Larivée et Terrisse, 2002, Miller et Almon, 2009) montrent la pertinence de recentrer les pratiques autour de la mission développementale, bien qu’il semblerait qu’on s’en éloigne de plus en plus. Les résultats de recherche montrent les effets positifs, pour le développement et la réussite scolaire de l’enfant, d’une approche qui privilégie le développement global des enfants (Marcon, 2002; Simard, Tremblay, Lavoie et Audet, 2013). Cette approche reconnait que c’est en jouant et en étant actif que l’enfant se développe et apprend. La présente étude prend appui sur des auteurs connus tels que Dewey, Piaget, Vygotsky et Weikart, sur le modèle de développement approprié et sur le fonctionnement par ateliers libres pour circonscrire le cadre de référence. Afin d’investiguer l’objet de recherche, la méthodologie puise aux sources de l’ethnométhodologie et de l’interactionnisme symbolique qui permettront de fonder nos choix méthodologiques et de circonscrire les conditions nécessaires à une recherche collaborative. La démarche d’analyse met en lumière le processus d’enquête d’une enseignante qui relève le défi d’une classe jumelée d’une maternelle et d’une première année. Les résultats de cette étude montrent comment l’enseignante procèdera à différents changements et modifications de ses pratiques, dans ce processus, afin de favoriser l’apprentissage actif chez l’enfant. Ce faisant, elle met en œuvre des stratégies d’action en cohérence avec un cadre qui guide tout son agir afin de motiver les enfants de sa classe à apprendre. Les limites de cette recherche résident dans la singularité du contexte de classe dans lequel nous avons investigué l’objet de recherche et dans la double pertinence de cet objet qui arrive à point autant pour la chercheuse que pour l’enseignante.
APA, Harvard, Vancouver, ISO, and other styles
35

Collet, Timothé. "Méthodes optimistes d’apprentissage actif pour la classification." Thesis, Université de Lorraine, 2016. http://www.theses.fr/2016LORR0084/document.

Full text
Abstract:
La classification se base sur un jeu de données étiquetées par un expert. Plus le jeu de données est grand, meilleure est la performance de classification. Pourtant, la requête à un expert peut parfois être coûteuse. Le but de l'apprentissage actif est alors de minimiser le nombre de requêtes à l'expert. La collection des données non-étiquetées reste aisée cependant et illimitée, il est donc nécessaire de faire un choix sur les données à annoter, l'idée est alors de profiter de ce choix pour maximiser les performances en ne lui fournissant que les données les plus informatives à étiqueter. Pourtant, le niveau d'informativité de chaque donnée ne peut pas être calculé exactement et ne peut être estimé qu'à une incertitude près. Améliorer la précision de l'estimation nécessite d'annoter de nouvelles données. Il y a donc un dilemme entre utiliser le budget d'annotations disponible pour améliorer la performance du classifieur selon l'estimation actuelle du critère ou pour améliorer la précision sur le critère. Ce dilemme est bien connu dans le cadre de l'optimisation en budget fini sous le nom de dilemme entre exploration et exploitation. Les solutions usuelles pour résoudre ce dilemme dans ce contexte font usage du principe d'Optimisme Face à l'Incertitude. Dans cette thèse, nous montrons donc qu'il est possible d'adapter ce principe au problème d'apprentissage actif pour la classification. Pour cela, plusieurs algorithmes ont été être développés pour des classifieurs de complexité croissante, chacun utilisant le principe de l'Optimisme Face à l'Incertitude, et leurs résultats ont été évalués empiriquement<br>A Classification problem makes use of a training set consisting of data labeled by an oracle. The larger the training set, the best the performance. However, requesting the oracle may be costly. The goal of Active Learning is thus to minimize the number of requests to the oracle while achieving the best performance. To do so, the data that are presented to the oracle must be carefully selected among a large number of unlabeled instances acquired at no cost. However, the true profitability of labeling a particular instance may not be known perfectly. It can therefore be estimated along with a measure of uncertainty. To Increase the precision on the estimate, we need to label more data. Thus, there is a dilemma between labeling data in order to increase the performance of the classifier or to better know how to select data. This dilemma is well studied in the context of finite budget optimization under the name of exploration versus exploitation dilemma. The most famous solutions make use of the principle of Optimism in the Face of Uncertainty. In this thesis, we show that it is possible to adapt this principle to the active learning problem for classification. Several algorithms have been developed for classifiers of increasing complexity, each one of them using the principle of Optimism in the Face of Uncertainty, and their performances have been empirically evaluated
APA, Harvard, Vancouver, ISO, and other styles
36

Grizou, Jonathan. "Apprentissage simultané d'une tâche nouvelle et de l'interprétation de signaux sociaux d'un humain en robotique." Thesis, Bordeaux, 2014. http://www.theses.fr/2014BORD0146/document.

Full text
Abstract:
Cette thèse s'intéresse à un problème logique dont les enjeux théoriques et pratiques sont multiples. De manière simple, il peut être présenté ainsi : imaginez que vous êtes dans un labyrinthe, dont vous connaissez toutes les routes menant à chacune des portes de sortie. Derrière l'une de ces portes se trouve un trésor, mais vous n'avez le droit d'ouvrir qu'une seule porte. Un vieil homme habitant le labyrinthe connaît la bonne sortie et se propose alors de vous aider à l'identifier. Pour cela, il vous indiquera la direction à prendre à chaque intersection. Malheureusement, cet homme ne parle pas votre langue, et les mots qu'il utilise pour dire ``droite'' ou ``gauche'' vous sont inconnus. Est-il possible de trouver le trésor et de comprendre l'association entre les mots du vieil homme et leurs significations ? Ce problème, bien qu'en apparence abstrait, est relié à des problématiques concrètes dans le domaine de l'interaction homme-machine. Remplaçons le vieil homme par un utilisateur souhaitant guider un robot vers une sortie spécifique du labyrinthe. Ce robot ne sait pas en avance quelle est la bonne sortie mais il sait où se trouvent chacune des portes et comment s'y rendre. Imaginons maintenant que ce robot ne comprenne pas a priori le langage de l'humain; en effet, il est très difficile de construire un robot à même de comprendre parfaitement chaque langue, accent et préférence de chacun. Il faudra alors que le robot apprenne l'association entre les mots de l'utilisateur et leur sens, tout en réalisant la tâche que l'humain lui indique (i.e.trouver la bonne porte). Une autre façon de décrire ce problème est de parler d'auto-calibration. En effet, le résoudre reviendrait à créer des interfaces ne nécessitant pas de phase de calibration car la machine pourrait s'adapter,automatiquement et pendant l'interaction, à différentes personnes qui ne parlent pas la même langue ou qui n'utilisent pas les mêmes mots pour dire la même chose. Cela veut aussi dire qu'il serait facile de considérer d’autres modalités d'interaction (par exemple des gestes, des expressions faciales ou des ondes cérébrales). Dans cette thèse, nous présentons une solution à ce problème. Nous appliquons nos algorithmes à deux exemples typiques de l'interaction homme robot et de l'interaction cerveau machine: une tâche d'organisation d'une série d'objets selon les préférences de l'utilisateur qui guide le robot par la voix, et une tâche de déplacement sur une grille guidé par les signaux cérébraux de l'utilisateur. Ces dernières expériences ont été faites avec des utilisateurs réels. Nos résultats démontrent expérimentalement que notre approche est fonctionnelle et permet une utilisation pratique d’une interface sans calibration préalable<br>This thesis investigates how a machine can be taught a new task from unlabeled humaninstructions, which is without knowing beforehand how to associate the human communicative signals withtheir meanings. The theoretical and empirical work presented in this thesis provides means to createcalibration free interactive systems, which allow humans to interact with machines, from scratch, using theirown preferred teaching signals. It therefore removes the need for an expert to tune the system for eachspecific user, which constitutes an important step towards flexible personalized teaching interfaces, a key forthe future of personal robotics.Our approach assumes the robot has access to a limited set of task hypotheses, which include the task theuser wants to solve. Our method consists of generating interpretation hypotheses of the teaching signalswith respect to each hypothetic task. By building a set of hypothetic interpretation, i.e. a set of signallabelpairs for each task, the task the user wants to solve is the one that explains better the history of interaction.We consider different scenarios, including a pick and place robotics experiment with speech as the modalityof interaction, and a navigation task in a brain computer interaction scenario. In these scenarios, a teacherinstructs a robot to perform a new task using initially unclassified signals, whose associated meaning can bea feedback (correct/incorrect) or a guidance (go left, right, up, ...). Our results show that a) it is possible tolearn the meaning of unlabeled and noisy teaching signals, as well as a new task at the same time, and b) itis possible to reuse the acquired knowledge about the teaching signals for learning new tasks faster. Wefurther introduce a planning strategy that exploits uncertainty from the task and the signals' meanings toallow more efficient learning sessions. We present a study where several real human subjects controlsuccessfully a virtual device using their brain and without relying on a calibration phase. Our system identifies, from scratch, the target intended by the user as well as the decoder of brain signals.Based on this work, but from another perspective, we introduce a new experimental setup to study howhumans behave in asymmetric collaborative tasks. In this setup, two humans have to collaborate to solve atask but the channels of communication they can use are constrained and force them to invent and agree ona shared interaction protocol in order to solve the task. These constraints allow analyzing how acommunication protocol is progressively established through the interplay and history of individual actions
APA, Harvard, Vancouver, ISO, and other styles
37

Gorisse, David. "Passage à l'échelle des méthodes de recherche sémantique dans les grandes bases d'images." Phd thesis, Université de Cergy Pontoise, 2010. http://tel.archives-ouvertes.fr/tel-00560796.

Full text
Abstract:
Avec la révolution numérique de cette dernière décennie, la quantité de photos numériques mise à disposition de chacun augmente plus rapidement que la capacité de traitement des ordinateurs. Les outils de recherche actuels ont été conçus pour traiter de faibles volumes de données. Leur complexité ne permet généralement pas d'effectuer des recherches dans des corpus de grande taille avec des temps de calculs acceptables pour les utilisateurs. Dans cette thèse, nous proposons des solutions pour passer à l'échelle les moteurs de recherche d'images par le contenu. Dans un premier temps, nous avons considéré les moteurs de recherche automatique traitant des images indexées sous la forme d'histogrammes globaux. Le passage à l'échelle de ces systèmes est obtenu avec l'introduction d'une nouvelle structure d'index adaptée à ce contexte qui nous permet d'effectuer des recherches de plus proches voisins approximées mais plus efficaces. Dans un second temps, nous nous sommes intéressés à des moteurs plus sophistiqués permettant d'améliorer la qualité de recherche en travaillant avec des index locaux tels que les points d'intérêt. Dans un dernier temps, nous avons proposé une stratégie pour réduire la complexité de calcul des moteurs de recherche interactifs. Ces moteurs permettent d'améliorer les résultats en utilisant des annotations que les utilisateurs fournissent au système lors des sessions de recherche. Notre stratégie permet de sélectionner rapidement les images les plus pertinentes à annoter en optimisant une méthode d'apprentissage actif.
APA, Harvard, Vancouver, ISO, and other styles
38

Badets, Alexandra. "Médiations et obstacles transitionnels dans les interactions dispositions/dispositifs étayant la construction des identités professionnelles : le cas des apprentis ingénieurs CESI en Apprentissage Actif Par Projets." Thesis, Normandie, 2018. http://www.theses.fr/2018NORMR106/document.

Full text
Abstract:
CESI école d’ingénieurs a mis en place l’Apprentissage Actif Par Projets dans sa formation d’ingénieurs en alternance en 2015. Le cursus à l’école a été conçu pour être professionnalisant, via la réalisation de projets pluridisciplinaires en groupes. Le travail de recherche questionne les médiations et obstacles vécus par les apprenants dans la construction de leurs identités professionnelles dans ce dispositif. Nous avançons deux hypothèses principales pour étudier la question : l’A2P2 devrait influer sur le développement identitaire des apprenants, mais les leviers repérés ne sauraient être uniformes, les interactions dispositif-dispositions jouant sur leur vécu. La méthodologie a consisté à recueillir des données à visée compréhensive sur les 3 ans du cycle ingénieur. Une méthode de recueil mixte a été employée : une approche qualitative, par échantillonnage (31 apprenants), couplée à un recueil de données quantitatives sur la cohorte (587 apprenants), pour en extraire des « profils » de construction. Cette approche, centrée sur le discours des apprenants, a été complémentée par une triangulation méthodologique (recueil de données auprès de tuteurs, résultats d’évaluations).Les résultats confirment la présence d’indicateurs de construction imputables au dispositif à l’école, via la répétition de schémas d’action efficaces. Ils font aussi émerger des profils de construction identitaire, à savoir différentes dynamiques étayées par des ressources et leviers spécifiques, en fonction des buts fixés par les apprenants à la formation. Les résultats ont permis de noter les appuis différenciés en entreprise et en centre, pour accompagner les professionnalités émergentes<br>CESI school of engineering has implemented a PBL curriculum called A2P2 in its combined work and study engineering degree program since 2015. This curriculum revolves around cross-disciplinary projects carried out in small groups and was designed to professionalize students. This research work endeavours to question the challenges and assets of this learning environment as regards the professional identity construction of the future engineers. We first assumed that the program should positively affect their professional identity construction, but also advanced the hypothesis that its impact should differ from one student to another as students’ individual dispositions interact with the learning environment and thus affect their experiences. The research process involved gathering comprehensive data throughout the 3-year engineering program. A dual data collection approach was developed – a sampling, qualitative study (31 students) as well as quantitative data collection from the cohort (587 students), to infer development “profiles”. This student-centred methodology was supported by data triangulation, via external data collected from the tutors, from evaluation results.The data collected supports the theory of the school curriculum contributing to students’ identity development, through the iteration of efficient patterns of actions. They bring out several development profiles –professional identity dynamics, bolstered through specific resources and levers of development, depending on students’ set out goals for the training. The results point out that school and companies provide different levers to support students’ professional becoming
APA, Harvard, Vancouver, ISO, and other styles
39

Rolet, Philippe. "Eléments pour l'apprentissage et l'optimisation de fonctions chères." Paris 11, 2010. http://www.theses.fr/2010PA112217.

Full text
Abstract:
Ces travaux de doctorat sont centrés sur l'apprentissage artificiel et l'optimisation, c'est à dire la construction de programmes apprenant à identifier un concept, à approximer une fonction ou à trouver un optimum à partir d'exemples de ce concept (ou de points de la fonction). Le contexte applicatif est l'apprentissage et l'optimisation de modèles simplifiés en ingénierie numérique, pour des problèmes industriels pour lesquels les exemples sont coûteux à obtenir. Il est nécessaire d'en utiliser le moins possible pour l'apprentissage; c'est le principe de l'apprentissage actif et de l'optimisation de fonction chères. Mes efforts de recherche ont d'abord porté sur la conception et le développement d'une nouvelle approche de l'apprentissage Actif, fondée sur l'apprentissage par renforcement. Les fondements théoriques de l'approche ont été établis. Parallèlement, l'implémentation d'un logiciel fondé sur cette approche, BAAL, a permis une validation expérimentale (publications: CAP'09, ECML'09). Une extension de cette approche a été réalisée pour l'optimisation de fonction chères (publication : GECCO 2009). La deuxième partie de mon doctorat s'intéresse aux potentiels et aux limites de l'apprentissage actif et de l'optimisation chère d'un point de vue théorique. Une étude des bornes de complexités de l'apprentissage actif par "paquets" a été réalisée (publication : ECML 2010). Dans le domaine de l'optimisation bruitée, des résultats sur le nombre minimal d'exemples nécessaires pour trouver un optimum ont été obtenus (publications: LION 2010, EvoSTAR 2010)<br>This thesis focuses on leaming and optimizing expensive functions, that is the design of algorithms that can learn to identify a concept, to approximate a function or to find an optimum given exemples of the concept or points of the function. The motivating application is learning and optimizing simplified models in numerical engineering, for industrial problems for which examples are costly to obtain. Lt is then a requirement to use as few examples as possible for learning: this is the main characteristic of active learning and expensive optimization. This work first focuses on the design and development of a new approach to active leaming, based on reinforcement learning. Theoretical groundings for the approach are laid out, and a software inspired by the approach, BAAL, enables experimental vaildation (publications: CAP09, ECML09). An extension of this approach for expensive optimisation was devised (publication: GECCO 2009). The second part of this work is interested in the potential and Iimits of active learning and optimisation on a theoretical angle. Proofs of sample complexity bounds for batch active learning are published in ECML 2010. Regarding noisy optimization, results on the minimal number of examples necessary to find an optimum on various class of functions were derived (LION 2010, EvoSTAR 2010)
APA, Harvard, Vancouver, ISO, and other styles
40

Khokhar, Muhammad Jawad. "Modélisation de la qualité d'expérience de la vidéo streaming dans l'internet par expérimentation contrôlée et apprentissage machine." Thesis, Université Côte d'Azur (ComUE), 2019. http://www.theses.fr/2019AZUR4067.

Full text
Abstract:
Le streaming vidéo est l'élément dominant au trafic Internet actuel. En conséquence, l'estimation de la qualité d'expérience (QoE) pour le streaming vidéo est de plus en plus importante pour les opérateurs réseau. La qualité d'expérience (QoE) de la diffusion vidéo sur Internet est directement liée aux conditions du réseau (par exemple, bande passante, délai) également appelée qualité de service (QoS). Cette relation entre QoS et QoE motive l'utilisation de l'apprentissage automatique supervisé pour établir des modèles reliant QoS à QoE. La QoS du réseau peut être mesurée activement en dehors du plan de données de l'application (outband) ou de manière passive à partir du trafic vidéo (inband). Ces deux types de qualité de service correspondent à deux scénarios d'utilisation différents : la prévision et la surveillance. Dans cette thèse, nous examinons les défis associés à la modélisation de la QoE à partir de la QoS réseau, à savoir 1) le coût élevé de la phase expérimentale, et 2) la considération de la grande diversité du contenu vidéo et du chiffrement déployé. Premièrement, la modélisation de la QoE par expérimentation contrôlée constitue un défi, les dimensions d'espace d'expérimentations ainsi que le temps non négligeable de chaque expérience rend cette modélisation plus complexe. L'approche classique consiste à expérimenter avec des échantillons (de qualité de service), échantillonnés de manière uniforme dans tout l'espace expérimental. Cependant, un échantillonnage uniforme peut entraîner une similarité significative au niveau des labels, ce qui entraine une augmentation du coût sans gain en précision du modèle. Pour résoudre ce problème, nous recommandons d'utiliser apprentissage actif pour réduire le nombre d'expériences sans affecter la précision. Nous examinons le cas de la modélisation QoE sur YouTube et montrons que l'échantillonnage actif fournit un gain significatif par rapport à l'échantillonnage uniforme en termes d'augmentation de la précision de la modélisation en moins d'expériences. Nous évaluons ensuite notre approche avec des ensembles de données synthétiques et montrons que le gain dépend de la complexité de l'espace expérimental. Dans l'ensemble, nous présentons une approche générale d'échantillonnage qui peut être utilisée dans n'importe quel scénario de modélisation QoS-QoE, à condition que la fonctionnalité de QoS en entrée soit entièrement contrôlable. Deuxièmement, prévoir la qualité de l'expérience de la vidéo avec précision s'avère difficile, d'une part les vidéos des fournisseurs de contenu actuels varient énormément, des vidéos sportives rapides aux vidéos éducatives statiques. De plus, le trafic vidéo actuel est crypté, ce qui signifie que les opérateurs de réseau ont une visibilité réduite sur le trafic vidéo, ce qui rend la surveillance de la QoE plus complexe. Face à ces défis, nous développons des modèles afin de prévoir ainsi que surveiller avec précision la qualité de l'expérience vidéo. Pour le scénario de prévision QoE, nous construisons un indicateur QoE appelé YouScore qui prédit le pourcentage de vidéos pouvant être lues sans interruption en fonction de l'état du réseau sous-jacent. En ce qui concerne la surveillance QoE, nous estimons la QoE à l'aide des fonctionnalités de qualité de service inband obtenues à partir du trafic vidéo crypté. En conclusion, pour les deux scénarios (prévision et surveillance), nous soulignons l'importance d'utiliser des fonctionnalités qui caractérisent le contenu vidéo afin de pouvoir améliorer la précision des modèles<br>Video streaming is the dominant contributor of today's Internet traffic. Consequently, estimating Quality of Experience (QoE) for video streaming is of paramount importance for network operators. The QoE of video streaming is directly dependent on the network conditions (e.g., bandwidth, delay, packet loss rate) referred to as the network Quality of Service (QoS). This inherent relationship between the QoS and the QoE motivates the use of supervised Machine Learning (ML) to build models that map the network QoS to the video QoE. In most ML works on QoE modeling, the training data is usually gathered in the wild by crowdsourcing or generated inside the service provider networks. However, such data is not easily accessible to the general research community. Consequently, the training data if not available beforehand, needs to be built up by controlled experimentation. Here, the target application is run under emulated network environments to build models that predict video QoE from network QoS. The network QoS can be actively measured outside the data plane of the application (outband), or measured passively from the video traffic (inband). These two distinct types of QoS correspond to the use cases of QoE forecasting (from end user devices) and QoE monitoring (from within the networks). In this thesis, we consider the challenges associated with network QoS-QoE modeling, which are 1) the large training cost of QoE modeling by controlled experimentation, and 2) the accurate prediction of QoE considering the large diversity of video contents and the encryption deployed by today's content providers. Firstly, QoE modeling by controlled experimentation is challenging due to the high training cost involved as each experiment usually consumes some non-negligible time to complete and the experimental space to cover is large (power the number of QoS features). The conventional approach is to experiment with QoS samples uniformly sampled in the entire experimental space. However, uniform sampling can result in significant similarity in the output labels, which increases the training cost while not providing much gain in the model accuracy. To tackle this problem, we advocate the use of active learning to reduce the number of experiments while not impacting accuracy. We consider the case of YouTube QoE modeling and show that active sampling provides a significant gain over uniform sampling in terms of achieving higher modeling accuracy with fewer experiments. We further evaluate our approach with synthetic datasets and show that the gain is dependent on the complexity of the experimental space. Overall, we present a sampling approach that is general and can be used in any QoSQoE modeling scenario provided that the input QoS features are fully controllable. Secondly, accurate prediction of QoE of video streaming can be challenging as videos offered by today's content providers vary significantly from fast motion sports videos to static lectures. On top of that, today's video traffic is encrypted, which means that network operators have little visibility into the video traffic making QoE monitoring difficult. Considering these challenges, we devise models that aim at accurate forecasting and monitoring of video QoE. For the scenario of QoE forecasting, we build a QoE indicator called YouScore that quantifies the percentage of videos in the catalog of a content provider that may play out smoothly (without interruptions) for a given outband network QoS. For the QoE monitoring scenario, we estimate the QoE using the inband QoS features obtained from the encrypted video traffic. Overall, for both scenarios (forecasting and monitoring), we highlight the importance of using features that characterize the video content to improve the accuracy of QoE modeling
APA, Harvard, Vancouver, ISO, and other styles
41

Ribeiro, de Mello Carlos Eduardo. "Active Learning : an unbiased approach." Phd thesis, Châtenay-Malabry, Ecole centrale de Paris, 2013. http://tel.archives-ouvertes.fr/tel-01000266.

Full text
Abstract:
Active Learning arises as an important issue in several supervised learning scenarios where obtaining data is cheap, but labeling is costly. In general, this consists in a query strategy, a greedy heuristic based on some selection criterion, which searches for the potentially most informative observations to be labeled in order to form a training set. A query strategy is therefore a biased sampling procedure since it systematically favors some observations by generating biased training sets, instead of making independent and identically distributed draws. The main hypothesis of this thesis lies in the reduction of the bias inherited from the selection criterion. The general proposal consists in reducing the bias by selecting the minimal training set from which the estimated probability distribution is as close as possible to the underlying distribution of overall observations. For that, a novel general active learning query strategy has been developed using an Information-Theoretic framework. Several experiments have been performed in order to evaluate the performance of the proposed strategy. The obtained results confirm the hypothesis about the bias, showing that the proposal outperforms the baselines in different datasets.
APA, Harvard, Vancouver, ISO, and other styles
42

Loth, Manuel. "Algorithmes d'Ensemble Actif pour le LASSO." Phd thesis, Université des Sciences et Technologie de Lille - Lille I, 2011. http://tel.archives-ouvertes.fr/tel-00845441.

Full text
Abstract:
Cette thèse aborde le calcul de l'opérateur LASSO (Least Absolute Shrinkage and Selection Operator), ainsi que des problématiques qui lui sont associées, dans le domaine de la régression. Cet opérateur a suscité une attention croissante depuis son introduction par Robert Tibshirani en 1996, par sa capacité à produire ou identi fier des modèles linéaires parcimonieux à partir d'observations bruitées, la parcimonie signi fiant que seules quelques unes parmi de nombreuses variables explicatives apparaissent dans le modèle proposé. Cette sélection est produite par l'ajout à la méthode des moindres-carrés d'une contrainte ou pénalisation sur la somme des valeurs absolues des coe fficients linéaires, également appelée norme l1 du vecteur de coeffi cients. Après un rappel des motivations, principes et problématiques de la régression, des estimateurs linéaires, de la méthode des moindres-carrés, de la sélection de modèle et de la régularisation, les deux formulations équivalentes du LASSO contrainte ou régularisée sont présentées; elles dé finissent toutes deux un problème de calcul non trivial pour associer un estimateur à un ensemble d'observations et un paramètre de sélection. Un bref historique des algorithmes résolvant ce problème est dressé, et les deux approches permettant de gérer la non-di fferentiabilité de la norme l1 sont présentées, ainsi que l'équivalence de ces problèmes avec un programme quadratique. La seconde partie se concentre sur l'aspect pratique des algorithmes de résolution du LASSO. L'un d'eux, proposé par Michael Osborne en 2000, est reformulé. Cette reformulation consiste à donner une défi nition et explication générales de la méthode d'ensemble actif, qui généralise l'algorithme du simplex à la programmation convexe, puis à la spéci fier progressivement pour la programmation LASSO, et à adresser les questions d'optimisation des calculs algébriques. Bien que décrivant essentiellement le même algorithme que celui de Michael Osborne, la présentation qui en est faite ici a l'ambition d'en exposer clairement les mécanismes, et utilise des variables di fférentes. Outre le fait d'aider à mieux comprendre cet algorithme visiblement sous-estimé, l'angle par lequel il est présenté éclaire le fait nouveau que la même méthode s'applique naturellement à la formulation régularisée du LASSO, et non uniquement à la formulation contrainte. La populaire méthode par homotopie (ou LAR-LASSO, ou LARS) est ensuite présentée comme une dérivation de la méthode d'ensemble actif, amenant une formulation alternative et quelque peu simpli fiée de cet algorithme qui fournit les solutions du LASSO pour chaque valeur de son paramètre. Il est montré que, contrairement aux résultats d'une étude récente de Jerome H. Friedman, des implémentations de ces algorithmes suivant ces reformulations sont plus effi caces en terme de temps de calcul qu'une méthode de descente par coordonnées. La troisième partie étudie dans quelles mesures ces trois algorithmes (ensemble actif, homotopie, et descente par coordonnées) peuvent gérer certains cas particuliers, et peuvent être appliqués à des extensions du LASSO ou d'autres problèmes similaires. Les cas particuliers incluent les dégénérescences, comme la présence de variables lineairement dépendantes, ou la sélection/désélection simultanée de variables. Cette dernière problématique, qui était délaissée dans les travaux précédents, est ici expliquée plus largement et une solution simple et efficace y est apportée. Une autre cas particulier est la sélection LASSO à partir d'un nombre très large, voire infi ni de variables, cas pour lequel la méthode d'ensemble actif présente un avantage majeur. Une des extensions du LASSO est sa transposition dans un cadre d'apprentissage en ligne, où il est désirable ou nécessaire de résoudre le problème sur un ensemble d'observations qui évolue dans le temps. A nouveau, la flexibilité limitée de la méthode par homotopie la disquali fie au pro fit des deux autres. Une autre extension est l'utilisation de la pénalisation l1 sur d'autres fonction coûts que la norme l2 du résidu, ou en association avec d'autres pénalisations, et il est rappelé ou établi dans quelles mesures et de quelle façon chaque algorithme peut être transposé à ces problèmes.
APA, Harvard, Vancouver, ISO, and other styles
43

Ben, Slimene Ben Amor Ines. "Apprentissage actif pour la classification des occupations du sol sur larges étendues à partir d'images multispectrales à haute résolution spatiale : application en milieu cultivé, Lebna (Cap-Bon Tunisie)." Thesis, Montpellier, 2017. http://www.theses.fr/2017MONTT126/document.

Full text
Abstract:
Les activités anthropiques dans le bassin méditerranéen sont en forte évolution. Dans les zones agricoles, cette croissance entraîne des évolutions considérables de l'occupation du sol. Cette activité agricole exerce un impact majeur sur le fonctionnement hydrologique des paysages qui n'est identifiable qu'à une échelle bien plus large, sur plusieurs dizaines de km². Cette thèse se concentre sur la classification de l'occupation du sol sur une large étendue à partir d'une image monodate à haute résolution spatiale (SPOT6/7).Dans ce contexte, les données d'apprentissage sont collectées par des enquêtes terrain, par conséquent, elles sont très limitées. Les méthodes d'apprentissage supervisées sont généralement utilisées, en supposant que la distribution des classes est stable sur toute l'image. Cependant, en pratique, on constate une distorsion des distributions des classes (apparition de nouvelles classes, disparition de classes). Ce problème, intitulé "datashift", se produit souvent sur des larges étendues. Ainsi le modèle construit sur les données d'apprentissage initiales s'avère sous optimal pour la classification de l'image entière. Pour atténuer ce problème, les techniques d'apprentissage actif définissent un ensemble d'apprentissage efficace, en l'adaptant itérativement par l'ajout des données non labellisées les plus informatives. Ces techniques permettent d'améliorer le modèle de classification tout en conservant un petit ensemble d'apprentissage initial. L'échantillonnage se base généralement sur deux métriques : l'incertitude et la diversité.Dans cette thèse, nous montrons l'apport des techniques d'apprentissage actif pour la cartographie de l'occupation du sol en milieu agricole, en proposant un échantillonnage adapté par parcelle.L'apport des méthodes d'apprentissage actif est validé par rapport à une sélection aléatoire des parcelles. Une métrique de diversité basée sur l'algorithme Meanshift a été proposée.Dans un deuxième temps, nous avons traité le sous-problème du "datashift" qui est l'apparition de nouvelles classes. Nous avons proposé de nouvelles métriques de diversité basées sur l'algorithme Meanshift et les Fuzzy k-means ainsi qu'une nouvelle stratégie de sélection des données adaptées à la détection de nouvelles classes.Dans la dernière partie, nous nous sommes intéressés aux contraintes spatiales induites par les observations sur terrain et nous avons proposé une stratégie de labellisation par points de vue qui permet de diminuer largement les coûts humains d'observations terrain tout en gardant de bonnes précisions de classification ainsi que la découverte des nouvelles classes.Les méthodes proposées ont été testées et validées avec une image multispectrale SPOT6 à 6m de résolution sur le bassin versant de Lebna, Cap-Bon, Tunisie<br>Anthropogenic activities in the Mediterranean are in strong evolution. In agricultural areas, this growth leads to considerable changes in land cover. This agricultural activity has a major impact on the hydrological functioning of the landscapes which can be only identified on a wide scale, over several tens of km². This thesis focuses on the land cover classification on wide area from a high spatial resolution monodate image (SPOT6/7).In this context, the learning data are collected by field surveys, therefore they are very limited. Supervised learning methods are generally used, assuming that the class distribution is stable over all the image. However, in practice, there is a class distributions distortion (new classes appear, classes disappear). This problem, called "datashift", always occurs over wide areas. Thus, the model constructed on the initial learning data is sub-optimal for the classification of the entire image. To lessen this problem, active learning techniques define an effective learning set, by iteratively adapting it by adding the most informative unlabeled data. These techniques improve the classification model while retaining a small initial learning set. Sampling is generally based on two metrics: uncertainty and diversity.In this thesis, we show the contribution of active learning techniques for the land cover mapping in agricultural environment, proposing a suitable sampling per parcel.The active learning methods contribution is validated respectively to a random selection of parcels. A diversity metric based on the Meanshift algorithm has been proposed.Secondly, we treated the sub-problem of the "datashift" which is the appearance of new classes. We proposed new metrics of diversity based on the Meanshift algorithm and Fuzzy k-means as well as a new data selection strategy adapted to the detection of new classes.Finally we were interested in the spatial constraints induced by the field observations and we proposed a strategy of labeling by stand points which make it possible to greatly reduce the human costs for field observations while maintaining good classification precisions as well as the discovery of new classes.The proposed methodologies were tested and validated on a multispectral SPOT6 image with 6m resolution on the Lebna watershed, Cap-Bon, Tunisia
APA, Harvard, Vancouver, ISO, and other styles
44

Mirroshandel, Seyedabolghasem. "Towards less supervision in dependency parsing." Thesis, Aix-Marseille, 2015. http://www.theses.fr/2015AIXM4096/document.

Full text
Abstract:
Analyse probabiliste est l'un des domaines de recherche les plus attractives en langage naturel En traitement. Analyseurs probabilistes succès actuels nécessitent de grandes treebanks qui Il est difficile, prend du temps et coûteux à produire. Par conséquent, nous avons concentré notre l'attention sur des approches moins supervisés. Nous avons proposé deux catégories de solution: l'apprentissage actif et l'algorithme semi-supervisé. Stratégies d'apprentissage actives permettent de sélectionner les échantillons les plus informatives pour annotation. La plupart des stratégies d'apprentissage actives existantes pour l'analyse reposent sur la sélection phrases incertaines pour l'annotation. Nous montrons dans notre recherche, sur quatre différents langues (français, anglais, persan, arabe), que la sélection des phrases complètes ne sont pas une solution optimale et de proposer un moyen de sélectionner uniquement les sous-parties de phrases. Comme nos expériences ont montré, certaines parties des phrases ne contiennent aucune utiles information pour la formation d'un analyseur, et en se concentrant sur les sous-parties incertains des phrases est une solution plus efficace dans l'apprentissage actif<br>Probabilistic parsing is one of the most attractive research areas in natural language processing. Current successful probabilistic parsers require large treebanks which are difficult, time consuming, and expensive to produce. Therefore, we focused our attention on less-supervised approaches. We suggested two categories of solution: active learning and semi-supervised algorithm. Active learning strategies allow one to select the most informative samples for annotation. Most existing active learning strategies for parsing rely on selecting uncertain sentences for annotation. We show in our research, on four different languages (French, English, Persian, and Arabic), that selecting full sentences is not an optimal solution and propose a way to select only subparts of sentences. As our experiments have shown, some parts of the sentences do not contain any useful information for training a parser, and focusing on uncertain subparts of the sentences is a more effective solution in active learning
APA, Harvard, Vancouver, ISO, and other styles
45

Tounsi, Mohamed. "Cyclage actif en mode MLI des modules de puissance IGBT application des SVM pour le diagnostic des défauts de vieillissement thermique." Caen, 2011. http://www.theses.fr/2011CAEN2082.

Full text
Abstract:
Ce travail porte sur la mise en œuvre d’un classifieur SVM (Séparateur à Vaste Marge) pour le diagnostic automatique de défauts de vieillissement thermique de composants de puissance IGBT à base de mesures électrothermiques. Cela a nécessité le développement d’un banc d’essai de cyclage actif de modules IGBT pour la caractérisation de leur fatigue thermique, l’analyse des dégradations engendrées dans leur assemblage ainsi qu’à la classification de leur mode de fonctionnement, en mode « sain » et en mode « dégradé». La stratégie de cyclage thermique adoptée, vise à reproduite les contraintes imposées aux composants durant un fonctionnement réel. Nous avons suivi d’une part, les paramètres statiques et dynamiques des modules pour détecter d’éventuelles dérives, et d’autre part des paramètres électrothermiques indicateurs de dégradations thermomécaniques dans leur assemblage. Le stress thermique a causé principalement une avance dans les commutations à la fermeture et à l’ouverture ainsi qu’une apparition d’une trainée de courant à l’ouverture. Une analyse de défaillance a permis de révéler un décollement de fils de bonding, une dégradation de la brasure puce/substrat et une reconstruction des surfaces des métallisations d’émetteur et de grille. Le classifieur SVM construit, permet de discerner un mode de fonctionnement dégradé d’un mode de bon fonctionnement des composants, en vue de la mise en œuvre d’une maintenance préventive dans des installations électriques où la continuité de service et la sécurité revêtent une importance capitale<br>The work concerns the implementation of an SVM classifier (Support Vector Machine) for an automatic diagnosis of power IGBT module thermal ageing defects, based on thermoelectric measurements. This has required the development of an active cycling test bench for the characterization of the thermal tiredness of IGBT modules, the analysis of the degradations generated in their assembly, and the classification of their operating mode : in " healthy " mode and " degraded " mode. The strategy adopted for the thermal cycling, aims to reproduce the constraints imposed on the components during their real operation. We followed the module static and dynamic parameters in order to detect possible drifts, and thermoelectric parameters used as criteria of thermo-mechanical degradations in their assembly. The thermal stress caused mainly, earlier switching-on and switching-off modes and appearance of a tile-current. A failure analysis has revealed, in the component assembly, bond-wire lift-off, solder layer degradation, and surface dislocation of the gate and emitter metallizations. The implemented SVM classifier, allows to distinguish between an IGBT degraded operating mode and a healthy operating mode, for a preventive maintenance in electric installations where the continuity of service and safety are very important
APA, Harvard, Vancouver, ISO, and other styles
46

Cruz, José Marcio Martins da. "Contribution au classement statistique mutualisé de messages électroniques (spam)." Paris, ENMP, 2011. https://pastel.archives-ouvertes.fr/pastel-00637173.

Full text
Abstract:
Depuis la fin des années 90, les différentes méthodes issues de l'apprentissage artificiel ont été étudiées et appliquées au problème de classement de messages électroniques (filtrage de spam), avec des résultats très bons, mais pas parfaits. Il a toujours été considéré que ces méthodes étaient adaptées aux solutions de filtrage orientées vers un seul destinataire et non pas au classement des messages d'une communauté entière. Dans cette thèse notre démarche a été, d'abord, de chercher à mieux comprendre les caractéristiques des données manipulées, à l'aide de corpus réels de messages, avant de proposer des nouveaux algorithmes. Puis, nous avons utilisé un classificateur à régression logistique avec de l'apprentissage actif en ligne - pour démontrer empiriquement qu'avec un algorithme simple et une configuration d'apprentissage mieux adaptée au contexte réel de classement, on peut obtenir des résultats aussi bons que ceux que l'on obtient avec des algorithmes plus complexes. Nous avons aussi démontré, avec des ensembles de messages d'un petit groupe d'utilisateurs, que la perte d'efficacité peut ne pas être significative dans un contexte de classement mutualisé<br>Since the 90's, different machine learning methods were investigated and applied to the email classification problem (spam filtering), with very good but not perfect results. It was always considered that these methods are well adapted to filter messages to a single user and not filter to messages of a large set of users, like a community. Our approach was, at first, look for a better understanding of handled data, with the help of a corpus of real messages, before studying new algorithms. With the help of a logistic regression classifier with online active learning, we could show, empirically, that with a simple classification algorithm coupled with a learning strategy well adapted to the real context it's possible to get results which are as good as those we can get with more complex algorithms. We also show, empirically, with the help of messages from a small group of users, that the efficiency loss is not very high when the classifier is shared by a group of users
APA, Harvard, Vancouver, ISO, and other styles
47

Defretin, Joseph. "Stratégies de vision active pour la reconnaissance d'objets." Phd thesis, École normale supérieure de Cachan - ENS Cachan, 2011. http://tel.archives-ouvertes.fr/tel-00696044.

Full text
Abstract:
Cette thèse, réalisée en coopération avec l'ONERA, concerne la reconnaissance active d'objets 3D par un agent autonome muni d'une caméra d'observation. Alors qu'en reconnaissance passive les modalités d'acquisitions des observations sont imposées et génèrent parfois des ambiguïtés, la reconnaissance active exploite la possibilité de contrôler en ligne ces modalités d'acquisition au cours d'un processus d'inférence séquentiel dans le but de lever l'ambiguïté. L'objectif des travaux est d'établir des stratégies de planification dans l'acquisition de l'information avec le souci d'une mise en œuvre réaliste de la reconnaissance active. Le cadre de l'apprentissage statistique est pour cela mis à profit. La première partie des travaux se consacre à apprendre à planifier. Deux contraintes réalistes sont prise en compte : d'une part, une modélisation imparfaite des objets susceptible de générer des ambiguïtés supplémentaires - d'autre part, le budget d'apprentissage est coûteux (en temps, en énergie), donc limité. La deuxième partie des travaux s'attache à exploiter au mieux les observations au cours de la reconnaissance. La possibilité d'une reconnaissance active multi-échelles est étudiée pour permettre une interprétation au plus tôt dans le processus séquentiel d'acquisition de l'information. Les observations sont également utilisées pour estimer la pose de l'objet de manière robuste afin d'assurer la cohérence entre les modalités planifiées et celles réellement atteintes par l'agent visuel.
APA, Harvard, Vancouver, ISO, and other styles
48

Gulluni, Sébastien. "Un système interactif pour l'analyse des musiques électroacoustiques." Phd thesis, Télécom ParisTech, 2011. http://pastel.archives-ouvertes.fr/pastel-00676691.

Full text
Abstract:
Les musiques électroacoustiques sont encore aujourd'hui relativement peu abordées dans les recherches qui visent à retrouver des informations à partir du contenu musical. La plupart des travaux de recherche concernant ces musiques sont centrés sur les outils de composition, la pédagogie et l'analyse musicale. Dans ce travail de thèse, nous nous intéressons aux problématiques scientifiques liées à l'analyse des musiques électroacoustiques. Après avoir replacé ces musiques dans leur contexte historique, une étude des pratiques d'analyse de trois professionnels nous permet d'obtenir des pistes pour l'élaboration d'un système d'analyse. Ainsi, nous proposons un système interactif d'aide à l'analyse des musiques électroacoustiques qui permet de retrouver les différentes instances des objets sonores composant une pièce polyphonique. Le système proposé permet dans un premier temps de réaliser une segmentation afin de dégager les instances initiales des objets sonores principaux. L'utilisateur peut ainsi sélectionner les objets qu'il vise avant de rentrer dans une boucle d'interaction qui utilise l'apprentissage actif et le retour de pertinence fourni par l'utilisateur. Le retour apporté par l'utilisateur est utilisé par le système qui réalise une classification multilabel des différents segments sonores en fonction des objets sonores visés. Une évaluation par simulation utilisateur est réalisée à partir d'un corpus de pièces synthétiques. L'évaluation montre que notre approche permet d'obtenir des résultats satisfaisants en un nombre raisonnable d'interactions.
APA, Harvard, Vancouver, ISO, and other styles
49

Beaugnon, Anaël. "Expert-in-the-loop supervised learning for computer security detection systems." Thesis, Paris Sciences et Lettres (ComUE), 2018. http://www.theses.fr/2018PSLEE049/document.

Full text
Abstract:
L’objectif de cette thèse est de faciliter l’utilisation de l’apprentissage supervisé dans les systèmes de détection pour renforcer la détection. Dans ce but, nous considérons toute la chaîne de traitement de l’apprentissage supervisé (annotation, extraction d’attributs, apprentissage, et évaluation) en impliquant les experts en sécurité. Tout d’abord, nous donnons des conseils méthodologiques pour les aider à construire des modèles de détection supervisés qui répondent à leurs contraintes opérationnelles. De plus, nous concevons et nous implémentons DIADEM, un outil de visualisation interactif qui aide les experts en sécurité à appliquer la méthodologie présentée. DIADEM s’occupe des rouages de l’apprentissage supervisé pour laisser les experts en sécurité se concentrer principalement sur la détection. Par ailleurs, nous proposons une solution pour réduire le coût des projets d’annotations en sécurité informatique. Nous concevons et implémentons un système d’apprentissage actif complet, ILAB, adapté aux besoins des experts en sécurité. Nos expériences utilisateur montrent qu’ils peuvent annoter un jeu de données avec une charge de travail réduite grâce à ILAB. Enfin, nous considérons la génération automatique d’attributs pour faciliter l’utilisation de l’apprentissage supervisé dans les systèmes de détection. Nous définissons les contraintes que de telles méthodes doivent remplir pour être utilisées dans le cadre de la détection de menaces. Nous comparons trois méthodes de l’état de l’art en suivant ces critères, et nous mettons en avant des pistes de recherche pour mieux adapter ces techniques aux besoins des experts en sécurité<br>The overall objective of this thesis is to foster the deployment of supervised learning in detection systems to strengthen detection. To that end, we consider the whole machine learning pipeline (data annotation, feature extraction, training, and evaluation) with security experts as its core since it is crucial to pursue real-world impact. First, we provide methodological guidance to help security experts build supervised detection models that suit their operational constraints. Moreover, we design and implement DIADEM, an interactive visualization tool that helps security experts apply the methodology set out. DIADEM deals with the machine learning machinery to let security experts focus mainly on detection. Besides, we propose a solution to effectively reduce the labeling cost in computer security annotation projects. We design and implement an end-to-end active learning system, ILAB, tailored to security experts needs. Our user experiments on a real-world annotation project demonstrate that they can annotate a dataset with a low workload thanks to ILAB. Finally, we consider automatic feature generation as a means to ease, and thus foster, the use of machine learning in detection systems. We define the constraints that such methods should meet to be effective in building detection models. We compare three state-of-the-art methods based on these criteria, and we point out some avenues of research to better tailor automatic feature generation to computer security experts needs
APA, Harvard, Vancouver, ISO, and other styles
50

Chovet, Camila. "Manipulation de la turbulence en utilisant le contrôle par mode glissant et le contrôle par apprentissage : de l'écoulement sur une marche descendante à une voiture réelle." Thesis, Valenciennes, 2018. http://www.theses.fr/2018VALE0016/document.

Full text
Abstract:
Ce travail vise à faire une pré-évaluation des paramètres de contrôle en vue de réduire la traînée sur véhicule réel. Deux mécanismes d’actionnement différents (Murata micro-blower et couteau d’air) ont été caractérisés et comparés en vue de déterminer leurs qualités ainsi que leurs limites. Les micro-blowers ont pour but d’exciter la couche limite en vue de perturber directement les structures tourbillonnaires formées dans la couche de cisaillement. Le couteau d’air étudié, à surface arrondie, pourrait être considéré comme un dispositif actif de réduction de la traînée à effet Coanda équivalent au dispositif passif de type boat-tail. Différentes stratégies de contrôle en boucles ouverte et fermée sont examinées, telles que le soufflage continu, le forçage périodique, le contrôle du mode glissant (SMC) et le contrôle par apprentissage (MLC). La SMC est un algorithme robuste en boucle fermée permettant de suivre, d’atteindre et de maintenir une consigne prédéfinie; cette approche présente l’intérêt d’avoir une capacité d’adaptation prenant en compte les perturbations extérieures inconnues. Le contrôle par apprentissage est un contrôle sans modèle qui permet de définir des lois de contrôle efficaces qualifiées et optimisées via une fonction coût/objectif spécifique au problème donné. Une solution hybride entre MLC et SMC peut également fournir un contrôle adaptatif exploitant les mécanismes d’actionnement non linéaires les plus adaptés au problème. L’ensemble de ces techniques de contrôle ont été testées sur diverses applications expérimentales allant d’une simple configuration académique de marche descendante jusqu’à des géométries présentant une structure d’écoulement représentatives de véhicules réels. Pour la configuration de marche descendante, l’objectif était de réduire expérimentalement la zone de recirculation via une rangée de micro-jets et de l’estimer par des capteurs de pression. Les contrôles d’écoulement ont été réalisés par forçage périodique ainsi que par MLC. On démontre dans ce cas que la MLC peut surpasser le contrôle par forçage périodique. Pour la configuration sur corps épais (corps d’Ahmed), l’objectif était de réduire et/ou de maintenir la traînée aérodynamique via un couteau d’air placé sur la partie supérieure du hayon arrière et évalué par le biais d’une balance aérodynamique. Le soufflage continu et le forçage périodique ont été utilisés dans ce cas comme stratégies de contrôle en boucle ouverte permettant ainsi de faire une comparaison avec les algorithmes SMC et MLC. La pré-évaluation des paramètres de contrôle a permis d’obtenir des informations importantes en vue d’une réduction de la traînée sur un véhicule réel. Dans ce cadre, les premiers essais de caractérisation sur véhicules réels ont été réalisés sur piste et un dispositif d’actionnement ainsi qu’un protocole expérimental sont également présentés en perspective à ce travail<br>The present work aims to pre-evaluate flow control parameters to reduce the drag in a real vehicle. Two different actuation mechanisms (Murata’s micro-blower, and air-knives) are characterized and compared to define their advantages and limitations. Murata micro-blowers energized the boundary layer to directly perturb the vortex structures formed in the shear layer region. The air-knife has a rounded surface, adjacent to the slit exit, that could be considered as an active boat-tail (Coanda effect) for drag reduction. Different open-loop and closed-loop control strategies are examined, such as continuous blowing, periodic forcing, sliding mode control (SMC) and machine learning control (MLC). SMC is a robust closed-loop algorithm to track, reach and maintain a predefined set-point; this approach has on-line adaptivity in changing conditions. Machine learning control is a model-free control that learns an effective control law that is judged and optimized with respect to a problem-specific cost/objective function. A hybrid between MLC and SMC may provide adaptive control exploiting the best non-linear actuation mechanisms. Finally, all these parameters are brought together and tested in real experimental applications representative of the mean wake and shear-layer structures related to control of real cars. For the backward-facing step, the goal is to experimentally reduce the recirculation zone. The flow is manipulated by a row of micro-blowers and sensed by pressure sensors. Initial measurements were carried out varying the periodic forcing. MLC is used to improve performance optimizing a control law with respect to a cost function. MLC is shown to outperform periodic forcing. For the Ahmed body, the goal is to reduce the aerodynamic drag of the square-back Ahmed body. The flow is manipulated by an air-knife placed on the top trailing edge and sensed by a force balance. Continuous blowing and periodic forcing are used as open-loop strategies. SMC and MLC algorithms are applied and compared to the open-loop cases. The pre-evaluation of the flow control parameters yielded important information to reduce the drag of a car. The first real vehicle experiments were performed on a race track. The first actuator device concept and sensor mechanism are presented
APA, Harvard, Vancouver, ISO, and other styles
We offer discounts on all premium plans for authors whose works are included in thematic literature selections. Contact us to get a unique promo code!

To the bibliography