To see the other types of publications on this topic, follow the link: Traitement du language.

Dissertations / Theses on the topic 'Traitement du language'

Create a spot-on reference in APA, MLA, Chicago, Harvard, and other styles

Select a source type:

Consult the top 50 dissertations / theses for your research on the topic 'Traitement du language.'

Next to every source in the list of references, there is an 'Add to bibliography' button. Press on it, and we will generate automatically the bibliographic reference to the chosen work in the citation style you need: APA, MLA, Harvard, Chicago, Vancouver, etc.

You can also download the full text of the academic publication as pdf and read online its abstract whenever available in the metadata.

Browse dissertations / theses on a wide variety of disciplines and organise your bibliography correctly.

1

Coria, Juan Manuel. "Continual Representation Learning in Written and Spoken Language." Electronic Thesis or Diss., université Paris-Saclay, 2023. http://www.theses.fr/2023UPASG025.

Full text
Abstract:
L'apprentissage automatique a récemment connu des avancées majeures, mais les modèles actuels sont généralement entraînés une fois sur une tâche cible et leurs paramètres sont rarement révisés.Ce problème affecte les performances après la mise en production car les spécifications des tâches et les données peuvent évoluer avec le temps.Pour résoudre ce problème, l'apprentissage continu propose un entraînement au fil du temps, à mesure que de nouvelles données sont disponibles.Cependant, les modèles entraînés de cette manière souffrent d'une perte de performance sur les exemples déjà vus, un phé
APA, Harvard, Vancouver, ISO, and other styles
2

Moncecchi, Guillermo. "Recognizing speculative language in research texts." Paris 10, 2013. http://www.theses.fr/2013PA100039.

Full text
Abstract:
Cette thèse présente une méthodologie pour résoudre des problèmes de classification, en particulier ceux concernant le classement séquentiel pour les tâches de traitement du langage naturel. Elle propose l'utilisation d'une méthode itérative, basée sur l'analyse des erreurs, pour améliorer la performance de classification. Ce sont des experts du domaine qui suggèrent l'intégration des connaissances spécifiques du domaine dans le processus d'apprentissage automatique. Nous avons appliqué et évalué la méthodologie dans deux tâches liées à la détection des phénomènes de « hedging » dans des texte
APA, Harvard, Vancouver, ISO, and other styles
3

Caucheteux, Charlotte. "Language representations in deep learning algorithms and the brain." Electronic Thesis or Diss., université Paris-Saclay, 2023. http://www.theses.fr/2023UPASG031.

Full text
Abstract:
Algorithmes et cerveau, bien que de nature extrêmement différentes, sont deux systèmes capables d'effectuer des tâches de langage complexes. En particulier, de récentes avancées en intelligence artificielle ont permis l'émergence d'algorithmes produisant des textes de qualité remarquablement similaire à ceux des humains (ChatGPT, GPT-3). De telles similarités interrogent sur la façon dont le cerveau et ces algorithmes traitent le langage, les mécanismes qu'ils utilisent et les représentations internes qu'ils construisent. Ma thèse consiste à comparer les représentations internes de ces deux sy
APA, Harvard, Vancouver, ISO, and other styles
4

Godey, Nathan. "Improving Representations for Language Modeling." Electronic Thesis or Diss., Sorbonne université, 2024. https://accesdistant.sorbonne-universite.fr/login?url=https://theses-intra.sorbonne-universite.fr/2024SORUS649.pdf.

Full text
Abstract:
Le domaine du traitement automatique du langage a récemment connu un changement de paradigme majeur qui a conduit à des améliorations remarquables par rapport aux capacités perçues des systèmes résultants. Ce changement, à savoir l'avènement des systèmes génératifs en lieu et place des systèmes prédictifs, a induit un changement profond dans les objectifs implicites des systèmes linguistiques basés sur l'apprentissage profond : alors que l'objectif des anciennes méthodes était d'extraire des caractéristiques pertinentes à partir d'énoncés textuels en utilisant l'auto-supervision, nous essayons
APA, Harvard, Vancouver, ISO, and other styles
5

Ayotte, Nathalie. "Le traitement lexicographique du vocabulaire politique Trois études de cas: Nationalisme, nationaliste et nation." Thesis, University of Ottawa (Canada), 2006. http://hdl.handle.net/10393/27328.

Full text
Abstract:
Our study builds on the metalexicographical studies devoted to the ideological representations contained within dictionaries. While the myth of objectivity of the dictionary keeps prevailing in the general public, many researchers are striving to deconstruct it. Their studies have helped depicting the sometimes subjective nature of the dictionary, particularly when describing the lexicon related to certain topics such as sexuality, religion or politics. Therefore, as part of our study, we wished to confirm the assumption, commonly accepted by researchers in the field, according to which the di
APA, Harvard, Vancouver, ISO, and other styles
6

Muller, Benjamin. "How Can We Make Language Models Better at Handling the Diversity and Variability of Natural Languages ?" Electronic Thesis or Diss., Sorbonne université, 2022. http://www.theses.fr/2022SORUS399.

Full text
Abstract:
Ces dernières années, le passage à l’échelle (scaling) des modèles de langues basés sur l’apprentissage profond — principalement en termes de taille de modèle, de taille de l’ensemble de données d’entraînement et de puissance de calcul d’entraînement — est devenu l’une des principales forces motrices des progrès empiriques en Traitement Automatique du Langage (TAL). Comme l’illustrent les exemples de (Peters et al., 2018b; Devlin et al., 2018a; Brown et al., 2020;Zhang et al., 2022; Chowdhery et al., 2022), cela conduit à de meilleures performances en apprentissage supervisé ainsi qu’à de meil
APA, Harvard, Vancouver, ISO, and other styles
7

Millour, Alice. "Myriadisation de ressources linguistiques pour le traitement automatique de langues non standardisées." Thesis, Sorbonne université, 2020. http://www.theses.fr/2020SORUL126.

Full text
Abstract:
Les sciences participatives, et en particulier la myriadisation (crowdsourcing) bénévole, représentent un moyen peu exploité de créer des ressources langagières pour certaines langues encore peu dotées, et ce malgré la présence de locuteurs sur le Web. Nous présentons dans ce travail les expériences que nous avons menées pour permettre la myriadisation de ressources langagières dans le cadre du développement d'un outil d'annotation automatique en parties du discours. Nous avons appliqué cette méthodologie à trois langues non standardisées, en l'occurrence l'alsacien, le créole guadeloupéen et
APA, Harvard, Vancouver, ISO, and other styles
8

Nguyen, Tu Anh. "Spoken Language Modeling from Raw Audio." Electronic Thesis or Diss., Sorbonne université, 2024. http://www.theses.fr/2024SORUS089.

Full text
Abstract:
La parole a toujours été un mode dominant de connexion sociale et de communication. Cependant, le traitement et la modélisation de la parole sont difficiles en raison de la variabilité le parole. Les technologies classiques de la parole reposent sur une modélisation en cascade, c'est-à-dire la transcription de la parole en texte avec un système de reconnaissance automatique de la parole (ASR), le traitement du texte transcrit à l'aide de méthodes de traitement du langage naturel (NLP) et la conversion du texte en parole avec un modèle de synthèse vocale. Cette méthode élimine la variabilité de
APA, Harvard, Vancouver, ISO, and other styles
9

Cadène, Rémi. "Deep Multimodal Learning for Vision and Language Processing." Electronic Thesis or Diss., Sorbonne université, 2020. http://www.theses.fr/2020SORUS277.

Full text
Abstract:
Les technologies du numérique ont joué un rôle déterminant dans la transformation de notre société. Des méthodes statistiques récentes ont été déployées avec succès afin d’automatiser le traitement de la quantité croissante d’images, de vidéos et de textes que nous produisons quotidiennement. En particulier, les réseaux de neurones profonds ont été adopté par les communautés de la vision par ordinateur et du traitement du langage naturel pour leur capacité à interpréter le contenu des images et des textes une fois entraînés sur de grands ensembles de données. Les prog
APA, Harvard, Vancouver, ISO, and other styles
10

Laurençon, Hugo. "Foundation Vision-Language models." Electronic Thesis or Diss., Sorbonne université, 2025. http://www.theses.fr/2025SORUS004.

Full text
Abstract:
Ces dernières années, les grands modèles de langage (LLMs) ont montré des performances remarquables sur des tâches variées et ont commencé à être largement intégrés dans diverses applications. Les modèles vision-langage (VLMs), qui étendent les LLMs en incorporant en plus la compréhension d'images, offrent un potentiel supplémentaire. Ces modèles pourraient transformer des domaines tels que le développement web en traduisant des captures d'écran de pages web en code, faciliter la recherche d'informations via une navigation web autonome, et automatiser des tâches comme la classification et la s
APA, Harvard, Vancouver, ISO, and other styles
11

Leybaert, Jacqueline. "Le traitement du mot écrit chez l'enfant sourd." Doctoral thesis, Universite Libre de Bruxelles, 1987. http://hdl.handle.net/2013/ULB-DIPOT:oai:dipot.ulb.ac.be:2013/213416.

Full text
APA, Harvard, Vancouver, ISO, and other styles
12

Saadane, Houda. "Le traitement automatique de l’arabe dialectalisé : aspects méthodologiques et algorithmiques." Thesis, Université Grenoble Alpes (ComUE), 2015. http://www.theses.fr/2015GREAL022/document.

Full text
APA, Harvard, Vancouver, ISO, and other styles
13

Riabi, Arij. "Small is Beautiful : addressing resource scarcity, language variation, and transfer challenges for automatic detection of Harmful language." Electronic Thesis or Diss., Sorbonne université, 2025. http://www.theses.fr/2025SORUS049.

Full text
Abstract:
Les plateformes en ligne sont devenues des espaces majeurs de discussion publique et, à ce titre, favorisent de nombreuses interactions positives. Cependant, ces forums peuvent aussi promouvoir des contenus nuisibles ou radicaux. La montée des abus en ligne, bien qu'ils ne représentent qu'une fraction des communications sur internet, se manifestent sous diverses formes, notamment par des comportements agressifs. L'extrémisme en ligne est devenu l'un des défis les plus pressants découlant de ces comportements agressifs, car il propage non seulement des idéologies nuisibles, mais conduit aussi à
APA, Harvard, Vancouver, ISO, and other styles
14

Helwe, Chadi. "Evaluating and Improving the Reasoning Abilities of Language Models." Electronic Thesis or Diss., Institut polytechnique de Paris, 2024. http://www.theses.fr/2024IPPAT021.

Full text
Abstract:
Cette thèse examine les capacités de raisonnement des Petits Modèles de Langage (SLMs) et Grands Modèles de Langage (LLMs) et expose leurs limites. Elle présente LogiTorch, une bibliothèque Python facilitant l’entraînement de modèles sur diverses tâches de raisonnement. La thèse inclut également TINA, une technique d’augmentation de données qui renforce la robustesse des SLMs face à la négation dans les tâches d’implication textuelle. De plus, la thèse explore les capacités des LLMs avec MAFALDA, un nouveau benchmark pour la classification des sophismes, intégrant une métrique d’évaluation qui
APA, Harvard, Vancouver, ISO, and other styles
15

Jourdan, Fanny. "L'équité dans le traitement automatique des langues : des méthodes traditionnelles vers l'explicabilité." Electronic Thesis or Diss., Université de Toulouse (2023-....), 2024. http://www.theses.fr/2024TLSES095.

Full text
Abstract:
Le domaine en plein essor du Traitement Automatique des Langues (TAL) se trouve à un tournant critique où l'intégration de l'équité dans ses structures est devenue impérative. Cette thèse se penche sur ces questions, soulignant que l'équité dans ce domaine constitue une exigence morale et éthique. Elle nécessite un examen approfondi des interactions entre ces technologies et les diverses populations humaines, ainsi que de leur impact sur ces dernières. À travers cette perspective, cette thèse propose une étude détaillée sur l'élaboration de méthodologies de TAL équitables et sur l'évaluation d
APA, Harvard, Vancouver, ISO, and other styles
16

Gonthier, Isabelle. "L'influence des connaissances phonologiques et semantiques dans le traitement lexical: Le role de la valeur d'imagerie des mots." Thesis, University of Ottawa (Canada), 2003. http://hdl.handle.net/10393/29017.

Full text
Abstract:
Cette these s'inscrit dans le domaine de la psychologie cognitive du langage et porte sur le role des connaissances phonologiques et semantiques dans le traitement lexical. Nous nous proposons d'examiner l'interaction entre ces variables dans le comportement des lecteurs adultes de langue maternelle francaise. La premiere etude de cette these porte sur l'etablissement de normes de frequence subjective et d'imagerie mentale pour 1,760 mots monosyllabiques de la langue francaise. Cette etude permet l'etablissement de normes stables et, en complement aux normes deja publiees par Desrochers et Ber
APA, Harvard, Vancouver, ISO, and other styles
17

Boukhatem, Moncef. "Natural Language Processing Approaches for Closed-Domain Technical Dialogues." Electronic Thesis or Diss., Institut polytechnique de Paris, 2024. http://www.theses.fr/2024IPPAX151.

Full text
Abstract:
Cette thèse explore diverses méthodes avancées en traitement du langage naturel (TAL) pour améliorer l'interprétation et l'analyse des données textuelles, en particulier dans les dialogues multilingues et techniques. La recherche se concentre sur plusieurs tâches clés du TAL, notamment l'extraction de mots-clés, la modélisation d'arbres syntaxiques, les systèmes de question-réponse techniques, la résolution de cataphore et l'exploitation des données spécifiques à un domaine.Une partie du travail présente de nouvelles approches utilisant des graphes de mots (GoW) et des arbres syntaxiques pour
APA, Harvard, Vancouver, ISO, and other styles
18

Boulanger, Hugo. "Data augmentation and generation for natural language processing." Electronic Thesis or Diss., université Paris-Saclay, 2023. http://www.theses.fr/2023UPASG019.

Full text
Abstract:
De plus en plus de domaines cherchent à automatiser une partie de leur processus.Le traitement automatique des langues contient des méthodes permettant d'extraire des informations dans des textes.Ces méthodes peuvent utiliser de l'apprentissage automatique.L'apprentissage automatique nécessite des données annotées pour faire de l'extraction d'information de manière optimale.L'application de ces méthodes à de nouveaux domaines nécessite d'obtenir des données annotées liée à la tâche.Le problème que nous souhaitons résoudre est de proposer et d'étudier des méthodes de génération pour améliorer l
APA, Harvard, Vancouver, ISO, and other styles
19

Bull, Hannah. "Learning sign language from subtitles." Electronic Thesis or Diss., université Paris-Saclay, 2023. http://www.theses.fr/2023UPASG013.

Full text
Abstract:
Les langues des signes sont un moyen de communication essentiel pour les communautés sourdes. Elles sont des langues visuo-gestuelles, qui utilisent comme modalités les mains, les expressions faciales, le regard et les mouvements du corps. Elles ont des structures grammaticales complexes et des lexiques riches qui sont considérablement différents de ceux que l'on trouve dans les langues parlées. Les spécificités des langues des signes en termes de canaux de communication, de structure et de grammaire exigent des méthodologies distinctes. Les performances des systèmes de traduction automatique
APA, Harvard, Vancouver, ISO, and other styles
20

Alkan, Atilla Kaan. "Natural Language Processing for Analyzing Messages of Astrophysical Observations." Electronic Thesis or Diss., université Paris-Saclay, 2024. http://www.theses.fr/2024UPASG114.

Full text
Abstract:
Cette thèse aborde l’un des défis majeurs dans l’analyse de textes non structurés en astrophysique : l’extraction et la synthèse d’information sur des objets célestes à partir de rapports d’observation astronomique. L'extraction d'information (EI) est un sous-domaine clé du traitement automatique des langues (TAL), qui vise à transformer des textes non structurés en une représentation formelle et exploitable, permettant ainsi de structurer les connaissances contenues dans les documents. Les tâches classiques de l’EI incluent la reconnaissance d’entités nommées (REN), l'extraction de relations,
APA, Harvard, Vancouver, ISO, and other styles
21

Kla, Régis. "Osmose : a natural language based object oriented approach with its CASE tool." Paris 1, 2004. http://www.theses.fr/2004PA010020.

Full text
Abstract:
Dans cette thèse nous présentons une nouvelle approche de génie logiciel orienté objet, baseé sur le langage naturel et qui se nomme OsMoSE. Nous présentons aussi son outil d'aide à la conception du même nom. Cette approche assiste l'ingénieur dans la délicate tâche de transformation des besoins initialement décrits en langage naturel, vers un ensemble de schémas conceptuel orienté objet. Entièrement basé sur une architecture de système expert, l'outil OsMoSE repose sur un ensemble de règles lui permettant de simuler le comportement d'un analyste humain lors de la phase de conception d'un syst
APA, Harvard, Vancouver, ISO, and other styles
22

Curiel, Diaz Arturo Tlacaélel. "Using formal logic to represent sign language phonetics in semi-automatic annotation tasks." Thesis, Toulouse 3, 2015. http://www.theses.fr/2015TOU30308/document.

Full text
Abstract:
Cette thèse présente le développement d'un framework formel pour la représentation des Langues de Signes (LS), les langages des communautés Sourdes, dans le cadre de la construction d'un système de reconnaissance automatique. Les LS sont de langues naturelles, qui utilisent des gestes et l'espace autour du signeur pour transmettre de l'information. Cela veut dire que, à différence des langues vocales, les morphèmes en LS ne correspondent pas aux séquences de sons; ils correspondent aux séquences de postures corporelles très spécifiques, séparés par des changements tels que de mouvements. De pl
APA, Harvard, Vancouver, ISO, and other styles
23

Gainon, de Forsan de Gabriac Clara. "Deep Natural Language Processing for User Representation." Electronic Thesis or Diss., Sorbonne université, 2021. http://www.theses.fr/2021SORUS274.

Full text
Abstract:
La dernière décennie a vu s’imposer le développement des méthodes de Deep Learning (DL), aussi bien dans le monde académique qu’industriel. Ce succès peut s’expliquer par la capacité du DL à modéliser des entités toujours plus complexes. En particulier, les méthodes de Representation Learning se concentrent sur l’apprentissage de représentations latentes issues de données hétérogènes, à la fois versatiles et réutilisables, notamment en Natural Language Processing (NLP). En parallèle, le nombre grandissant de systèmes reposant sur des données utilisateurs entraînent leur lot de défis.Cette thès
APA, Harvard, Vancouver, ISO, and other styles
24

Albert, Sabine. "Analyse diachronique du Trésor de la Langue Française et de l'Oxford English Dictionary : le traitement des emprunts." Thesis, Cergy-Pontoise, 2018. http://www.theses.fr/2018CERG0936/document.

Full text
Abstract:
ANALYSE DIACHRONIQUE DU TRÉSOR DE LA LANGUE FRANÇAISEET DE L’OXFORD ENGLISH DICTIONARY :LE TRAITEMENT DES EMPRUNTSRÉSUMÉIl n’est pas de langue dont le lexique ne s’enrichisse au gré des emprunts, qui permettent d’accroître et de renouveler le fonds lexical au fur et à mesure que se développent les relations entre les pays et entre leurs cultures. Les langues anglaise et française, en raison de leur rayonnement sur tous les continents, ont acquis un contingent très important de mots venus d’ailleurs, qu’elles se sont en outre souvent partagé. En effet, du fait de leur proximité géographique et
APA, Harvard, Vancouver, ISO, and other styles
25

Pasquiou, Alexandre. "Deciphering the neural bases of language comprehension using latent linguistic representations." Electronic Thesis or Diss., université Paris-Saclay, 2023. http://www.theses.fr/2023UPASG041.

Full text
Abstract:
Au cours des dernières décennies, les modèles de langage (MLs) ont atteint des performances équivalentes à celles de l'homme sur plusieurs tâches. Ces modèles peuvent générer des représentations vectorielles qui capturent diverses propriétés linguistiques des mots d'un texte, telles que la sémantique ou la syntaxe. Les neuroscientifiques ont donc mis à profit ces progrès et ont commencé à utiliser ces modèles pour explorer les bases neurales de la compréhension du langage. Plus précisément, les représentations des ML calculées à partir d'une histoire sont utilisées pour modéliser les données c
APA, Harvard, Vancouver, ISO, and other styles
26

Zervakis, Georgios. "Enriching large language models with semantic lexicons and analogies." Electronic Thesis or Diss., Université de Lorraine, 2023. http://www.theses.fr/2023LORR0039.

Full text
Abstract:
Les progrès récents de l'apprentissage profond et des réseaux de neurones ont permis d'aborder des tâches complexes de traitement du langage naturel, qui sont appliquées à une pléthore de problèmes réels allant des assistants intelligents dans les appareils mobiles à la prédiction du cancer. Néanmoins, les systèmes modernes basés sur ces approches présentent plusieurs limitations qui peuvent compromettre leurs performances et leur fiabilité, les rendre injustes envers les minorités ou exposer des données personnelles. Nous sommes convaincus que l'intégration de connaissances et de raisonnement
APA, Harvard, Vancouver, ISO, and other styles
27

Asadullah, Munshi. "Identification of Function Points in Software Specifications Using Natural Language Processing." Thesis, Paris 11, 2015. http://www.theses.fr/2015PA112228/document.

Full text
Abstract:
La nécessité d'estimer la taille d’un logiciel pour pouvoir en estimer le coût et l’effort nécessaire à son développement est une conséquence de l'utilisation croissante des logiciels dans presque toutes les activités humaines. De plus, la nature compétitive de l’industrie du développement logiciel rend courante l’utilisation d’estimations précises de leur taille, au plus tôt dans le processus de développement. Traditionnellement, l’estimation de la taille des logiciels était accomplie a posteriori à partir de diverses mesures appliquées au code source. Cependant, avec la prise de conscience,
APA, Harvard, Vancouver, ISO, and other styles
28

Martin, Alexander. "Les biais dans le traitement et l'apprentissage phonologiques." Thesis, Paris Sciences et Lettres (ComUE), 2017. http://www.theses.fr/2017PSLEE071/document.

Full text
Abstract:
Pendant la perception de la parole, les locuteurs sont biaisés par un grand nombre de facteurs. Par exemple, il existe des limitations cognitives comme la mémoire ou l’attention, mais aussi des limitations linguistiques comme leur langue maternelle. Cette thèse se concentre sur deux de ces facteurs : les biais de traitement pendant la reconnaissance des mots, et les biais d’apprentissage pendant le processus de transmission. Ces facteurs peuvent se combiner et, au cours du temps, influencer l’évolution des langues. Dans la première partie de cette thèse, nous nous concentrons sur le processus
APA, Harvard, Vancouver, ISO, and other styles
29

Jalalzai, Hamid. "Learning from multivariate extremes : theory and application to natural language processing." Electronic Thesis or Diss., Institut polytechnique de Paris, 2020. http://www.theses.fr/2020IPPAT043.

Full text
Abstract:
Les extrêmes apparaissent dans une grande variété de données. Par exemple,concernant les données hydrologiques, les extrêmes peuvent correspondre à des inondations, des moussons voire des sécheresses. Les données liées à l’activité humaine peuvent également conduire à des situations extrêmes, dans le cas des transactions bancaires, le montant alloué à une vente peut être considérable et dépasser les transactions courantes. Un autre exemple lié à l’activité humaine est la fréquence des mots utilisés : certains mots sont omniprésents alors que d’autres sont très rares. Qu’importe le contexte app
APA, Harvard, Vancouver, ISO, and other styles
30

Fló, Rama Emilia. "Au-delà du comportement : marqueurs électrophysiologiques du traitement conscient." Electronic Thesis or Diss., Sorbonne université, 2024. http://www.theses.fr/2024SORUS259.

Full text
Abstract:
L'étude de la conscience pose un paradoxe. La «chose» que nous essayons d'évaluer est omniprésente et inévitable lorsque nous considérons notre propre conscience, mais inaccessible pour celle des autres. Normalement, nous déduisons qu'un individu est conscient de ses réponses et de son comportement adéquats. Cependant, chez les patients avec des troubles de la conscience (DoC), établir le niveau de conscience par le comportement est un défi clinique majeur. L'objectif principal de cette thèse était de développer de nouveaux paradigmes expérimentaux pour évaluer l'état de conscience chez les pa
APA, Harvard, Vancouver, ISO, and other styles
31

Colin, Émilie. "Traitement automatique des langues et génération automatique d'exercices de grammaire." Electronic Thesis or Diss., Université de Lorraine, 2020. http://www.theses.fr/2020LORR0059.

Full text
Abstract:
Le thème support de cette thèse la génération de paraphrases sur support neuronal. Nos perspectives sont éducatives : créer des exercices de grammaire pour le français. La paraphrase est une opération de reformulation. Nos travaux tendent à attester que les modèles séquence vers séquence ne sont pas de simples répétiteurs mais peuvent apprendre la syntaxe. Nous avons montré, en combinant divers modèles, que la représentation de l'information sous de multiples formes (en utilisant de la donnée formelle (RDF), couplée à du texte pour l'étendre ou le réduire, ou encore seulement du texte) permet
APA, Harvard, Vancouver, ISO, and other styles
32

Ben, Nasr Sana. "Mining and modeling variability from natural language documents : two case studies." Thesis, Rennes 1, 2016. http://www.theses.fr/2016REN1S013/document.

Full text
Abstract:
L'analyse du domaine vise à identifier et organiser les caractéristiques communes et variables dans un domaine. Dans la pratique, le coût initial et le niveau d'effort manuel associés à cette analyse constituent un obstacle important pour son adoption par de nombreuses organisations qui ne peuvent en bénéficier. La contribution générale de cette thèse consiste à adopter et exploiter des techniques de traitement automatique du langage naturel et d'exploration de données pour automatiquement extraire et modéliser les connaissances relatives à la variabilité à partir de documents informels. L'enj
APA, Harvard, Vancouver, ISO, and other styles
33

Dinkar, Tanvi. "Computational models of disfluencies : fillers and discourse markers in spoken language understanding." Electronic Thesis or Diss., Institut polytechnique de Paris, 2022. http://www.theses.fr/2022IPPAT001.

Full text
Abstract:
Les gens s'expriment rarement de la même manière qu'ils écrivent - en effet ils écrivent rarement de manière diffluente. Les disfluences sont des interruptions dans le flux régulier de la parole, telles que les pauses (silencieuses), les répétitions de mots ou les interruptions pour corriger une phrase précédemment dite. Bien qu'il s'agisse d'une caractéristique naturelle de la parole spontanée et malgré la riche littérature linguistique qui traite de leur caractère informatif, elles sont souvent considérées comme du bruit et éliminées lors du post-traitement des transcriptions de sortie des s
APA, Harvard, Vancouver, ISO, and other styles
34

Petitjean, Simon. "Génération modulaire de grammaires formelles." Thesis, Orléans, 2014. http://www.theses.fr/2014ORLE2048/document.

Full text
Abstract:
Les travaux présentés dans cette thèse visent à faciliter le développement de ressources pour le traitement automatique des langues. Les ressources de ce type prennent des formes très diverses, en raison de l’existence de différents niveaux d’étude de la langue (syntaxe, morphologie, sémantique,. . . ) et de différents formalismes proposés pour la description des langues à chacun de ces niveaux. Les formalismes faisant intervenir différents types de structures, un unique langage de description n’est pas suffisant : il est nécessaire pour chaque formalisme de créer un langage dédié (ou DSL), et
APA, Harvard, Vancouver, ISO, and other styles
35

Hadi, Abdine. "Leveraging Transformer-Based Language Models to Bridge the Gap Between Language and Specialized Domains." Electronic Thesis or Diss., Institut polytechnique de Paris, 2024. http://www.theses.fr/2024IPPAX020.

Full text
Abstract:
L'ère des modèles de langage basés sur des 'transormers' a ouvert la voie à un nouveau paradigme dans le traitement du langage naturel (NLP), permettant des performances remarquables dans un large éventail de tâches dans les domaines de la compréhension du langage naturel (NLU) et de la génération du langage naturel (NLG). Cette thèse se penche sur le potentiel de transformation des modèles de langage basés sur les 'transformers' lorsqu'ils sont appliqués à des domaines et des langues spécialisés. Elle comprend quatre projets de recherche, chacun contribuant à l'objectif global d'amélioration
APA, Harvard, Vancouver, ISO, and other styles
36

Khelifi, Hadria. "Didactique du discours : le français langue d’écrit universitaire en Algérie. Étude contrastive entre filières scientifiques et sciences humaines." Electronic Thesis or Diss., Université de Lorraine, 2019. http://www.theses.fr/2019LORR0282.

Full text
Abstract:
Cette thèse intitulée « Didactique du discours : le français langue d’écrit universitaire en Algérie. Étude contrastive entre filières scientifiques et sciences humaines » aborde la question de l’enseignement et/ou l’apprentissage des langues étrangères en Algérie à travers les caractéristiques du genre scientifique. Il s’est agi de savoir si ce genre conserve sa stabilité dans l’écrit universitaire quand il est question de pratique d’une langue étrangère, en l’occurrence, le français. La langue française n’existe pas pour elle-même. Elle est la langue de scolarité à l’université algérienne et
APA, Harvard, Vancouver, ISO, and other styles
37

Ortiz, Suarez Pedro. "A Data-driven Approach to Natural Language Processing for Contemporary and Historical French." Electronic Thesis or Diss., Sorbonne université, 2022. http://www.theses.fr/2022SORUS155.

Full text
Abstract:
Depuis plusieurs années, les approches neuronales ont régulièrement amélioré l'état de l'art du traitement automatique des langues (TAL) sur une grande variété de tâches. L'un des principaux facteurs ayant permis ces progrès continus est l'utilisation de techniques d'apprentissage par transfert. Ces méthodes consistent à partir d'un modèle pré-entraîné et à le réutiliser, avec peu ou pas d'entraînement supplémentaire, pour traiter d'autres tâches. Même si ces modèles présentent des avantages évidents, leur principal inconvénient est la quantité de données nécessaire pour les pré-entraîner. Ain
APA, Harvard, Vancouver, ISO, and other styles
38

Carrasco-Ortiz, Haydee. "Morphosyntactic learning of french as a second language." Thesis, Aix-Marseille, 2012. http://www.theses.fr/2012AIXM3039.

Full text
Abstract:
La présente thèse a pour but d'étudier l'apprentissage morphosyntaxique du français comme langue seconde (L2). Elle cherche à examiner l'hypothèse proposée par certains modèles linguistiques et neurocognitifs selon laquelle les difficultés observées chez des bilingues tardifs à maitriser les connaissances morphosyntaxiques en L2 peuvent s'expliquer par un échec lors de la représentation mentale et le traitement de l'information morphosyntaxique, en comparaison avec les locuteurs natifs. Ainsi, les travaux présentés dans cette thèse utilisent des mesures électrophysiologiques afin de déterminer
APA, Harvard, Vancouver, ISO, and other styles
39

Douzon, Thibault. "Language models for document understanding." Electronic Thesis or Diss., Lyon, INSA, 2023. http://www.theses.fr/2023ISAL0075.

Full text
Abstract:
Chaque jour, les entreprises du monde entier reçoivent et traitent d'énormes volumes de documents, entraînant des coûts considérables. Pour réduire ces coûts, de grandes entreprises automatisent le traitement documentaire, visant une automatisation complète. Cette thèse se concentre sur l'utilisation de modèles d'apprentissage machine pour extraire des informations de documents. Les progrès récents en matière d'architecture de modèle, en particulier les transformeurs, ont révolutionné le domaine grâce à leur utilisation généralisée de l'attention et à l'amélioration des pré-entraînements auto-
APA, Harvard, Vancouver, ISO, and other styles
40

Samson, Juan Sarah Flora. "Exploiting resources from closely-related languages for automatic speech recognition in low-resource languages from Malaysia." Thesis, Université Grenoble Alpes (ComUE), 2015. http://www.theses.fr/2015GREAM061/document.

Full text
Abstract:
Les langues en Malaisie meurent à un rythme alarmant. A l'heure actuelle, 15 langues sont en danger alors que deux langues se sont éteintes récemment. Une des méthodes pour sauvegarder les langues est de les documenter, mais c'est une tâche fastidieuse lorsque celle-ci est effectuée manuellement.Un système de reconnaissance automatique de la parole (RAP) serait utile pour accélérer le processus de documentation de ressources orales. Cependant, la construction des systèmes de RAP pour une langue cible nécessite une grande quantité de données d'apprentissage comme le suggèrent les techniques act
APA, Harvard, Vancouver, ISO, and other styles
41

Nilsson, Anna. "Lire et comprendre en français langue étrangère : Les pratiques de lecture et le traitement des similitudes intra- et interlexicales." Doctoral thesis, Stockholms universitet, Institutionen för franska, italienska och klassiska språk, 2007. http://urn.kb.se/resolve?urn=urn:nbn:se:su:diva-7048.

Full text
Abstract:
This thesis investigates learners’ reading practices and especially the processing of cross-linguistic similarities at the lexical level. The aim is to determine how learners proceed in order to understand text in French (L3). Data were collected using various reading comprehension tasks in combination with the think-aloud method. Reading comprehension was mainly assessed through a translation task while the reading practices were observed in think-aloud protocols. According to a reading comprehension score, 20 learners were divided into high level and low level groups. The majority of partici
APA, Harvard, Vancouver, ISO, and other styles
42

Kessler, Rémy. "Traitement automatique d’informations appliqué aux ressources humaines." Thesis, Avignon, 2009. http://www.theses.fr/2009AVIG0167/document.

Full text
Abstract:
Depuis les années 90, Internet est au coeur du marché du travail. D’abord mobilisée sur des métiers spécifiques, son utilisation s’étend à mesure qu’augmente le nombre d’internautes dans la population. La recherche d’emploi au travers des « bourses à l’emploi électroniques » est devenu une banalité et le e-recrutement quelque chose de courant. Cette explosion d’informations pose cependant divers problèmes dans leur traitement en raison de la grande quantité d’information difficile à gérer rapidement et efficacement pour les entreprises. Nous présentons dans ce mémoire, les travaux que nous avo
APA, Harvard, Vancouver, ISO, and other styles
43

Delyfer, Annie. "Le rôle de l'hémisphère droit dans le traitement des mots connotant une émotion et des mots dénotant une émotion." Thesis, McGill University, 1995. http://digitool.Library.McGill.CA:80/R/?func=dbin-jump-full&object_id=23389.

Full text
Abstract:
A lexical decision task and a semantic judgment task were conducted with eight right brain-damaged, six left brain-damaged and eight control subjects to explore the role of the right hemisphere in the processing of words that connote an emotion and of words that denote an emotion. Accuracy and reaction time data were measured in each experiment. Despite differences in the detailed patterns of responses across groups, there was little evidence to suggest that the right hemisphere is involved in the processing of the two kinds of emotional words. Valence (positive vs negative) had no influence o
APA, Harvard, Vancouver, ISO, and other styles
44

Linhares, Pontes Elvys. "Compressive Cross-Language Text Summarization." Thesis, Avignon, 2018. http://www.theses.fr/2018AVIG0232/document.

Full text
Abstract:
La popularisation des réseaux sociaux et des documents numériques a rapidement accru l'information disponible sur Internet. Cependant, cette quantité massive de données ne peut pas être analysée manuellement. Parmi les applications existantes du Traitement Automatique du Langage Naturel (TALN), nous nous intéressons dans cette thèse au résumé cross-lingue de texte, autrement dit à la production de résumés dans une langue différente de celle des documents sources. Nous analysons également d'autres tâches du TALN (la représentation des mots, la similarité sémantique ou encore la compression de p
APA, Harvard, Vancouver, ISO, and other styles
45

Bose, Tulika. "Transfer learning for abusive language detection." Electronic Thesis or Diss., Université de Lorraine, 2023. http://www.theses.fr/2023LORR0019.

Full text
Abstract:
La prolifération des médias sociaux, malgré ses nombreux avantages, a entraîné une augmentation des propos injurieux. Ces propos, qui sont généralement blessants, toxiques ou empreints de préjugés à l'encontre d'individus ou de groupes, doivent être détectés et modérés rapidement par les plateformes en ligne. Les modèles d'apprentissage profond pour la détection de propos abusifs ont montré des niveaux de performance élevé quand ils sont évalués sur des données similaires à celles qui ont servi à entraîner les modèles, mais sont nettement moins performants s'ils sont évalués sur des données do
APA, Harvard, Vancouver, ISO, and other styles
46

Labeau, Matthieu. "Neural language models : Dealing with large vocabularies." Thesis, Université Paris-Saclay (ComUE), 2018. http://www.theses.fr/2018SACLS313/document.

Full text
Abstract:
Le travail présenté dans cette thèse explore les méthodes pratiques utilisées pour faciliter l'entraînement et améliorer les performances des modèles de langues munis de très grands vocabulaires. La principale limite à l'utilisation des modèles de langue neuronaux est leur coût computationnel: il dépend de la taille du vocabulaire avec laquelle il grandit linéairement. La façon la plus aisée de réduire le temps de calcul de ces modèles reste de limiter la taille du vocabulaire, ce qui est loin d'être satisfaisant pour de nombreuses tâches. La plupart des méthodes existantes pour l'entraînement
APA, Harvard, Vancouver, ISO, and other styles
47

Planchou, Clément. "Traitement auditifs non verbaux et troubles du développement du langage oral : perception et production musicales." Thesis, Lille 3, 2014. http://www.theses.fr/2014LIL30034.

Full text
Abstract:
L’objectif de cette thèse est de déterminer si le déficit auditif des enfants dysphasiques est spécifique au domaine verbal et d’étudier les liens qu’entretiennent les habiletés verbales et musicales chez ces enfants. Nous avons testé 18 dysphasiques et des enfants au développement du langage typique (DLT) âgés de 7 à 12 ans. Dans la première étude, nous avons étudié leurs capacités de détection des syllabes dans des phrases chantées et parlées. Nos résultats ont confirmé les déficits de détection des syllabes chez les dysphasiques. Nous n’avons toutefois pas observé d’effet facilitateur du ch
APA, Harvard, Vancouver, ISO, and other styles
48

Piat, Guilhem Xavier. "Incorporating expert knowledge in deep neural networks for domain adaptation in natural language processing." Electronic Thesis or Diss., université Paris-Saclay, 2023. http://www.theses.fr/2023UPASG087.

Full text
Abstract:
Les Modèles de Langage (LMs) de pointe sont capables de converser, résumer, traduire, résoudre des problèmes inédits, raisonner, et manipuler des concepts abstraits à niveau quasi-humain. Cependant, pour acquérir ces capacités, et en particulier pour acquérir une forme de ``bon sens'' ou des connaissances spécifiques à un domaine, ils requièrent de vastes quantités de texte, qui ne sont pas disponibles pour toutes les langues ou tous les domaines. De surcroît, leurs besoins en puissance de calcul ne sont atteignables que par quelques organisations, limitant leur spécificité ainsi que leur appl
APA, Harvard, Vancouver, ISO, and other styles
49

Gaschi, Félix. "Understanding and Evaluating Unsupervised Cross-lingual Embeddings in the General and in the Clinical Domains." Electronic Thesis or Diss., Université de Lorraine, 2023. http://www.theses.fr/2023LORR0347.

Full text
Abstract:
Les données labellisées et non labellisées sont plus souvent disponibles en anglais que dans d'autres langues. Dans le domaine clinique, les données non anglaises peuvent être encore plus rares. Les représentations, ou plongements lexicaux, multilingues peuvent avoir deux propriétés utiles dans cette situation. La première est l'alignement multilingue, où les représentations de différentes langues partagent le même espace latent. Plus concrètement, les mots qui sont la traduction l'un de l'autre doivent avoir des représentations similaires. La deuxième propriété est l'apprentissage par transfe
APA, Harvard, Vancouver, ISO, and other styles
50

Knyazeva, Elena. "Apprendre par imitation : applications à quelques problèmes d'apprentissage structuré en traitement des langues." Thesis, Université Paris-Saclay (ComUE), 2018. http://www.theses.fr/2018SACLS134/document.

Full text
Abstract:
L’apprentissage structuré est devenu omniprésent dans le traitement automatique des langues naturelles. De nombreuses applications qui font maintenant partie de notre vie telles que des assistants personnels, la traduction automatique, ou encore la reconnaissance vocale, reposent sur ces techniques. Les problèmes d'apprentissage structuré qu’il est nécessaire de résoudre sont de plus en plus complexes et demandent de prendre en compte de plus en plus d’informations à des niveaux linguistiques variés (morphologique, syntaxique, etc.) et reposent la question du meilleurs compromis entre la fines
APA, Harvard, Vancouver, ISO, and other styles
We offer discounts on all premium plans for authors whose works are included in thematic literature selections. Contact us to get a unique promo code!