To see the other types of publications on this topic, follow the link: Documentation automatique des langues.

Dissertations / Theses on the topic 'Documentation automatique des langues'

Create a spot-on reference in APA, MLA, Chicago, Harvard, and other styles

Select a source type:

Consult the top 50 dissertations / theses for your research on the topic 'Documentation automatique des langues.'

Next to every source in the list of references, there is an 'Add to bibliography' button. Press on it, and we will generate automatically the bibliographic reference to the chosen work in the citation style you need: APA, MLA, Harvard, Chicago, Vancouver, etc.

You can also download the full text of the academic publication as pdf and read online its abstract whenever available in the metadata.

Browse dissertations / theses on a wide variety of disciplines and organise your bibliography correctly.

1

Okabe, Shu. "Modèles faiblement supervisés pour la documentation automatique des langues." Electronic Thesis or Diss., université Paris-Saclay, 2023. http://www.theses.fr/2023UPASG091.

Full text
Abstract:
Face à la menace d'extinction de la moitié des langues parlées aujourd'hui d'ici la fin du siècle, la documentation des langues est un domaine de la linguistique notamment consacré à la collecte, annotation et archivage de données. Dans ce contexte, la documentation automatique des langues vise à outiller les linguistes pour faciliter différentes étapes de la documentation, à travers des approches de traitement automatique du langage.Dans le cadre du projet de documentation automatique CLD2025, cette thèse s'intéresse principalement à deux tâches : la segmentation en mots, identifiant les fron
APA, Harvard, Vancouver, ISO, and other styles
2

Godard, Pierre. "Unsupervised word discovery for computational language documentation." Thesis, Université Paris-Saclay (ComUE), 2019. http://www.theses.fr/2019SACLS062/document.

Full text
Abstract:
La diversité linguistique est actuellement menacée : la moitié des langues connues dans le monde pourraient disparaître d'ici la fin du siècle. Cette prise de conscience a inspiré de nombreuses initiatives dans le domaine de la linguistique documentaire au cours des deux dernières décennies, et 2019 a été proclamée Année internationale des langues autochtones par les Nations Unies, pour sensibiliser le public à cette question et encourager les initiatives de documentation et de préservation. Néanmoins, ce travail est coûteux en temps, et le nombre de linguistes de terrain, limité. Par conséque
APA, Harvard, Vancouver, ISO, and other styles
3

Guinaudeau, Camille. "Structuration automatique de flux télévisuels." Phd thesis, INSA de Rennes, 2011. http://tel.archives-ouvertes.fr/tel-00646522.

Full text
Abstract:
L'augmentation du nombre de documents multimédias disponibles rend nécessaire la mise en place de méthodes de structuration automatique capables de faciliter l'accès à l'information contenue dans les documents, tout en étant suffisamment génériques pour pouvoir structurer des documents tout-venants. Dans ce cadre, nous proposons deux types de structuration, linéaire et hiérarchique, s'appuyant sur les transcriptions automatiques de la parole prononcée dans les documents. Ces transcriptions, indépendantes du type des documents considérés, sont exploitées par le biais de méthodes issues du trait
APA, Harvard, Vancouver, ISO, and other styles
4

Pitzalis, Denis. "3D et sémantique : nouveaux outils pour la documentation et l'exploration du patrimoine culturel." Paris 6, 2013. http://www.theses.fr/2013PA066642.

Full text
Abstract:
Le rôle des musées et des bibliothèques a évolué passant principalement d'un lieu de collecte et de stockage à un rôle plus interactif, où les visiteurs peuvent découvrir le patrimoine et la connaissance culturelle de manière plus attrayante. En raison de ce changement, les TIC ont un rôle important à jouer, non seulement pour aider à documenter et à conserver les informations, telles que les images et les modèles 3D d'objets historiques et d'œuvres d'art, mais aussi afin de sensibiliser le grand public à l'importance de ces objets pour l'humanité. Le processus de construction d'une collection
APA, Harvard, Vancouver, ISO, and other styles
5

Lima, Ronaldo. "Contribution au traitement automatique de textes médicaux en portugais : étude du syntagme verbal." Nice, 1995. http://www.theses.fr/1995NICE2012.

Full text
Abstract:
Cette recherche consiste en une contribution au traitement automatique de textes (pneumologie allergologie) en portugais à partir de l'analyse du syntagme verbal. Il s'agit d'une étude linguistique à trois niveaux : morpho-syntaxique, syntactico-sémantique et conceptuel, ce dernier conduisant à la représentation des thèmes de compréhension (idées-clés) du domaine en question<br>The research work in question undertakes to analyse the verb phrase in portuguese and thus contributes to the automatic processing of medical texts. It is a linguistic study with firstly a morpho-syntactic perspective,
APA, Harvard, Vancouver, ISO, and other styles
6

Borges, de Faveri Claudia. "Contribution au traitement automatique de textes médicaux en portugais : étude du syntagme nominal." Nice, 1995. http://www.theses.fr/1995NICE2013.

Full text
Abstract:
Le cadre général de cette étude consiste en une description du syntagme nominal en portugais à partir d'un corpus de textes scientifiques et techniques (documents médicaux en portugais). Il s'agit d'un travail qui, tout en étant une étude linguistique au sens classique du terme, vise à dégager un ensemble de ressources linguistiques qui puissent être utilisées par la suite dans le traitement automatique des langues (TAL) notamment le traitement documentaire et la traduction par ordinateur<br>This study is mainly concerned with the description of the portuguese noun phrase, in a scientific and
APA, Harvard, Vancouver, ISO, and other styles
7

Gauthier, Elodie. "Collecter, Transcrire, Analyser : quand la machine assiste le linguiste dans son travail de terrain." Thesis, Université Grenoble Alpes (ComUE), 2018. http://www.theses.fr/2018GREAM011/document.

Full text
Abstract:
Depuis quelques décennies, de nombreux scientifiques alertent au sujet de la disparition des langues qui ne cesse de s'accélérer.Face au déclin alarmant du patrimoine linguistique mondial, il est urgent d'agir afin de permettre aux linguistes de terrain, a minima, de documenter les langues en leur fournissant des outils de collecte innovants et, si possible, de leur permettre de décrire ces langues grâce au traitement des données assisté par ordinateur.C'est ce que propose ce travail, en se concentrant sur trois axes majeurs du métier de linguiste de terrain : la collecte, la transcription et
APA, Harvard, Vancouver, ISO, and other styles
8

Francony, Jean Marc. "Modélisation du dialogue et représentation du contexte d'interaction dans une interface de dialogue multi-modes dont l'un des modes est dédié à la langue naturelle écrite." Grenoble 2, 1993. http://www.theses.fr/1993GRE21038.

Full text
Abstract:
Les problemes poses par la representation du contexte d'interaction dans le systeme de dialogue d'une interface homme-machine a plusieurs modes, sont a l'origines de l'etude d'un mecanisme de focalisation faisant l'objet de cette these. L'accent est mis sur l'ancrage du modele de focalisation dans la surface de l'intervention. L'ancrage du modele propose est exprime au niveau de chacun des modes, dans un modele thematique, a l'image du modele defini dans cette these pour le mode langue naturelle. Ce dernier est derive des travaux de l'ecole de linguistique formelle de prague dont sont repriose
APA, Harvard, Vancouver, ISO, and other styles
9

Moneimne, Walid. "TAO vers l'arabe : spécification d'une génération standard de l'arabe ; réalisation d'un prototype anglais-arabe à partir d'un analyseur existant." Grenoble 1, 1989. http://www.theses.fr/1989GRE10061.

Full text
Abstract:
La these se situe dans un ensemble d'etudes linguistiques et informatiques visant a voir dans quelle mesure la methode linguistique et les outils informatiques du geta s'appliquent a la langue arabe. Apres une breve synthese des etudes anterieures en traitement automatique des langues naturelles applique a l'arabe, sont rappeles les fondements de la traduction assistee par ordinateur ainsi que les aspects theoriques et methodologiques les plus marquants de l'approche suivie au geta. Cette approche consiste essentiellement a travailler simultanement a differents niveaux d'interpretation de desc
APA, Harvard, Vancouver, ISO, and other styles
10

Pellegrini, Thomas. "Transcription automatique de langues peu dotées." Phd thesis, Université Paris Sud - Paris XI, 2008. http://tel.archives-ouvertes.fr/tel-00619657.

Full text
Abstract:
Les technologies liées à la parole, et en particulier la reconnaissance de la parole, suscitent un grand intérêt pour un nombre croissant de langues. La très grande majorité des langues du monde ne possèdent pas de grands corpus de données nécessaires à l'élaboration des systèmes de reconnaissance à l'état de l'art, fondés sur des paradigmes probabilistes pour la plupart. Les travaux menés au cours de cette thèse ont consisté, dans un premier temps, à identifier les difficultés rencontrées lors de l'élaboration d'un système pour une langue peu dotée. Nous avons travaillé principalement sur le
APA, Harvard, Vancouver, ISO, and other styles
11

Colin, Émilie. "Traitement automatique des langues et génération automatique d'exercices de grammaire." Electronic Thesis or Diss., Université de Lorraine, 2020. http://www.theses.fr/2020LORR0059.

Full text
Abstract:
Le thème support de cette thèse la génération de paraphrases sur support neuronal. Nos perspectives sont éducatives : créer des exercices de grammaire pour le français. La paraphrase est une opération de reformulation. Nos travaux tendent à attester que les modèles séquence vers séquence ne sont pas de simples répétiteurs mais peuvent apprendre la syntaxe. Nous avons montré, en combinant divers modèles, que la représentation de l'information sous de multiples formes (en utilisant de la donnée formelle (RDF), couplée à du texte pour l'étendre ou le réduire, ou encore seulement du texte) permet
APA, Harvard, Vancouver, ISO, and other styles
12

Vasilescu, Ioana Gabriela. "Contribution à l'identification automatique des langues romanes." Lyon 2, 2001. http://theses.univ-lyon2.fr/documents/lyon2/2001/vasilescu_ig.

Full text
Abstract:
Ce travail de thèse s'inscrit dans la thématique de l'identification automatique des langues. Son objectif est de mettre en évidence des indices linguistiques susceptibles de permettre la distinction des idiomes issus du latin. Les langues romanes ont bénéficié d'une longue tradition descriptive et représentent des langues officielles dans plusieurs pays du monde. La présente démarche prend en compte cinq langues néo-latines (espagnol, français, italien, portugais et roumain). L'étude des approches taxinomistes consacrées aux idiomes néo-latins révèle une pertinence particulière de la classifi
APA, Harvard, Vancouver, ISO, and other styles
13

Gutiérrez, Celaya Jorge Arturo. "Fusion d'informations en identification automatique des langues." Toulouse 3, 2005. http://www.theses.fr/2005TOU30098.

Full text
Abstract:
En identification automatique des langues nous nous intéressons au problème de fusion des informations de décision issues de différents experts. Pour explorer et comparer des stratégies de fusion, nous les modélisons au moyen de méthodes formelles de classification provenant soit de la théorie statistique, comme les mélanges de lois gaussiennes, les réseaux de neurones et le classificateur discriminant, soit des travaux de recherche récents pour les théories des possibilités et des fonctions de croyance. Nous proposons une méthodologie formelle de fusion dans le paradigme bayésien : l'évaluati
APA, Harvard, Vancouver, ISO, and other styles
14

Vasilescu, Ioana Gabriela Hombert Jean-Marie. "Contribution à l'identification automatique des langues romanes." [S.l.] : [s.n.], 2001. http://demeter.univ-lyon2.fr:8080/sdx/theses/lyon2/2001/vasilescu_ig.

Full text
APA, Harvard, Vancouver, ISO, and other styles
15

Tirilly, Pierre. "Traitement automatique des langues pour l'indexation d'images." Phd thesis, Université Rennes 1, 2010. http://tel.archives-ouvertes.fr/tel-00516422.

Full text
Abstract:
Bien que s'inscrivant dans un cadre global de recherche d'information (RI) classique, l'indexation d'image ne tire que peu parti des nombreux travaux existants en RI textuelle et en traitement automatique des langues (TAL). Nous identifions deux niveaux auxquels de tels travaux peuvent s'intégrer aux systèmes d'indexation d'images. Le premier niveau est celui de la description du contenu visuel des images. Pour y intégrer des techniques de TAL, nous adoptons la description des images par mots visuels proposée par Sivic et Zisserman. Cette représentation soulève deux problématiques similaires a
APA, Harvard, Vancouver, ISO, and other styles
16

Tirilly, Pierre. "Traitement automatique des langues pour l'indexation d'images." Phd thesis, Rennes 1, 2010. http://www.theses.fr/2010REN1S045.

Full text
Abstract:
Nous nous intéressons, dans cette thèse, à l'usage du traitement automatique des langues (TAL) dans les systèmes d'indexation d'images. Au niveau de la description du contenu visuel des images, nous nous appuyons sur la description des images sous forme de mots visuels, qui pose des problématiques similaires à celles de l'indexation textuelle. Nous utilisons des méthodes de TAL (pondérations et stop-lists) afin de déterminer les mots visuels pertinents, puis nous utilisons les modèles de langues pour prendre en compte certaines relations géométriques entre mots visuels. Au niveau de la descrip
APA, Harvard, Vancouver, ISO, and other styles
17

Pellegrino, François. "Une approche phonétique en identification automatique des langues." Toulouse 3, 1998. http://www.theses.fr/1998TOU30294.

Full text
APA, Harvard, Vancouver, ISO, and other styles
18

Dary, Franck. "Modèles incrémentaux pour le traitement automatique des langues." Electronic Thesis or Diss., Aix-Marseille, 2022. http://www.theses.fr/2022AIXM0248.

Full text
Abstract:
Cette thèse s'inscrit dans le domaine du traitement automatique de la langue, elle concerne plus particulièrement la prédiction de la structure syntaxico morphologique des phrases.Il s'agit donc, à partir d'un texte, de découper ce dernier en phrases puis en mots et d'associer aux mots une partie de discours et des traits morphologiques puis de relier les mots pour expliciter la structure syntaxique.La thèse propose un modèle de prédiction qui permet de réaliser ces tâches simultanément et de manière incrémentale : le texte est lu caractère par caractère et l'intégralité des prédictions lingui
APA, Harvard, Vancouver, ISO, and other styles
19

Perez, Laura Haide. "Génération automatique de phrases pour l'apprentissage des langues." Thesis, Université de Lorraine, 2013. http://www.theses.fr/2013LORR0062/document.

Full text
Abstract:
Dans ces travaux, nous explorons comment les techniques de Générations Automatiques de Langue Naturelle (GLN) peuvent être utilisées pour aborder la tâche de génération (semi-)automatique de matériel et d'activités dans le contexte de l'apprentissage de langues assisté par ordinateur. En particulier, nous montrons comment un Réalisateur de Surface (RS) basé sur une grammaire peut être exploité pour la création automatique d'exercices de grammaire. Notre réalisateur de surface utilise une grammaire réversible étendue, à savoir SemTAG, qui est une Grammaire d'Arbre Adjoints à Structure de Traits
APA, Harvard, Vancouver, ISO, and other styles
20

Perez, Laura Haide. "Génération automatique de phrases pour l'apprentissage des langues." Electronic Thesis or Diss., Université de Lorraine, 2013. http://www.theses.fr/2013LORR0062.

Full text
Abstract:
Dans ces travaux, nous explorons comment les techniques de Générations Automatiques de Langue Naturelle (GLN) peuvent être utilisées pour aborder la tâche de génération (semi-)automatique de matériel et d'activités dans le contexte de l'apprentissage de langues assisté par ordinateur. En particulier, nous montrons comment un Réalisateur de Surface (RS) basé sur une grammaire peut être exploité pour la création automatique d'exercices de grammaire. Notre réalisateur de surface utilise une grammaire réversible étendue, à savoir SemTAG, qui est une Grammaire d'Arbre Adjoints à Structure de Traits
APA, Harvard, Vancouver, ISO, and other styles
21

McCabe, Gragnic Julie. "Documentation et description du maya tenek." Thesis, Paris 3, 2014. http://www.theses.fr/2014PA030166.

Full text
Abstract:
L’objectif premier de cette thèse est de contribuer à la documentation et à la description d’une langue indigène en danger de disparition au Mexique et parallèlement, à sa revitalisation, en apportant aux locuteurs de cette langue des outils pour l’enseignement et la transmission de la langue.La langue étudiée dans cette thèse est le tének (parfois écrit teenek ; connu également comme le huastèque/wastek) – une langue maya parlée dans l’Etat de San Luis Potosí au Mexique. Bien qu’elle ne soit pas officiellement reconnue comme étant en danger d’extinction à court terme, le destin du ténekdemeur
APA, Harvard, Vancouver, ISO, and other styles
22

Donzo, Bunza Yugia Jean-Pierre. "Langues bantoues de l'entre Congo-Ubangi, RD Congo: documentation, reconstruction, classification et contacts avec les langues oubanguiennes." Doctoral thesis, Universite Libre de Bruxelles, 2015. http://hdl.handle.net/2013/ULB-DIPOT:oai:dipot.ulb.ac.be:2013/209145.

Full text
Abstract:
Cette étude comparative des langues de l’entre Congo-Ubangi entreprend la documentation, la classification et la reconstruction de dix langues bantoues (bolondó, bonyange, ebudzá, ebwela, libóbi, lingɔmbɛ, mondóngó, monyɔ́ngɔ, mosángé, págáɓéte) parlées dans l’aire géographique comprise entre les fleuves Congo et Ubangi dans le nord-ouest de la RD Congo et présente leur interaction avec les langues oubanguiennes voisines (gbánzírí, gɔ́bú, máɓó, mbānzā, monzɔmbɔ, ngbandi, ngbaka). <p>Une étude lexicostatistique quantitative détermine le degré de similarité entre les langues bantoues à l’étude a
APA, Harvard, Vancouver, ISO, and other styles
23

Kuramoto, Hélio. "Proposition d'un système de recherche d'information assistée par ordinateur : avec application à la langue portugaise." Lyon 2, 1999. http://theses.univ-lyon2.fr/documents/lyon2/1999/hkuramoto.

Full text
Abstract:
Nous proposons un système d'indexation et de recherche d'information afin de faire face aux difficultés rencontrées par les usagers lors de l'utilisation de tels systèmes. Nous en distinguons deux types de problèmes : la faible précision des résultats d'une recherche d'information et le manque de convivialité des interfaces de recherche d'information. Nous limitons notre champ d'étude aux systèmes de recherche d'information (SRI) qui portent sur des bases de données texte plein (full text). Suite à l'étude de ces difficultés, nous sommes parvenus à une conclusion identique à celle proposée par
APA, Harvard, Vancouver, ISO, and other styles
24

Lavecchia, Caroline. "Les Triggers Inter-langues pour la Traduction Automatique Statistique." Phd thesis, Université Nancy II, 2010. http://tel.archives-ouvertes.fr/tel-00545463.

Full text
Abstract:
Les recherches menées dans le cadre de mon doctorat concernent le domaine de la Traduction Automatique (TA), ou comment traduire d'une langue source vers une langue cible sans aucune intervention humaine. Mes travaux se sont plus particulièrement concentrés sur l'approche statistique de la TA qui consiste à utiliser différents modèles probabilistes appris sur des quantités importantes de corpus parallèles alignés afin de trouver la traduction la plus vraisemblable d'une phrase source. Deux problèmes étroitement liés à l'approche statistique de la TA sont abordés dans ce manuscrit : la collecte
APA, Harvard, Vancouver, ISO, and other styles
25

Denoual, Etienne. "Méthodes en caractères pour le traitement automatique des langues." Phd thesis, Université Joseph Fourier (Grenoble), 2006. http://tel.archives-ouvertes.fr/tel-00107056.

Full text
Abstract:
Le traitement automatique des langues fondé sur les données a récemment assimilé de nombreuses techniques et perspectives héritées du domaine de la reconnaissance de parole. Parmi celles-ci, les méthodes qui utilisent le mot comme unité de traitement sont difficilement transposables aux systèmes d'écriture sans séparateur orthographique, et ne sont donc pas multilingues.<br />Le présent travail promeut l'utilisation de méthodes travaillant au niveau du signal de l'écrit: le caractère, unité immédiatement accessible dans toute langue informatisée, permet de se passer de segmentation en mots, ét
APA, Harvard, Vancouver, ISO, and other styles
26

Moreau, Fabienne. "Revisiter le couplage traitement automatique des langues et recherche d'information." Phd thesis, Université Rennes 1, 2006. http://tel.archives-ouvertes.fr/tel-00524514.

Full text
Abstract:
La principale difficulté des systèmes de recherche d'information (SRI) est d'établir une correspondance entre l'information recherchée par un utilisateur et celle contenue dans leur base documentaire. Pour y parvenir, ils tentent généralement un appariement des mots de la requête posée avec ceux représentant le contenu des documents. Un tel mécanisme, fondé sur une simple comparaison de chaînes de caractères, ne permet cependant pas de prendre en compte le fait qu'un même mot peut posséder plusieurs sens et qu'une même idée peut être formulée de différentes manières. Pour pallier ces difficult
APA, Harvard, Vancouver, ISO, and other styles
27

Bardet, Adrien. "Architectures neuronales multilingues pour le traitement automatique des langues naturelles." Thesis, Le Mans, 2021. http://www.theses.fr/2021LEMA1002.

Full text
Abstract:
La traduction des langues est devenue un besoin essentiel pour la communication entre humains dans un monde où les possibilités de communication s'élargissent. La traduction automatique est une réponse à l'évolution de ce besoin.Plus récemment, la traduction automatique neuronale s'est imposée avec les grandes performances des systèmes neuronaux qui ouvrent une nouvelle aire de l'apprentissage automatique. Les systèmes neuronaux exploitent de grandes quantités de données pour apprendre à réaliser une tâche automatiquement. Dans le cadre de la traduction automatique, les quantités de données pa
APA, Harvard, Vancouver, ISO, and other styles
28

Lê, Viêt Bac. "Reconnaissance automatique de la parole pour des langues peu dotées." Université Joseph Fourier (Grenoble), 2006. http://www.theses.fr/2006GRE10061.

Full text
Abstract:
Dans la plupart des langues peu dotées, les services liés aux technologies du traitement de l'oral sont inexistants. L'originalité de mon travail de thèse vient de la volonté d'aborder ces langues pour lesquelles peu ou pas de ressources nécessaires pour la reconnaissance automatique de la parole sont disponibles. Ce manuscrit présente notre méthodologie qui vise à développer et adapter rapidement un système de reconnaissance automatique de la parole continue pour une nouvelle langue peu dotée. La nature statistique des approches nécessite de disposer d'une grande quantité de ressources (vocab
APA, Harvard, Vancouver, ISO, and other styles
29

Moreau, Fabienne Sébillot Pascale. "Revisiter le couplage traitement automatique des langues et recherche d'information." [S.l.] : [s.n.], 2006. ftp://ftp.irisa.fr/techreports/theses/2006/moreau.pdf.

Full text
APA, Harvard, Vancouver, ISO, and other styles
30

Manad, Otman. "Nettoyage de corpus web pour le traitement automatique des langues." Thesis, Paris 8, 2018. http://www.theses.fr/2018PA080011.

Full text
Abstract:
Le corpus est la matière première de la linguistique informatique et du traitement automatique du langage. Peu de langues disposent de corpus riches en ressources web (forums, blogs, etc.), et ce bien qu'elles soient parfois les seules disponibles. Or ces ressources contiennent beaucoup de bruit (menus, publicités, etc.). Le filtrage des données parasites et des répétitions nécessite un nettoyage à grand échelle que les chercheurs font en général à la main.Cette thèse propose un système automatique de constitution de corpus web nettoyés de leur bruit. Il est constitué de trois modules : (a) un
APA, Harvard, Vancouver, ISO, and other styles
31

Manad, Otman. "Nettoyage de corpus web pour le traitement automatique des langues." Electronic Thesis or Diss., Paris 8, 2018. http://www.theses.fr/2018PA080011.

Full text
Abstract:
Le corpus est la matière première de la linguistique informatique et du traitement automatique du langage. Peu de langues disposent de corpus riches en ressources web (forums, blogs, etc.), et ce bien qu'elles soient parfois les seules disponibles. Or ces ressources contiennent beaucoup de bruit (menus, publicités, etc.). Le filtrage des données parasites et des répétitions nécessite un nettoyage à grand échelle que les chercheurs font en général à la main.Cette thèse propose un système automatique de constitution de corpus web nettoyés de leur bruit. Il est constitué de trois modules : (a) un
APA, Harvard, Vancouver, ISO, and other styles
32

Mammadova, Nayiba. "Eléments de description et documentation du tat de l'Apshéron, langue iranienne d'Azerbaïdjan." Thesis, Sorbonne Paris Cité, 2017. http://www.theses.fr/2017USPCF016/document.

Full text
Abstract:
Cette thèse est une grammaire descriptive du tat de l’Apshéron, une langue iranienne de la branche sud-ouest parlée en Azerbaïdjan. Il s’agit de la première description d’un dialecte tat musulman dans une langue occidentale. Après une introduction détaillée présentant le contexte sociolinguistique et la phonologie, le présent travail aborde les différentes parties du discours, le marquage des fonctions grammaticales, la morphologie verbale (dérivation, classes morphologiques du verbe, locutions verbales, emplois et valeurs des formes conjuguées). Les principaux faits de syntaxe de la phrase co
APA, Harvard, Vancouver, ISO, and other styles
33

Bouamor, Houda. "Etude de la paraphrase sous-phrastique en traitement automatique des langues." Phd thesis, Université Paris Sud - Paris XI, 2012. http://tel.archives-ouvertes.fr/tel-00717702.

Full text
Abstract:
La variabilité en langue est une source majeure de difficultés dans la plupart des applications du traitement automatique des langues. Elle se manifeste dans le fait qu'une même idée ou un même événement peut être exprimé avec des mots ou des groupes de mots différents ayant la même signification dans leur contexte respectif. Capturer automatiquement des équivalences sémantiques entre des unités de texte est une tâche complexe mais qui s'avère indispensable dans de nombreux contextes. L'acquisition a priori de listes d'équivalences met à disposition des ressources utiles pour, par exemple, amé
APA, Harvard, Vancouver, ISO, and other styles
34

Bentes, Pinto Virginia. "La représentation des connaissances dans le contexte de la documentation technique : proposition d'un modèle d'indexation." Grenoble 3, 1999. http://www.theses.fr/1999GRE39018.

Full text
Abstract:
Cette etude a eu pour but de developper une proposition de representation des connaissances vehiculees dans les documents techniques. Il s'agit donc d'une etude orientee vers une indexation a partir des syntagmes simples et complexes et qui vise une recherche d'information plus efficace. Le but principal de la recherche est de creer un modele d'indexation pour les manuels d'entretien et de maintenance utilisateur externe (memue). Pour cela nous avons construit un schema de taches (st) qui est defini comme etant des macro-structures textuelles constituees par des blocs d'information concernant
APA, Harvard, Vancouver, ISO, and other styles
35

Dimon, Pierre. "Un système multilingual d'interprétation automatique : étape du sous-logiciel "analyse" pour les langues germaniques." Metz, 1994. http://docnum.univ-lorraine.fr/public/UPV-M/Theses/1994/Dimon.Pierre.LMZ945_1.pdf.

Full text
Abstract:
La première partie de la thèse rappelle les modèles sous-jacents aux grammaires dont s'inspirent les systèmes de traitement automatique de la langue ainsi que les outils informatiques disponibles pour les appliquer. Un panorama des systèmes de traduction automatique et de traduction assistée par ordinateur illustre les développements liés à la traduction, effectués depuis le début jusqu'en 1991. En réponse aux limites de ces systèmes, la seconde partie propose une autre voie qui repose sur l'hypothèse suivante : peux-t-on réduire à un minimum la qualité d'un texte cible pour qu'un lecteur, spé
APA, Harvard, Vancouver, ISO, and other styles
36

Filhol, Michael. "Modèle descriptif des signes pour un traitement automatique des langues des signes." Phd thesis, Université Paris Sud - Paris XI, 2008. http://tel.archives-ouvertes.fr/tel-00300591.

Full text
Abstract:
Les approches formelles de représentation des signes des langues des signes sont majoritairement paramétriques et nous montrons en quoi celles-ci ne sont pas suffisantes dans l'optique d'une utilisation informatique. Les plus fortes raisons sont le caractère ni nécessaire ni suffisant de l'ensemble de paramètres traditionnellement utilisé, leur nature fixe alors qu'un signe est dynamique et évolue au cours du temps, et le fait que les descriptions ne rendent pas compte de l'adaptabilité des signes décrits à différents contextes, pourtant à l'origine de leur réutilisabilité et de la force de co
APA, Harvard, Vancouver, ISO, and other styles
37

Dégremont, Jean-François. "Ethnométhodologie et innovation technologique : le cas du traitement automatique des langues naturelles." Paris 7, 1989. http://www.theses.fr/1989PA070043.

Full text
Abstract:
La thèse débute par un rappel des étapes historiques principales du développement de l'ethnométhodologie en tant que discipline, depuis les précurseurs européens des années 30 jusqu'à l'explosion aux Etats Unis puis en Europe à partir de 1967. Une première partie reprend ensuite les concepts principaux de l'ethnométhodologie et les développe en se plaçant dans le cadre théorique de l'école pariseptiste qui tente d'associer le refus maximal des inductions et le principe d'indifférence dans les activités ethnographiques et, en particulier, dans l'utilisation ou la description des langues naturel
APA, Harvard, Vancouver, ISO, and other styles
38

Kim, Haksoo. "Structure syntaxique et structure informative (pour une analyse automatique des langues naturelles)." Aix-Marseille 1, 1995. http://www.theses.fr/1996AIX10070.

Full text
Abstract:
Le sujet de cette these vise a faire faire automatiquement par ordinateur une analyse syntaxique et informative des phrases francaises. Cette analyse doit identifier les fonctions syntaxiques et la structure informative du message. Pour ce faire, nous devons preciser les elements suivants des theories linguistiques : l'analyse en constituants immediats, les deux types de structures (exocentrique et endocentrique), le systeme de regles de reecriture, les traits pertinents ainsi que la formalisation des fonctions syntaxiques et informatives. Ces elements de theorie vont nous permettre d'elaborer
APA, Harvard, Vancouver, ISO, and other styles
39

Millour, Alice. "Myriadisation de ressources linguistiques pour le traitement automatique de langues non standardisées." Thesis, Sorbonne université, 2020. http://www.theses.fr/2020SORUL126.

Full text
Abstract:
Les sciences participatives, et en particulier la myriadisation (crowdsourcing) bénévole, représentent un moyen peu exploité de créer des ressources langagières pour certaines langues encore peu dotées, et ce malgré la présence de locuteurs sur le Web. Nous présentons dans ce travail les expériences que nous avons menées pour permettre la myriadisation de ressources langagières dans le cadre du développement d'un outil d'annotation automatique en parties du discours. Nous avons appliqué cette méthodologie à trois langues non standardisées, en l'occurrence l'alsacien, le créole guadeloupéen et
APA, Harvard, Vancouver, ISO, and other styles
40

Jourdan, Fanny. "L'équité dans le traitement automatique des langues : des méthodes traditionnelles vers l'explicabilité." Electronic Thesis or Diss., Université de Toulouse (2023-....), 2024. http://www.theses.fr/2024TLSES095.

Full text
Abstract:
Le domaine en plein essor du Traitement Automatique des Langues (TAL) se trouve à un tournant critique où l'intégration de l'équité dans ses structures est devenue impérative. Cette thèse se penche sur ces questions, soulignant que l'équité dans ce domaine constitue une exigence morale et éthique. Elle nécessite un examen approfondi des interactions entre ces technologies et les diverses populations humaines, ainsi que de leur impact sur ces dernières. À travers cette perspective, cette thèse propose une étude détaillée sur l'élaboration de méthodologies de TAL équitables et sur l'évaluation d
APA, Harvard, Vancouver, ISO, and other styles
41

Hamon, Olivier. "Vers une architecture générique et pérenne pour l'évaluation en traitement automatique des langues : spécifications, méthodologies et mesures." Paris 13, 2010. http://www.theses.fr/2010PA132022.

Full text
Abstract:
Le développement de systèmes en traitement automatique des langues (TAL) nécessite de déterminer la qualité de ce qui est produit. Que ce soit pour comparer plusieurs systèmes entre eux ou identifier les points forts et faibles d’un système isolé, l’évaluation suppose de définir avec précision et pour chaque contexte particulier une méthodologie, un protocole, des ressources linguistiques (les données nécessaires à l’apprentissage et au test des systèmes) ou encore des mesures et métriques d’évaluation. C’est à cette condition que l’amélioration des systèmes est possible afin d’obtenir des rés
APA, Harvard, Vancouver, ISO, and other styles
42

Moreau, Erwan. "Acquisition de grammaires lexicalisées pour les langues naturelles." Phd thesis, Université de Nantes, 2006. http://tel.archives-ouvertes.fr/tel-00487042.

Full text
Abstract:
L'inférence grammaticale désigne le problème qui consiste à découvrir les règles de formation des phrases d'un langage, c'est-à-dire une grammaire de celui-ci. Dans le modèle d'apprentissage de Gold, les exemples fournis sont constitués uniquement des phrases appartenant au langage. L'algorithme doit fournir une grammaire qui représente le langage énuméré. Les grammaires catégorielles sont l'un des nombreux formalismes existants pour représenter des langages. Kanazawa a montré que certaines sous-classes de ces grammaires sont apprenables, mais ses résultats ne sont pas applicables directement
APA, Harvard, Vancouver, ISO, and other styles
43

Namer, Fiammetta. "Pronominalisation et effacement du sujet en génération automatique de textes en langues romanes." Paris 7, 1990. http://www.theses.fr/1990PA077249.

Full text
Abstract:
Ce travail est centre sur la generation de textes a partir de representations semantiques, en francais et en italien. Les points abordes concernent essentiellement les aspects syntaxiques de la pronominalisation: nous montrons que les pronoms personnels et, pour l'italien, le sujet vide, tiennent une place capitale dans le mecanisme de synthese d'un texte. Apres avoir presente le modele de l. Danlos, dont nous nous sommes inspires, nous detaillons les aspects linguistiques de la pronominalisation et leurs consequences en generation: les dependances non locales et croisees mises en jeu par les
APA, Harvard, Vancouver, ISO, and other styles
44

Bourgeade, Tom. "Interprétabilité a priori et explicabilité a posteriori dans le traitement automatique des langues." Thesis, Toulouse 3, 2022. http://www.theses.fr/2022TOU30063.

Full text
Abstract:
Avec l'avènement des architectures Transformer en Traitement Automatique des Langues il y a quelques années, nous avons observé des progrès sans précédents dans diverses tâches de classification ou de génération de textes. Cependant, l'explosion du nombre de paramètres et de la complexité de ces modèles "boîte noire" de l'état de l'art, rendent de plus en plus évident le besoin désormais urgent de transparence dans les approches d'apprentissage automatique. La capacité d'expliquer, d'interpréter et de comprendre les décisions algorithmiques deviendra primordiale à mesure que les modèles inform
APA, Harvard, Vancouver, ISO, and other styles
45

Mauger, Serge. "L'interpretation des messages enigmatiques. Essai de semantique et de traitement automatique des langues." Caen, 1999. http://www.theses.fr/1999CAEN1255.

Full text
Abstract:
Oedipe, le personnage de la tragedie de sophocle, resout l'enigme du sphinx "par sa seule intelligence". Il est ici le point de depart d'une reflexion generale sur le statut linguistique des jeux de langage, dont la pratique est repandue a toutes les epoques et dans toutes les cultures. L'intelligence d'oedipe se fonde sur une capacite a "calculer" l'interpretation de l'enigme en abandonnant un raisonnement inductif (par recurrence) pour adopter un raisonnement analogique. Dans une seconde partie, on montre que le calcul du sens des messages plurivoques permet de proposer un modele d'analyse c
APA, Harvard, Vancouver, ISO, and other styles
46

Dubé, Martine. "Étude terminologique et analyse des modes de formation de 50 notions sur le traitement automatique des langues naturelles /." Thèse, Québec : Université Laval, École des gradués, 1990. http://theses.uqac.ca.

Full text
Abstract:
Mémoire (M.A.)-- Universitée du Québec à Chicoutimi, 1990.<br>"Mémoire présenté pour l'obtention du grade maître es arts (M.A.) dans le cadre d'une entente entre l'Université Laval et l'Université du Québec à Chicoutimi" CaQCU Bibliogr.: f. 137-141. Document électronique également accessible en format PDF. CaQCU
APA, Harvard, Vancouver, ISO, and other styles
47

Knyazeva, Elena. "Apprendre par imitation : applications à quelques problèmes d'apprentissage structuré en traitement des langues." Thesis, Université Paris-Saclay (ComUE), 2018. http://www.theses.fr/2018SACLS134/document.

Full text
Abstract:
L’apprentissage structuré est devenu omniprésent dans le traitement automatique des langues naturelles. De nombreuses applications qui font maintenant partie de notre vie telles que des assistants personnels, la traduction automatique, ou encore la reconnaissance vocale, reposent sur ces techniques. Les problèmes d'apprentissage structuré qu’il est nécessaire de résoudre sont de plus en plus complexes et demandent de prendre en compte de plus en plus d’informations à des niveaux linguistiques variés (morphologique, syntaxique, etc.) et reposent la question du meilleurs compromis entre la fines
APA, Harvard, Vancouver, ISO, and other styles
48

Le, Berre Guillaume. "Vers la mitigation des biais en traitement neuronal des langues." Electronic Thesis or Diss., Université de Lorraine, 2023. http://www.theses.fr/2023LORR0074.

Full text
Abstract:
Il est de notoriété que les modèles d'apprentissage profond sont sensibles aux biais qui peuvent être présents dans les données utilisées pour l'apprentissage. Ces biais qui peuvent être définis comme de l'information inutile ou préjudiciable pour la tâche considérée, peuvent être de différentes natures: on peut par exemple trouver des biais dans les styles d'écriture utilisés, mais aussi des biais bien plus problématiques portant sur le sexe ou l'origine ethnique des individus. Ces biais peuvent provenir de différentes sources, comme des annotateurs ayant créé les bases de données, ou bien du
APA, Harvard, Vancouver, ISO, and other styles
49

Papy, Fabrice. "Hypertextualisation automatique de documents techniques." Paris 8, 1995. http://www.theses.fr/1995PA081014.

Full text
Abstract:
L'hypertextualisation automatique, processus empirique débouchant de l'hypertexte, repose sur la réutilisation de documents linéaires de nature technique, saisis à partir de logiciels de traitement de textes, afin de créer dynamiquement les noeuds et les liens réseaux hypertextes. La phase d'extraction des noeuds utilise la structure physique pour mettre en évidence les différentes entités logiques composants les documents. Les liens références (particulièrement les références croisées), dont la syntaxe est préalablement définie par l'auteur, sont extraits au moyen d'un programme d'analyse uti
APA, Harvard, Vancouver, ISO, and other styles
50

Djematene, Ahmed. "Un système de lecture automatique de l'écriture Berbère." Le Havre, 1998. http://www.theses.fr/1998LEHA0008.

Full text
Abstract:
Ce mémoire constitue la première étude complète d'un système de lecture automatique de l'écriture berbère manuscrite hors ligne. Les trois modules de la méthode de segmentation des mots en caractères présentent de nombreux aspects originaux. Citons la séparatrice à angle variable. Le taux de segmentation correct est de 96%. La reconnaissance des caractères est effectuee par deux methodes complémentaires : une méthode mixte (structurelle et statistique) et une méthode connexionniste. La méthode mixte requiert un prétraitement complexe (filtrage de bruit, changement de représentation) pour arriv
APA, Harvard, Vancouver, ISO, and other styles
We offer discounts on all premium plans for authors whose works are included in thematic literature selections. Contact us to get a unique promo code!