To see the other types of publications on this topic, follow the link: Informatique et langue.

Dissertations / Theses on the topic 'Informatique et langue'

Create a spot-on reference in APA, MLA, Chicago, Harvard, and other styles

Select a source type:

Consult the top 50 dissertations / theses for your research on the topic 'Informatique et langue.'

Next to every source in the list of references, there is an 'Add to bibliography' button. Press on it, and we will generate automatically the bibliographic reference to the chosen work in the citation style you need: APA, MLA, Harvard, Chicago, Vancouver, etc.

You can also download the full text of the academic publication as pdf and read online its abstract whenever available in the metadata.

Browse dissertations / theses on a wide variety of disciplines and organise your bibliography correctly.

1

Rakotoalimanana, Herizo David. "Structure morphosyntaxique et modélisation informatique de la langue malgache." Nancy 2, 2000. http://www.theses.fr/2000NAN21035.

Full text
Abstract:
La présente étude s'inscrit dans le cadre d'un essai de traitement automatique de la langue malgache visant à construire un dictionnaire électronique. Notre travail est articulé autour de deux axes principaux : une étude descriptive de la langue d'une part et une modélisation informatique d'autre part. Après un chapitre préliminaire consacré à une présentation générale, nous présentons dans la première partie une analyse des termes malgaches portant tant sur les formes de la structure morphologique ou morphématique que sur leur comportement syntaxique. Les relations entre les constituants d'un énoncé sont détaillées. Nous décrivons les différentes voix des énoncés malgaches et les modalités : le temps, l'aspect et le mode. Dans la deuxième partie, nous formalisons les données linguistiques dégagées dans la partie descriptive pour en faire une implantation informatique d'un système d'Analyseur-Générateur des Termes prédicatifs Malgaches (AGTM). L'analyse automatique d'un terme consiste à repérer ses constituants, identifier leurs relations et assigner leur traduction en français. Notre système fournit toutes les formes dérivées possibles d'un terme. Nous terminons cette partie pratique par le bilan de notre étude et les perspectives d'avenir. La thèse est complétée par des annexes qui rassemblent le module de programmation et les résultats obtenus<br>This study is intented to provide a first framework for the definition of an electronic dictionary of the Malagasy language to be used in the context of Natural Language Processing components. Our work is based, on the one hand, on a descriptive study of the Malagasy language, and, on the other hand, on the proposition of a computer representation of the corresponding phenomena. Following a preliminary chapter dedicated to a general presentation of the geographical and sociological context, the first part of the thesis presents a thorough analysis of Malagasian terms from the point of view of their morphology and syntactic behaviour. In particular, we describe the various voices and modalities of Malagasian utterances : tense, aspect and mood. The second part of the thesis comprises the formel representation that we associate to the linguistic data that have been previously described, so that a possible implementation can be derived in the form of a parser / generator of Malagasian predicative terms (AGTM). The automatic analysis of a term is based upon the identification of its various constituants, the relations that link these together and the identification of a possible translation in French for the term. Our system can also provide all the possible forms that can be derived from a root, given a set of restrictions provided as input. The thesis comprises several appendixes which present the whole software implemented in Prolog, as well as sample results
APA, Harvard, Vancouver, ISO, and other styles
2

Houle, Annie. "Délit de langue et paternité textuelle : une approche informatisée." Thesis, Université Laval, 2013. http://www.theses.ulaval.ca/2013/29405/29405.pdf.

Full text
Abstract:
Cette étude vise à évaluer l’utilité d’une assistance informatique lors de l’identification de l’auteur d’un texte en français dans un cadre judiciaire. L’objectif est de proposer un environnement informatique au linguiste oeuvrant en contexte judiciaire et plus spécifiquement en analyse de paternité textuelle et de valider la légitimité de cette assistance automatisée à travers une étude de cas impliquant des textes courts et très courts rédigés en français. L’analyse se scinde en deux parties : une partie quantitative presqu’essentiellement automatisée et une partie qualitative semi-automatisée. Les résultats provenant de cette étude suggèrent qu’un environnement automatisé est un gain pour le linguiste, non seulement quant au temps et à la neutralité d’exécution de l’analyse, mais également quant aux résultats encourageants obtenus grâce aux outils créés.
APA, Harvard, Vancouver, ISO, and other styles
3

Chagnoux, Marie. "Temporalité et aspectualité dans les textes français : modélisation sémantico-cognitive et traitement informatique." Paris 4, 2006. http://www.theses.fr/2006PA040183.

Full text
Abstract:
Pour rendre compte de la manière dont le temps et l’aspect s’expriment dans les textes, il est nécessaire de considérer le texte comme un réseau organisé et hiérarchisé de segments. Nous avons donc proposé un modèle d’analyse discursive, basé sur la notion de référentiel, qui permet de représenter l’organisation textuelle. Ce modèle, qui peut être traduit dans un graphe, est utilisé pour identifier les différentes valeurs aspecto-temporelles des occurrences verbales à l’indicatif dans les textes français. Nous avons en outre proposé un système informatique, Chronotexte, qui automatise une analyse sémantique de surface des textes en les annotant au format XML. Ce système se base sur la stratégie d’exploration contextuelle et associe des règles heuristiques à des bases organisées de marqueurs linguistiques. Il identifie les différents référentiels, attribue une valeur aspecto-temporelle aux propositions et définit certaines relations temporelles entre ces propositions<br>In order to render how time and aspect are expressed in texts, it is necessary to consider texts as organized and hierarchised networks of segments. We propose a model of discursive analysis, based on the notion of referential, which make it possible to represent the structure of a text. This model, which may be translated into a graph, is used to identify the various aspectual and temporal values of verbal occurrences in French texts. We also propose a computational system, Chronotexte, which carries automatically the surface semantic analysis of texts by annotating them in an XML format. This system uses the contextual exploration strategy and associates heuristics to organized databases of linguistic markers. It identifies the various referentials, ascribes an aspectual and temporal value to propositions and defines some temporal relationships between these propositions
APA, Harvard, Vancouver, ISO, and other styles
4

Baudoin, Jean. "Recherches sur le traitement informatique d’une langue turcique agglutinante : l’ouïghour." Paris 8, 2009. http://octaviana.fr/document/156525771#?c=0&m=0&s=0&cv=0.

Full text
Abstract:
Cette étude présente les caractéristiques, les écritures et la structure de la langue ouïghoure en faisant une étude linguistique et en proposant de nouveaux modèles expérimentaux qui faciliteront le développement des outils informatiques et le traitement automatique de la langue afin de contribuer à l’informatisation de la langue ouïghoure. Plus précisément, notre étude consiste en quatre parties : la première partie présente les problématiques d’étude, les caractéristiques de la langue et des écritures, notamment le processus d’unification de l’écriture ouïghoure-latine ; la deuxième partie expose les notions de base d’extraction d’information et démontre la possibilité d’extraction d’entités nommées en utilisant un outil d’extraction, afin d’expérimenter les conceptions et les théories proposées ; la troisième partie est consacré à l’étude linguistique notamment sur l’aspect agglutinant de la langue et les règles morphologiques de suffixation qui seront appliquées pendant la réalisation des outils prototypes proposés dans cette thèse ; enfin la quatrième partie mettre en évidence les problématiques de traitement de la langue ouïghoure dans une situation où les systèmes d’exploitation ne supporte pas la langue ouïghoure. Dans cette partie, nous décrivons les difficultés existantes et nous proposerons des solutions innovantes afin de les résoudre dans les domaines suivants : Unification des polices ouïghoures et création d’une police ouïghoure basée sur l’Unicode, Implémentation des méthodes d’entrées au niveau système et au niveau navigateur, Création des convertisseurs multiécriture, Réalisation d’un dictionnaire ouïghour – anglais en ligne, Mise en place d’un générateur lexical basé sur les règles morphologiques de suffixation de l’ouïghour, Développement d’un analyseur et explorateur de suffixes, Démonstration d’extraction de l’information Implémentation d’un parseur et un correcteur d’orthographe<br>This study presents the characteristics, writing systems and structure of Uyghur language by doing a linguistic study. Our approach will consist of new trial models that facilitate the development and realization of Uyghur software tools, and contribute to the Uyghur information technology. More precisely, our study consists of four phases: Firstly, we are going to present the main issues of the study, characteristics of the language and its writing systems, especially the unification procedure of the Latin-Script Uyghur. Secondly, we briefly introduce some basic notions for the retrieval of information, and we will do a demonstration of named entities retrieval, using an extraction tool, in order to test concepts and theories that we are proposing. Then, we will discuss linguistic issues – mainly on the agglutinative aspect and morphological suffixation rules – which are applied during the implementation of prototype tools proposed in this study. Finally, we underline problems in natural language processing (NLP) created by Uyghur language and non-Uyghur supporting environments. We will discuss the existing difficulties and we will suggest innovative solutions to resolve such problems with the following fields: Standardization of Uyghur fonts and creation of a Unicode based Uyghur font, Implementation of system-level and browser-level input methods and - reation of multi-script converting tools, Realization of an online Uyghur – English dictionary, Implementation of a lexical generator based on the morphological suffixation rules of Uyghur, Design and creation of an suffix analyzer and explorer, Demonstration of Uyghur information retrieval, Implementation of a parser and spell checker
APA, Harvard, Vancouver, ISO, and other styles
5

Al-Shafi, Bilal. "Traitement informatique des signes diacritiques : pour une application automatique et didactique." Université de Besançon, 1996. http://www.theses.fr/1996BESA1029.

Full text
APA, Harvard, Vancouver, ISO, and other styles
6

Jaccarini, André. "Grammaires modulaires de l'arabe : modélisations, mise en oeuvre informatique et stratégies." Paris 4, 1997. http://www.theses.fr/1997PA040025.

Full text
Abstract:
Dans cette thèse nous exposons dans un cadre théorique unifie les principaux modèles linguistiques et les analyseurs associes que nous avons développés au DATAT (département d'analyse et de traitement automatique des textes, IREMAN-CNRS). Ces analyseurs ont la particularité de pouvoir fonctionner sans lexique, ce qui ne signifie pas que l'on s'interdise par la suite toute interaction avec un lexique donné. On proposera donc des analyseurs modulables dont l'intérêt sera de mettre en évidence la régularité du système morphologique de base de l'arabe. Ces analyseurs seront couplés à un moniteur syntaxique dont le rôle sera d'optimiser l'analyse morphologique et de réduire la part d'ambiguïté propre au système d'écriture de l'arabe. Afin d'affiner les descriptions linguistiques on a conçu des programmes modulaires que l'on peut modifier au fur et à mesure que se "complexifient" les données linguistiques. Une technique d'expérimentation et une méthode d'évaluation des grammaires sont proposées. Les applications les plus importantes sont le controle orthographique, la vocalisation automatique et la hiérarchisation des ambiguïtés. Ce logiciel doit surtout être compris comme un outil d'ingénierie linguistique permettant de mettre en œuvre la méthode de variation de grammaire en vue de la détermination de l'algorithme optimum. La reconnaissance optique des caractères ou la reconnaissance vocale supposent par exemple la mise au point de modules de vérification linguistiques compacts dont notre méthode permettra de calculer la grammaire sous-jacente<br>In this work we expound, in a unified theoretical frame, the main linguistic models and the associated parsers we have developed in the D. A. T. A. T (département d'analyse et de traitement automatique des textes, IREMAN-CNRS). The most salient feature of these parsers is that they can work without a lexicon but can be enhanced by the introduction of selective lexicons. Our aim is then to design a syntactic monitor for the morphological program in order to reduce different ambiguities which are inherent to Arabic writing systems. In order to achieve accurate descriptions we have designed modular programs that we can modify according to the "complexification" of linguistic data and an evaluation method for grammar. The already existing morphological parser without a lexicon can be applied to non-vocalized as well as vocalized Arabic texts in order to extract roots, to vocalize partially automatically and hierarchize ambiguities. In this sense this parser constitutes a powerful tool for research in linguistic engineering itself: the method of grammar variations will allow the design of compact modular grammars applicable to various needs and research areas. Our aim is to create a generator for linguistic applications rather than the mere applications themselves. For example optical character recognition (OCR) and speech processing require compact linguistic modules of verification. The use of enormous lexicons may be a handicap in some computational configurations. Our method allows the calculation of the optimum grammar
APA, Harvard, Vancouver, ISO, and other styles
7

Bonan-Garrigues, Mylène. "Méthode de paramétrage des dictionnaires et grammaires électroniques : application à des systèmes interactifs en langue naturelle." Paris 7, 1993. http://www.theses.fr/1993PA070003.

Full text
Abstract:
Dans la premiere partie, on definit une approche a la construction de niveaux de plausibilite d'emploi des mots simples du francais. Cette methode est appliquee au dictionnaire electronique delas 80. 000 entrees), et une separation en trois couches est effectivement construite. La notion de frequence de mots dans des textes fait l'objet d'une analyse critique. Dans la seconde partie, on discute la generalisation de la methode a des systemes de question-reponse plus complexes donc et mettant en jeu des grammaires electroniques<br>In the first half of the thesis, we define an approach to the construction of levels for the plausibility of use of the simple words of french. This method is applied to the electronic dictionary of french delas, which has about 80. 000 entries. We effectively reach a division in three levels. The notion of word frequency in corpora is discussed and reanalyzed. In the second part, we discuss various generalization of our method to question-answering systems, which involve electronic grammars
APA, Harvard, Vancouver, ISO, and other styles
8

Memet, Monique. "Anglais de spécialité dans le domaine du génie électrique : aspects sociolinguistiques et applications didactiques résultant du traitement informatique des données." Bordeaux 2, 1994. http://www.theses.fr/1994BOR21010.

Full text
Abstract:
Les travaux sont situés à l'intérieur d'un parcours : celui d'un praticien d'anglais de spécialité dans le domaine du génie électrique. Tout enseignant de langue de spécialité devrait pouvoir naviguer dans le domaine de ses apprenants avec un minimum de connaissances scientifiques et techniques. Des repères dans ce sens sont fournis dans la première partie : définition du génie électrique, bref historique des avancées de la science dans le domaine de l'électronique et panorama du développement de l'informatique. Une application pratique créée à l'aide d'une base de données est proposée. La collecte des matériaux de la spécialité est utilisée comme outil de connaissance du terrain des apprenants. La deuxième partie présente le terrain d’enseignement à partir duquel l’anglais de spécialité dans le domaine du génie électrique est étudié : un département Génie Electrique et Informatique Industrielle d’un Institut Universitaire de Technologie. Le profil des apprenants est défini, ainsi que leurs attitudes vis-à-vis des documents utilisés en cours. Les données ont été recueillies à l’aide d’un questionnaire soumis aux apprenants et à un groupe d’autochtones suivant un cursus parallèle aux Etats-Unis. Les types de documents provenant des entreprises sont présentés. L'analyse du discours de la spécialité fait l'objet de la troisième partie. Le corpus découle de la nature des travaux des apprenants en IUT : il est constitué d'extraits de notices en anglais, insérés dans des rapports de stage rédigés par les apprenants. Le cadre théorique de l'analyse – fondé sur l'approche sociolinguistique du discours – puis la composition du corpus et ses caractéristiques sont présentés, ainsi que les normes et les recommandations des fabricants. L'analyse vise à fournir des outils pour dissocier les aspects qui relèvent respectivement de la discipline, des éléments visuels et de la langue. L'analyse linguistique porte essentiellement sur le discours de la première page des notices de composants. La dernière partie définit les outils de didactisation pour une approche communicative ; il s'agit d'une application des analyses et de la collecte d'informations auprès des utilisateurs français et autochtones. Des fiches pratiques et diverses activités visant à réduire les réticences et les difficultés des apprenants face à la documentation technique utilisée sont proposées. En conclusion, la possibilité de transfert de la démarche concernant l'enseignement de l'anglais de spécialité est envisagée pour d'autres disciplines que celle du génie électrique. Figure en annexe une organisation structurée et dynamique des documents de la langue de spécialité, en particulier de fichiers pour les périodiques de langues de spécialité, et de documents authentiques dans le domaine du génie électrique.
APA, Harvard, Vancouver, ISO, and other styles
9

Kostov, Jovan. "Le verbe macédonien : pour un traitement informatique de nature linguistique et applications didactiques (réalisation d'un conjugueur)." Institut National des Langues et Civilisations Orientales, 2013. http://www.theses.fr/2013INAL0033.

Full text
Abstract:
Après la standardisation de la langue macédonienne en 1945, la description du standard actuel s’effectue sur plusieurs décennies, principalement au sein des institutions macédoniennes. L’existence de plusieurs grammaires témoigne du travail significatif qui a été accompli sur le verbe macédonien. Cependant, cette classe de mots reste à l’heure actuelle la moins exploitée : les règles de la flexion ne décrivent pas tous les cas de figures de la conjugaison macédonienne et leur approche s’effectue de manière trop synthétique pour être opérationnelle dans une optique didactique. Pour toutes ces raisons, le but de cette thèse est d’explorer un grand nombre de verbes fléchis afin de déceler des modèles stables de conjugaison ouvrant de nouvelles pistes pour l’apprentissage du système verbal du macédonien. Ces modèles de conjugaison sont employés dans le but de construire un outil de conjugaison automatique des verbes macédoniens à partir de leur forme lexicale – FlexiMac 1. 1<br>After the standardization of the Macedonian language in 1945, the description of its current standard variety has been carried out by several generations of experts working – most often – in Macedonian institutions. The fact that several manuals were published is an undeniable proof of significant efforts made to describe the Macedonian verbal system and yet, today verbs represent the least exploited word-category. Inflexion rules cannot envisage all possible models of the Macedonian conjugaison and their approach is too synthetic to be fully operational from a didactic point of view. For all these reasons, the purpose of this doctoral thesis is to study a large number of conjugated verbs in order to map stable patterns opening up new forays into the teaching of the Macedonian verbal system. Moreover, these patterns are used to produce computational models resulting in an automatized conjugation tool which derives paradigms from the lexical verbal forms : FlexiMac 1. 1
APA, Harvard, Vancouver, ISO, and other styles
10

Wurbel, Nathalie. "Dictionnaires et bases de connaissances : traitement automatique de données dictionnairiques de langue française." Aix-Marseille 3, 1995. http://www.theses.fr/1995AIX30035.

Full text
Abstract:
L'utilisation des versions informatisees de dictionnaires courants comme sources d'informations en traitement automatique du langage naturel a ete encouragee par la masse de connaissances lexicales et semantiques qu'ils contiennent. Cependant, apres 15 annees de recherches, les resultats apparaissent decevants et n'ont pas debouche sur une evaluation des bases de connaissances dictionnairiques, ni sur l'etude des retombees de ces recherches. Nous avons realise l'evaluation d'un dictionnaire francais. En nous placant dans le cadre de la construction automatique de taxinomies, nous avons repertorie les anomalies et les imperfections des informations extraites de facon automatique dont nous donnons une classification detaillee. Ces observations ont ete utilisees pour definir un modele de dictionnaire informatise destine a la fois a des utilisateurs humains et a des systemes de traitement automatique du langage naturel, ou les informations dictionnairiques sont representees dans une base de connaissances orientee objets. Nous proposons un automate de generation de definitions, fournissant un outil puissant d'aide a la redaction pour les lexicographes
APA, Harvard, Vancouver, ISO, and other styles
11

SELVA, THIERRY. "Ressources et activites pedagogiques dans un environnement informatique d'aide a l'apprentissage du francais langue seconde." Besançon, 1999. http://www.theses.fr/1999BESA2026.

Full text
Abstract:
La nature meme du media informatique tend a privilegier l'autonomie de l'apprenant lors de l'apprentissage d'une langue etrangere. L'examen des environnements lexicaux existants montre que l'autonomie passe par l'incorporation de ressources lexicales en tant que materiaux d'apprentissage et outils d'aide. La partie centrale de ce travail a ete de concevoir les ressources adaptees a cet apprentissage et la maniere dont celles-ci s'articulent. L'environnement alexia se compose d'un corpus de textes, d'un dictionnaire comme outil d'aide, d'un dictionnaire personnalise et d'un module d'activites lexicales. Le corpus, constitue de textes recents comprenant plusieurs niveaux de langue, est centre sur un domaine du francais courant maitrise par tout natif (travail, emploi, chomage). La modelisation de la base de donnees lexicales s'appuie sur les resultats des recherches en psycholinguistique, montrant que le lexique mental semble etre compose de mots relies entre eux par des liens de nature semantique et contextuelle. L'interface pour visualiser ces donnees tient compte des problemes d'acces lexicaux et tire parti des possibilites du support informatique pour la presentation des differentes informations necessaires aux apprenants. Corpus et dictionnaire servent de materiaux pour la generation d'activites lexicales : a base de concordances, elles mettent en jeu les relations semantiques du dictionnaire. Pour cela, il est necessaire d'effectuer au prealable un etiquetage morpho-syntaxique et semantique du corpus. Un systeme d'aide donne des indications pour permettre a l'apprenant de resoudre les exercices et renforce ainsi le role pedagogique de l'environnement. Le dictionnaire personnalise permet d'organiser les mots selectionnes par l'apprenant dans les textes lors de lectures. Le travail de categorisation effectue renforce les liens du lexique mental et favorise ainsi la retention.
APA, Harvard, Vancouver, ISO, and other styles
12

Mathet, Yann. "Etude de l'expression en langue de l'espace et du deplacement : analyse linguistique, modelisation cognitive et leur experimentation informatique." Caen, 2000. http://www.theses.fr/2000CAEN2066.

Full text
Abstract:
L'etude de l'expression de l'espace et du deplacement en langue naturelle est generalement abordee au moyen des notions de lieu et de localisation. Nous developpons dans cette these un ensemble d'entites et de relations s'inscrivant dans d'autres paradigmes (notamment autour de la notion de forme), peu etudies dans la litterature mais pourtant tout aussi fondamentaux : ils autorisent en particulier des descriptions semantiques simples et naturelles de verbes comme longer, traverser et contourner. De plus, nous proposons un ensemble d'entites polymorphes, permettant de rendre compte de la formidable capacite qu'a le langage d'adopter differents points de vue (par exemple, dans l'expression longer une riviere, en ne s'attachant qu'a la forme allongee de la riviere, necessitee par le verbe et seule pertinente). Ces paradigmes sont abordes au travers 1) d'une analyse linguistique qui montre leur pertinence et leur necessite, 2) d'un modele qui leur donne une assise formelle ainsi qu'une ouverture sur le raisonnement, et 3) d'une implantation informatique (en java) qui, sous forme d'applet, permet de faire le lien entre description graphique animee et description langagiere.
APA, Harvard, Vancouver, ISO, and other styles
13

Bénet, Vincent. "L'outil informatique au service du russiste français." Clermont-Ferrand 2, 2004. http://www.theses.fr/2004CLF20004.

Full text
Abstract:
Ce travail étudie les différents outils informatiques actuels à la disposition du russiste français, linguiste ou enseignant. Après une étude des différents codages du cyrillique pour résoudre les problèmes d'affichage et de saisie du russe, ce travail propose la constitution d'un corpus numériques de textes russes et l'établissement de jeux d'étiquettes pour exploiter ces données, et rappelle quelques uns des principes théoriques et linguistiques mis en oeuvre en linguistique informatique. Ce travail comporte une analyse des logiciels de recherche d'occurences textuelles, d'étiquetage de corpus, d'analyse morphosyntaxique. Lorsque cela est nécessaire et possible, ce travail propose des solutions originales correspondant aux attentes des russistes utilisateurs de l'informatique. Enfin, ce travail aborde le rôle des technologies de l'information et de la communication dans l'enseignement et la pédagogie du russe à travers la réalisation d'une grammaire russe électronique hypertextée
APA, Harvard, Vancouver, ISO, and other styles
14

Rudloff, David. "Modélisation conceptuelle et optimisation des requêtes dans une interface en langue naturelle pour des bases de données." Université Louis Pasteur (Strasbourg) (1971-2008), 2000. http://www.theses.fr/2000STR13244.

Full text
APA, Harvard, Vancouver, ISO, and other styles
15

El, Abed Walid. "Meta modèle sémantique et noyau informatique pour l'interrogation multilingue des bases de données en langue naturelle (théorie et application)." Besançon, 2001. http://www.theses.fr/2001BESA1014.

Full text
Abstract:
L'interrogation d'une base de données relationnelles, par un non spécialiste, constitue un véritable problème. En effet, l'utilisateur final doit au préalable connaître le langage de requête SQL (Structured Query Langage) et la structure, souvent complexe, de la base de données. Dans un tel contexte, il devient essentiel d'organiser des domaines interrogeables en langue naturelle. Un domaine est une base de données regroupant toute l'information pertinente autour d'un thème ou d'un sujet offrant ainsi la possibilité à l'utilisateur d'accéder à l'information sur le sujet en utilisant le langage naturel. . .
APA, Harvard, Vancouver, ISO, and other styles
16

Pompigne, Florent. "Modélisation logique de la langue et Grammaires Catégorielles Abstraites." Phd thesis, Université de Lorraine, 2013. http://tel.archives-ouvertes.fr/tel-00921040.

Full text
Abstract:
Cette thèse s'intéresse à la modélisation de la syntaxe et de l'interface syntaxe-sémantique de la phrase, et explore la possibilité de contrôler au niveau des structures de dérivation la surgénération que produit le traitement des dépendances à distance par des types d'ordre supérieur. À cet effet, nous étudions la possibilité d'étendre le système de typage des Grammaires Catégorielles Abstraites avec les constructions de la somme disjointe, du produit cartésien et du produit dépendant, permettant d'étiqueter les catégories syntaxiques par des structures de traits. Nous prouvons dans un premier temps que le calcul résultant de cette extension bénéficie des propriétés de confluence et de normalisation, permettant d'identifier les termes beta-équivalents dans le formalisme grammatical. Nous réduisons de plus le même problème pour la beta-eta-équivalence à un ensemble d'hypothèse de départ. Dans un second temps, nous montrons comment cette introduction de structures de traits peut être appliquée au contrôle des dépendances à distances, à travers les exemples des contraintes de cas, des îlots d'extraction pour les mouvements explicites et implicites, et des extractions interrogatives multiples, et nous discutons de la pertinence de placer ces contrôles sur les structures de dérivation.
APA, Harvard, Vancouver, ISO, and other styles
17

Ouersighni, Riadh Hassoun Mohamed Dichy Joseph. "La conception et la réalisation d'un système d'analyse morpho-syntaxique robuste pour l'arabe utilisation pour la détection et le diagnostic des fautes d'accord /." Lyon : Université Lumière Lyon 2, 2002. http://demeter.univ-lyon2.fr:8080/sdx/theses/lyon2/2002/ouersighni_r.

Full text
APA, Harvard, Vancouver, ISO, and other styles
18

Kulinich, Olena. "Les verbes défectifs russes à la lumière des néologismes informatiques en russe et en ukrainien." Master's thesis, Université Laval, 2011. http://hdl.handle.net/20.500.11794/26355.

Full text
Abstract:
"Mémoire présenté à la Faculté des études supérieures de l'Université Laval comme exigence partielle du programme de maîtrise en linguistique offert à l'Université du Québec à Chicoutimi en vertu d'un protocole d'entente avec l'Université Laval pour l’obtention du grade de Maître ès arts (M.A.)"<br>Ce travail amène à l’attention des chercheurs de nouveaux cas de verbes défectifs du msse qui mettent en doute les explications lexicales de ce phénomène proposées par certains chercheurs (Daland et al. 2007, Baerman 2007. 2008). En msse, le phénomène consiste en l’absence de forme de la l re personne du singulier au non-passé. Notre émde des néologismes informatiques, appanis en msse et en ukrainien dans le langage des utilisateurs d’ordinateurs dans les années 80-90, indique que la défectivité est productive en russe, et qu’il faut donc chercher des raisons grammaticales synchroniques de cette défectivité. La défectivité pose un problème particulier pour les théories morphologiques (Albright 2003. Baronian 2009), mais les analyses particulières se divisent en deux camps. Le premier ne voit comme pertinent aucun des facteurs pouvant jouer un rôle synchronique, tels que l'évitement de l’homophonie, la compétition entre deux modèles morphologiques ou des raisons sémantiques (Daland et al. 2007, Baerman 2008). Dans le cas du msse, connue tous les verbes attestés comme étant défectifs dans la langue standard appartiennent à la 2e conjugaison et comme ils sont associés à un changement phonologique ancien, c’est-à dire que leurs radicaux se tenninent par une consonne coronale qui subit la palatalisation dans la fonne en question, il semble, pour ces chercheurs, qu’il faille chercher la motivation de ce phénomène uniquement dans l’histoire de la langue et qu’il s ’agit donc d ’im vestige lexicalisé. Cependant, dans les langues autres que le russe, un deuxième camp de chercheurs a trouvé avec succès des conditions synchroniques expliquant certains aspects de la défectivité (e.g. Baronian 2005, 2009 pour le français, Albright 2003 pour l’espagnol). La présente émde explore les verbes néologiques en msse et en ukrainien (les deux langues étant parentes) afm de trouver un éclairage nouveau au problème des verbes défectifs russes. Le corpus est constitué de verbes néologiques “ informatiques” eu msse et en ukrainien. Un test de production visant à catégoriser ces verbes panni les verbes traditionnellement défectifs. les rares et les fréquents fut proposé à 44 participants (23 locuteurs natifs du msse et 21 locuteurs uatifs de l’ukrainien). Les résultats nous pennettent de conclure à la productivité de la défectivité en russe dont la principale caractéristique semble être une forte compétition entre les deux choix qu’offre une alternance morphophonologique. Cependant, à titre comparatif, les résultats de notre analyse indiquent que la défectivité des verbes en ukrainien est un phénomène très limité. Nous discutons également des facteurs synchroniques pouvant motiver cette défectivité, dont la fragmentation des paradigmes nous semble la plus plausible.
APA, Harvard, Vancouver, ISO, and other styles
19

Audras, Isabelle. "Médiation informatique pour l'apprentissage du français langue étrangère écrit : études auprès d'un public lettré et en formation d'alphabétisation." Paris 6, 2006. http://www.theses.fr/2006PA066336.

Full text
APA, Harvard, Vancouver, ISO, and other styles
20

Tanguy, Ludovic. "Traitement automatique de la langue naturelle et interpretation : contribution a l'elaboration d'un modele informatique de la semantique interpretative." Rennes 1, 1997. http://www.theses.fr/1997REN10059.

Full text
Abstract:
Nous proposons dans cette these une modelisation informatique de la semantique interpretative de f. Rastier. Apres une premiere critique des traitements classiques du langage naturel sous ses aspects semantiques, nous concluons a une non-reductibilite du sens d'un texte a une structure calculee a partir de descriptions locales, et a la necessite de determinations globales. Nous etudions ensuite la theorie linguistique de la semantique interpretative, afin d'en retirer les concepts centraux captables par une approche informatique. Nous proposons un modele formel de description de ceux-ci, ainsi que des mecanismes de manipulation des structures semantiques descriptives. Enfin, nous proposons un logiciel appliquant cette formalisation, sous la forme d'une assistance a l'analyse des textes. Nous rejoignons une approche de cooperation homme-machine, en distinguant les activites interpretatives propres a l'utilisateur de leur manipulation formelle par la machine. Nous concluons par une mise en relief des avantages suggestifs descriptifs d'une approche informatique de certains aspects de l'interpretation.
APA, Harvard, Vancouver, ISO, and other styles
21

Marcoux, Caroline. "Répercussions dans des rédactions d'élèves du secondaire de l'utilisation d'un environnement informatique pour l'enseignement-apprentissage des accords en nombre et en personne." Sherbrooke : Université de Sherbrooke, 2000.

Find full text
APA, Harvard, Vancouver, ISO, and other styles
22

Gaubert, Christian. "Stratégies et règles minimales pour un traitement automatique de l'arabe." Aix-Marseille 1, 2001. http://www.theses.fr/2001AIX10040.

Full text
Abstract:
La théorie de la minimalité dans le traitement automatique de l'arabe développée depuis 1985 par Audebert et Jaccarini est exposée dans ses grands principes, qui visent la construction d'un moniteur morpho-syntaxique : une analyse morphologique sans lexique effectuée par des automates augmentés et reflétant un compromis entre les phénomènes de concaténation et le croisement entre racines et schèmes, le rôle syntaxique central des invariants de la morphologie qui sont des tokens syntaxiques, et la description de ce rôle par des automates variables. Un logiciel écrit en C, Sarfiyya, a été créé pour poursuivre ce travail théorique et le confronter à la réalité de corpus de textes informatisés de presse et de littérature. Il repose sur un système original d'étiquettes floues privilégiant la détermination pour le nom, le mode/aspect pour le verbe, la famille syntaxique pour les tokens. Un éditeur graphique et interactif d'automates, un analyseur d'automates augmentés par des micro-lexiques et d'autres fonctions de Sarfiyya ont permis le développement de grammaires nominales et verbales avec peu de lexique et au comportement ambigu connu : cette ambigui͏̈té avoisine deux interprétations par mot. Un analyseur de mots-outils ou tokens complète ces outils qui utilise un contexte court pour leur désambigui͏̈sation. L'emploi de paires de tokens, lexicalisées ou catégorisées, permettent entre autres méthodes un taux de détection élevé. Une étude de faisabilité conclue ce travail par l'analyse la détectabilité d'un système de marques minimales, telles la présence de phrases nominales, des khabars et des mubtada's, de phrases verbales, subordonnées et relatives, points de passage de toute analyse de la phrase complexe. Des procédures linéaires sont proposées pour leur détection, dans le cadre de la construction du moniteur morpho-syntaxique. Cette étude démontre la fécondité de la méthode minimale et sa validité pour diverses applications, mais aussi ses faiblesses
APA, Harvard, Vancouver, ISO, and other styles
23

Le, Moing Jean-Yves. "Toponymie bretonne de Haute-Bretagne : analyse informatique des formes anciennes et modernes." Rennes 2, 1988. http://www.theses.fr/1988REN20011.

Full text
Abstract:
Cette étude cherche à présenter des résultats nouveaux sur la toponymie bretonne de Haute-Bretagne, à partir d'une base de données informatique utilisée avec des programmes de tri et de cartographie automatique. La constitution de la base de données (INSEE, cadastre, formes anciennes) est présentée. On étudie successivement l'influence du gallo-roman sur les toponymes bretons, puis les préfixes, les suffixes et les déterminants bretons utilisent dans les noms de lieux. L'importance relative des noms communs et des noms de personnes est étudiée, et les noms les plus fréquents sont commentés et cartographiés. Les cartes associées permettent de mieux voir les distributions de toponymes et d'analyser leur création. On a montré l'influence précoce du gallo-roman dans la toponymie des zones occupées par les bretons, et étudié la création des noms en "ville". On a mis en évidence les zones d'implantation des Saxons et des Normands. On a suggéré que les Bretons ont pu s'installer précocement en Haute-Bretagne, et qu'ils ont pu absorber des parlers gaulois tardifs, parlers que l'on a estimés en régression en Haute-Bretagne face au gallo-roman<br>This study is a try to provide new results on the Breton place-names of eastern Brittany, by means of a computer data base, used with programs allowing criteria-oriented extraction and automatic mapping. The creation of the data base is explained (INSEE data, cadastral survey, ancient forms). Successively are studied the influence of gallo-romance on Breton place-names; then the prefixes, suffixes and determiners used in place-names; the relative influence of common and personal names is discussed, and the most employed are commented and mapped. The related maps show the distributions and allow analysing the creation of the place-names. The early influence of the gallo-romance on the area occupied by the Bretons is shown; the place-names in "ville" are studied. The main areas occupied by Saxons and north men are brought to the fore. It is suggested that the Bretons may have settled very early in high-Brittany, and that they thus can have absorbed late gaulish dialects, supposed to be regressive in front of gallo-romance
APA, Harvard, Vancouver, ISO, and other styles
24

Lagji, Hajderi Klarita. "Étude des valeurs syntaxiques et sémantico-cognitives des constructions réflexives en français, en vue d'une implémentation informatique." Paris 4, 1997. http://www.theses.fr/1997PA040287.

Full text
Abstract:
Cette étude est une analyse théorique et contextuelle de la reflexivisation en français dans le but de déterminer les valeurs syntaxiques et sémantico-cognitives des constructions réflexives, de pouvoir les identifier en recherchant des indices contextuels susceptibles d'entrer dans des règles de traitement informatique de ce phénomène en français. Notre but est de trouver des critères linguistiques et contextuels pour pouvoir isoler les différentes valeurs du marqueur réflexif "se" dans des textes écrits. En s'appuyant sur la théorie de la grammaire applicative et cognitive, nous analysons les particularités formelles et sémantiques du marqueur réflexif "se" en distinguant sept types de constructions réflexives : les constructions réflexives du vrai réfléchi, réfléchies réciproques, réfléchies possessives, moyennes, medio-passives, passives et impersonnelles. Cette étude donne également une stratégie d'exploration contextuelle qui permet de déterminer automatiquement la signification d'une occurrence de construction ou apparaitra le marqueur réflexif "se". Cette exploration est modalisée sous forme de règles heuristiques et programmables pour qu'une machine informatique puisse prendre les décisions. Une étude contrastive de la reflexivisation en français et en albanais nous permet de dégager des invariants communs<br>This study is a theoretical and pragmatical analysis of the reflexivity in French language in order to determine the syntactical, semantical and cognitive values of the reflexive constructions, to identify them by contextual indicators likely to enter into automatic processing rules. Our intention is to find linguistic and contextual criteria to identify the different values of the reflexive marker "se" into written texts. Relying on the theory of applicative and cognitive grammar, we analyze the formal and semantic features of the reflexive marker "se" discerning seven types of reflexive constructions : true reflexive constructions, reciprocal reflexive constructions, possessive reflexive constructions, middle reflexive constructions, middle-passive reflexive constructions and impersonal reflexive constructions. This study gives also a strategy of contextual exploration, which allows determining automatically the signification of a reflexive construction's occurrence. This exploration is developed in the form of heuristic rules that can be used in a computer system. A contrastive study of the reflexivity in French and Albanian languages give us the possibility to deduce universal elements
APA, Harvard, Vancouver, ISO, and other styles
25

Aslanides, Sophie. "Syntaxe et structure d'un texte : les connecteurs du français dans un système de génération automatique." Paris 7, 1995. http://www.theses.fr/1995PA070081.

Full text
Abstract:
Cette these propose une etude linguistique des connecteurs du francais dans le but de construire les bases de donnees linguistiques fournies a un systeme de generation automatique de textes. Partant de l'hypothese que les connecteurs peuvent etre consideres comme des "predicats textuels", nous avons cherche a decrire leurs cadres de souscategorisation. Ces contextes sont appeles "structures de discours" (sd), et sont les unites elementaires sur lesquelles opere le choix lexical dans le systeme de generation. Elles sont organisees dans une hierarchie dominee par des relations conceptuelles et representant les relations d'inclusion, partielle, totale ou nulle, entre les differentes classes de sd construites aotour de chaque connecteur. Cette representation de l'interface entre le conceptuel et le linguistique ne suffit cependant pas a garantir la non-ambiguite des discours produits, et une etude complementaire de la polysemie (de alors que, par exemple) et de la neutralite (de et) permet de faire apparaitre certaines proprietes syntaxiques discriminantes entre divers effets de sens d'un meme connecteur. Un dernier type d'ambiguite est etudie : celui qui apparait dans des discours p11 c1 p12 c2 p2, ou les phenomenes de portee multiplient les lectures possibles. Cette multiplicite depend de facteurs aussi divers que les relations exprimees par les connecteurs, les evenements relies, l'ordre dans lequel ils sont exprimes, et les constructions syntaxiques choisies. Toutes les donnees linguistiques mises au jour precedemment sont representees dans un formalisme arborescent inspire des grammaires d'arbres adjoints, et donnent lieu a la construction des arbres elementaires correspondant aux connecteurs et a une representation arborescente de la structure du texte a produire<br>This study aims defining the content and structure of the linguistic databases of a nlg system. More precisely, it concentrates on the lexical encoding of cue-prases - in which we include the full-stop, complex verb- phrases, relativization and participles - and the evaluation of the potential ambiguities of a complex discourse structure. As demonstrated by danlos (1985), the relevant item for lexical choice is not the connective by itself, but a set of constraints attached to if (henceforth, discourse structure, or ds). To define the relevant dss for a given semantic relation, a thorough analysis of the linguistic properties of cue-phrases is required, and more specifically, the determination of differential syntactic properties that reflect semantic variation. Once defined the dss families, i. E. All the possible dss built around a given cue-phrase - they are organised in a hierarchy which can serve as an interface between the conceptual level and the lexicon. But the ambiguities of complex discourse structures are thus only partly controlled. We therefore study the possible scope ambiguities in p1 c1 p2 c2 p3 discourses, and show the various factors which interfere with the choice of cue-phrases to create ambiguity (subordinate clause moving, ellipsis, pronominalisation, causal inference). The last part of this work proposes a tag-inspired tree representation for elementary dss and discusses the linguistic relevance of possible representations for complex dss as tree-structures
APA, Harvard, Vancouver, ISO, and other styles
26

Marchal, Harmony. "L’acquisition du genre grammatical, en français langue maternelle et langue seconde chez des enfants de 5 à 11 ans : perspectives développementale et computationnelle." Thesis, Grenoble, 2011. http://www.theses.fr/2011GRENH002.

Full text
Abstract:
Cette recherche porte sur l’acquisition du genre grammatical français langue maternelle et langue seconde. Dans une perspective développementale, nous cherchons à décrire la manière dont de jeunes enfants, scolarisés en France et au Luxembourg, déterminent le genre des noms en se fondant sur les indices infra-lexicaux portés par les noms. Notre préoccupation consiste à examiner le type de connaissances acquises et les mécanismes sous-jacents à cette acquisition en langue maternelle, mais aussi lors de l’apprentissage du français langue seconde au niveau de l’école primaire au Luxembourg. Nous faisons l’hypothèse que l’extraction des connaissances de genre n’est pas fondée uniquement sur la valeur prédictive des terminaisons mais que les informations morphologiques portées par certaines terminaisons, les suffixes, interviennent aussi dans le processus d’acquisition du genre. En effet, la diversité d’informations portées par cette unité (sémantiques, lexicales et de genre) peut rendre cette unité plus « saillante » parmi l’ensemble des régularités pouvant être extraites. Trois expériences ont permis de mettre en évidence que la détermination du genre fondée sur les indices formels dépend effectivement d’autres facteurs, tels que la nature des terminaisons. Par ailleurs, une série de simulations informatiques a été conduite apportant des données complémentaires aux résultats expérimentaux. L’ensemble de ces données apportent des informations utiles pour l’apprentissage et l’enseignement précoce du française langue seconde au niveau de l’école primaire<br>This research concerns the acquisition of the French grammatical gender in first and second language. From a developmental perspective, we tempt to describe the way of young children being sent to school in France and Luxembourg determine the gender of names, by using the infra-lexical cues carried by these. Our concern consists in examining the kind of knowledge acquired and the mechanisms underlying this acquisition for the mother tongue and also during the learning of French as a second language at the primary school in Luxembourg. We hypothesize that the extraction of gender knowledge is not only dependent on the predictive value of endings but that morphological information carried by certain endings, suffixes, also intervenes in the process of gender acquisition. Indeed, the range of information carried by this unit (semantic, lexical and of gender) can make this unit more "striking" among all the regularities being able to be extracted. Three experiments allowed to bring to light that the determination of gender based on formal cues depends effectively on other factors, such as the nature of endings. Besides, a series of computational simulations was driven, bringing additional data to the experimental results. All these data brings useful information to the learning and the early teaching of French as a second language at the primary school
APA, Harvard, Vancouver, ISO, and other styles
27

Falaise, Achille. "Conception et prototypage d'un outil web de médiation et d'aide au dialogue tchaté écrit en langue seconde." Phd thesis, Université Joseph Fourier (Grenoble), 2009. http://tel.archives-ouvertes.fr/tel-00442754.

Full text
Abstract:
Notre thème de recherche général concerne les aides informatisées au dialogue en langue seconde, oral et/ou écrit. Cette thèse se concentre sur la dénition et l'étude, au moyen de corpus et d'un prototype, de procédés d'aide au dialogue écrit (tchat) en langue seconde, dans un contexte de médiation faible. Nous présentons dans un premier temps ce qu'est le tchat "ordinaire" en langue première, ses divergences de surface et ses convergences profondes vis à vis des autres formes d'écrit. Nous montrons ensuite les limites des aides actuelles, à médiation forte, dans laquelle l'outil d'aide est interposé entre des locuteurs supposés totalement incapables de communiquer par un autre biais, de sorte qu'on ne traite jamais le cas pourtant fréquent où ils peuvent utiliser une langue intermédiaire. Nous adaptons au tchat le scénario du projet VerbMobil (1992-2000) et proposons une approche à médiation faible pour locuteurs partiellement bilingues, capable de tenir compte de leurs compétences et de leurs problèmes spéciques. Le prototype développé dans ce cadre, Koinè, permet d'étudier les contraintes informatiques, ergonomiques et linguistiques d'un tel système, de proposer des solutions, et de les expérimenter. Des aides au dialogue oral ont été prévues, mais, comme la reconnaissance vocale du tout venant au téléphone ou sur IP n'est pas encore assez avancée pour ce type d'utilisation, la version actuelle est centrée sur l'écrit. Koinè est un service Web, construit à l'aide de la bibliothèque logicielle Krater, qui accélère et simplifie le développement d'applications Web. Koinè agrège des fonctionnalités utiles pour surmonter les obstacles de la communication en langue non native, telle que tableau blanc, livre de phrases interactif personnalisable, pré- traduction par traduction automatique, mesures d'intelligibilité et de prototypicalité des énoncés, et possibilité de désambiguïsation interactive et participative.
APA, Harvard, Vancouver, ISO, and other styles
28

Renié, Delphine. "Modélisation informatique de l'acquisition des interrogatives directes en français langue seconde dans leur dimension pragmatique, proposition d'un environnement offrant un apprentissage collaboratif : eleonore." Clermont-Ferrand 2, 1995. http://www.theses.fr/1995CLF20080.

Full text
Abstract:
L'élaboration de l'environnement informatique ELEONORE a été guidée par 2 objectifs : fournir une aide à l'apprentissage d'une part, proposer une modélisation de l'acquisition d'un aspect de la langue seconde d'autre part. Nous commencons par décrire l'objet d'apprentissage : les interrogatives directes du français. Ces propositions sont un exemple de constructions linguistique où la syntaxe, la sémantique et la pragmatique ne peuvent pas être isolées lorsqu'il s'agit d'étudier le comportement du locuteur natif en situation de commmunication. Ce comportement est simulé par un générateur automatique, dans notre environnement informatique. L'acquisition des interrogatives en français langue maternelle et langue seconde est ensuite considérée dans leurs aspects morphosyntaxiques et pragmatiques. Les données sur l'acquisition des aspects pragmatiques en langue seconde obtenues par une expérimentation longitudinale auprès d'apprenants de français viennent compléter cette étude. C'est seulement après avoir intégré ces données que nous pouvons proposer une modélisation de l'acquisition des interrogatives. En outre, les données obtenues permettent de déterminer les fondements pédagogiques d'ELEONORE, et d'intégrer un modèle de l'apprenant à l'architecture de l'environnement. Ce modèle intervient tout au long d'une session de travail avec ELEONORE, et particulièrement dans la dernière activité qui propose une collaboration entre l'apprenant et un compagnon simulé. En effet, ELEONORE comporte plusieurs types d'activités reposant sur l'induction, la déduction ou sur les 2. Ces activités peuvent concerner les aspects pragmatiques des interrogatives, leurs aspects syntaxiques, ou les 2. Nous préconisons pour une activité regroupant tous ces aspects un mode de travail collaboratif dans lequel un compagnon simulé agit comme un locuteur natif avec lequel l'apprenant se trouve en situation d'interaction exolingue. L'environnement ainsi constitué se voit évalué, évaluation formative qui porte sur l'environnement lui-même et non sur l'apprentissage qu'il vise à aider. L'affinement de notre modélisation de l'acquisition par le recours à un apprenant simulé constitue quant à lui une perspective proche de développement que nous détaillons au dernier chapitre<br>The elaboration of the computer environment eleonore has aimed at two main goals : to support learning on the one hand, and to propose a way modelling the acquisition of one aspect of the second language on the other hand. Our study starts with a description of the object of learning : direct interrogatives in french. These propositions are an example of lingistic constructions for which syntax, semantics and pragmatics cannot be isolated if one is to consider the behaviour of a native speaker of french in a communicative situation. That behaviour is simulated by a generator, in our computer environment. The acquisition of interrogative sentences in a first and in a second language is then considered, in their morpho-syntactic and their pragmatic aspects. The data on the acquisition of pragmatics in a second language which we have collected through a longitudinal experimentation with learners of french, are a complement to this study. It is only after we have integrated them, that we are able to suggest a model of the acquisition of interrogative sentences. Moreover, the data enable us to determine the pedagogical founding of eleonore, and to integrate a learner model in the architecture of our environment. The model acts all through a working session with eleonore, especially in the last activity which offers a collaboration between the learner and a simulated companion. Indeed, eleonore includes several types of activities based either on induction, deduction or on both. The activities can concern pragmatic aspects of interrogatives, syntactic ones or both. For an activity involving all aspects, we preconise a collaborative learning mode in which a simulated learner acts as a native speaker with whom the learner is in a situation of exolingual interaction. The environment is then evaluated through a formative evaluation concerning the environment itself rather than the learning it supports. The refinement of our acquisition model through the recourse to a simulated learner constitutes the next orientation in the development of eleonore, as detailed in the last chapter
APA, Harvard, Vancouver, ISO, and other styles
29

Losson, Olivier. "Modélisation du geste communicatif et réalisation d'un signeur virtuel de phrases en langue des signes française." Lille 1, 2000. https://pepite-depot.univ-lille.fr/LIBRE/Th_Num/2000/50376-2000-13-14.pdf.

Full text
Abstract:
Dans le cadre du geste communicatif, la langue des signes francaise (lsf) constitue un sujet d'etude privilegie, par la richesse que lui confere precisement son statut de langue. Notre etude vise a obtenir un systeme de synthese de phrases en lsf a partir d'une representation textuelle intermediaire, dans l'optique d'une traduction globale du francais en signes. Issue des traits linguistiquement pertinents, une grammaire formelle est proposee pour specifier le signe, avec pour principe la decomposition en primitives formationnelles (configurations manuelles, mouvement,). La description hierarchique obtenue inclut des caracteristiques spatio-temporelles (points corporels, symetrie des articulateurs, repetition) ; une etude poussee des profils de vitesse a par ailleurs ete effectuee pour representer finement la dynamique du mouvement. Au niveau du discours interviennent les processus grammaticaux propres aux langues gestuelles : le parametrage des signes permet, outre de decrire des items lexicaux generiques, de prendre en charge les mecanismes de localisation ou de reference pronominale<br>Afin de marquer le type de clause, l'expressivite non-manuelle - notamment faciale - est de premiere importance. Le systeme a ete integralement implante pour aboutir a l'animation d'un signeur virtuel. L'exigence de configurations naturelles pour les chaines articulaires a necessite le developpement d'un modele realiste pour l'avatar, et de methodes specifiques de cinematique inverse pour l'orientation et le positionnement manuels. L'ensemble, de l'analyseur syntaxique au module de generation graphique tridimensionnelle, constitue un prototype performant d'obtention de phrases signees. Dote d'une interface graphique, il laisse entrevoir (comme le prouve un exemple illustratif) toute une gamme d'applications pour lesquelles la video n'est pas adaptee, tirant principalement profit de la compacite de l'encodage et de la rapidite avec laquelle sont produits les signes
APA, Harvard, Vancouver, ISO, and other styles
30

Depierre, Amélie. "La Composition en anglais scientifique : application au domaine de la physico-chimie." Littoral, 2001. http://www.theses.fr/2001DUNK0070.

Full text
Abstract:
Issue d'expériences et d'interrogations pédagogiques, cette recherche a pour double objectif d'une part de faire la synthèse des travaux existants en matière de composés et autres groupes nominaux complexes en anglais, et d'autre part d'appliquer les acquis théoriques afin de venir en aide aux étudiants et chercheurs francophones qui ont besoin de communiquer (comprendre et s'exprimer) en anglais. Après un tour d'horizon des critères de définition et de distinction des composés, puis des investigations en corpus, une nouvelle classification morphologique des composés binaires a été effectuée, suivie de l'examen des relations sémantiques entre les éléments, et d'une extension aux composés à plus de deux lexèmes. Une attention particulière a été accordée aux composés néo-classiques et aux sigles, spécialement abondants dans le domaine scientifique, ainsi qu'au contraste entre trois structures concurrentes : N₂ N₁, N₂'s N₁ et N₁ of N₂, qui constituent une source non-négligeable d'erreurs d'encodage chez les francophones. Finalement, un glossaire électronique des termes du domaine assortis d'exemples de phrases attestées, est proposé au format Excel, un des objectifs post-thèse étant d'étendre ce glossaire et de le mettre au format HTML, afin de le rendre plus accessible, car c'est un outil flexible et exportable à d'autres domaines<br>This study stems from teaching experience and comes as a response to students' questions and errors. It has two main objectives : on the one hand a critical review of existing research on compounds and other complex nominals in English, and on the other hand the application of the theoretical data available in order to help French-speaking students and researchers, who need to communicate (understand, speak and write) in English, namely in the domain of physico-chemical sciences. After a survey of the characteristics of compounds, and an investigation of axamples taken from several corpora, a new morphological classification of binominal compounds is suggested, then the semantic relations between their elements are pointed out. The results are extended to longer nominals, with a particular attention paid to words built from Greek and Latin bases, and acronyms, which abound in the field of sciences. These competing structures : N₂ N₁, N₂'s N₁ and N₁ of N₂ are contrasted, as they are a major source of error among French speakers, especially at the encoding stage. Lastly, an electronic glossary in Excel format including some of the terms of the domain, together with examples of attested sentences, has been developed. One of the future objectives is to transfer the glossary in HTML format in order to make it more available for use in various domains
APA, Harvard, Vancouver, ISO, and other styles
31

Boughedaoui, Mourad. "Anglais spécialisé de l'informatique : contribution à l'étude de la complexification des noms composés par chaînage." Bordeaux 2, 1995. http://www.theses.fr/1995BOR2A001.

Full text
Abstract:
Ce travail présente une étude du processus de complexification des noms composés en chaines (NCC) à travers les niveaux de langue d'un corpus de textes informatiques écrits. Ce processus est caractérisé par l'existence de différents niveaux d'imbrications des éléments constitutifs au sein des NCC. Ces niveaux sont identifiés dans notre étude par une segmentation formelle fondée sur le repérage de paires collocationnelles dans le contexte linguistique des NCC. Cette approche a permis de souligner le rôle des collocations dans la structuration binaire des NCC ainsi que dans la formation des adjectifs composés. Afin d'établir une quelconque dépendance entre le phénomène de complexification et les quatre niveaux de langue étudiés, une analyse statistique de la fréquence et de la complexité des NCC a été effectuée. Une typologie des NCC étudiés a été dressée en vue de mettre en évidence les rapports complexes résultant de la riche combinatoire des diverses catégories syntaxiques a l'intérieur des NCC. La dernière partie est réservée a l'étude des retombées pédagogiques<br>This work presents a study of the complexification process of string compound nouns (SCNS) through different registers of a corpus of computer science written texts. This process is characterized by the existence of various overlapping levels of the component parts within SCNS. In this study, these levels are identified using a formal segmentation based essentially on the location of collocational sequences in the linguistic environment of SCNS. This approach made it possible to highlight the active role of collocations in the binary structuring of SCNS as well as in the formation of compound adjectives. In order to establish any inter-relationship between the complexification phenomenon and the four registers studied, a statistical analysis of the frequencies and complexities of SCNS has been carried out. An SCN typology has been drawn up so as to put forward the complex relationship resulting from the multiple potential combinations of the various syntactic categories featuring in SCNS. The last section lays special emphasis on the pedagogic implications
APA, Harvard, Vancouver, ISO, and other styles
32

Hajok, Alicja. "Etude sémantico-syntaxique de la détermination simple et complexe en français et en polonais : approche contrastive." Paris 13, 2010. http://www.theses.fr/2010PA131013.

Full text
Abstract:
Les systèmes déterminatifs du français et du polonais sont différents. Nous les étudions d’une manière contrastive. Nos descriptions sont formalisées dans des bases de données dédiées au traitement automatique des langues. Nous rendons compte systématiquement du fonctionnement et des propriétés des déterminants polonais. Les analyses proposées focalisent sur les différentes propriétés morpho-syntaxiques des déterminants dans les deux langues. Nous discutons les déterminants simples et les déterminants complexes, en dégageant ainsi une typologie formelle des déterminants en polonais. Nous retenons tout particulièrement leurs propriétés syntactico-sémantiques selon qu’ils relèvent de la détermination prédicative et de la détermination argumentale. Le tout contribue à l’élaboration des dictionnaires électroniques du LDI<br>The system of determination of the French language differs from the system of determination in the Polish language. In the thesis, the determiners are considered through the use of contrastive analysis. The suggested descriptions are formalized in databases which are designed for automatic processing of natural languages. In the thesis, the functioning and properties of determiners in the Polish language are systematically described. The suggested analyses concentrate on morphosyntactic properties of the determiners in both languages. The simple and complex determinations are distinguished, at the same time the formal typology of determiners in the Polish language is presented. Additionally their syntactic-semantic properties which results in the division into predicative determination and argumentative determination are considered. The work contributes to the development of LDI electronic dictionaries
APA, Harvard, Vancouver, ISO, and other styles
33

Tzoukermann, Evelyne. "Morphologie et génération automatique du verbe français : implémentation d'un module conversationnel." Paris, INALCO, 1986. http://www.theses.fr/1986INAL0004.

Full text
APA, Harvard, Vancouver, ISO, and other styles
34

Osman, Muhammad Ussama. "Recherche méthodologique de la création terminologique en langues de spécialité, vocabulaire de l'informatique en arabe." Paris 3, 1989. http://www.theses.fr/1989PA030130.

Full text
Abstract:
L'auteur propose un releve des unites lexicales utilisees dans les ouvrages d'informatique en arabe pour determiner les procedes qui president a leur creation. L'objetif est de degager les regles et les procedes par lesquels l'arabe prend en charge un champ lexical nouveau constitue en langue etrangere. Avant d'effectuer la recherche proprement dite, l'auteur procede a une presentation du contexte socio-economique dans lequel se developpe la terminologie de l'informatique ainsi que les fondements de la methode de cette derniere. Dans une deuxieme partie l'auteur effectue un commentaire exhautif de l'analyse de la creation lexicale avant de passer aux differents procedes de cette creation en arabe, derivation, syntagmatisation, composition, siglaison ainsi que l'emprunt exterieur et interieur. L'auteur traite enfin le probleme de la synonymie en langue scientifique et technique et les necessaires uniformisations et normalisations terminologiques dans le monde arabe. L'etude est suivie d'une bibliographie abondante et de quelques annexes presentant des documents utiles<br>THE AUTHOR SUGGESTS TO STUDY A SAMPLE OF DATA PROCESSING TERMINOLOGY USED IN ARABIC PUBLICATIONS SO AS TO POINT OUT HOW ARABIC LANGUAGE DEALS WITH A VOCABULARY OF A TECHNICAL FIELD MAIMLY MADE IN FOREIGN LANGUAGES, ENGLISH AND FRENCH IN THE CASE OF ARABIC LANGUAGE. A REFORMULATED CONCEPTION OF "CREATION" IN TECHNICAL LANGUAGE IS SUGGESTED. THE DIFFERENT WAYS IN WHICH ARABIC ADOPTS AND TRANSFERS THE TERMINOLOGY OF THE DOMAINE OF THE STUDY ARE ANALYSED AND ILLUSTRATED WITH EXAMPLES. THE QUESTIONS OF TERMINOLOGY CREATION. COORDINATION AND DISSMINATION ACOSS THE ARAB WORD IS LARGELY DISCUSSED. THE BASIS FOR A COMPUTERIZED FUTURE research ON THIS VOCABULARY HAS BEEN SUGGESTED. A RICH SELECTIVE BIBLIOGRAPHY IS PROVIDED
APA, Harvard, Vancouver, ISO, and other styles
35

Dichy, Joseph. "L'ecriture dans la representation de la langue : la lettre et le mot en arabe." Lyon 2, 1990. http://www.theses.fr/1990LYO20024.

Full text
Abstract:
L'ecriture - au sens graphique de ce terme - est-elle "interne" ou "externe" au systeme de la langue ? la langue est ici definie comme un systeme de connaissances compatible avec ses differentes manifes- tations, notamment en prouction et en reconnaissance, de l'oral et de l'ecrit. Les unites premieres de l'ecriture, etudiees par la graphemologie, sont la lettre, le grapheme et le mot graphique. En ce qui concerne l'arabe, ces unites sont etudiees dans des textes des sciences mdievales arabes du langage (fondations de la lettre et du mot). Une axiomatique du mot graphique en arabe est ensuite developpee dans une double perspective de modelisation linguistique et de traitement automatique du langage naturel<br>Is writing -in the graphic meaning of the term - "inner" or "outer" to the system of language ? natural languages are considered here as cognitive systems structurally compatible with their various manifesta- tions, i. E. , mainly, oral and written production and recognition. The basic unities of writing, as studied by graphemology, are letters, graphemes and grphic words. As far as arabic is concerned, these unities are considered through the reading of texts pertraining to the medieval arabic sciences of language (foundation of the letter, of the word). An axiomatic analysis of the graphic word in arabic is then developed, both in the perspective of linguistic modelisation, and atomated processing of natural languages
APA, Harvard, Vancouver, ISO, and other styles
36

Ben, Henda Mokhtar. "Morphologie et architecture des interfaces de communication de l'information scientifique et technique dans un environnement multilingue : le contexte arabo-latin." Bordeaux 3, 1999. https://tel.archives-ouvertes.fr/tel-00006373.

Full text
Abstract:
Le multilinguisme arabe-latin que nous qualifions de multilinguisme lourd, presente deux particularites fondamentales qui le distinguent du multilinguisme souple (meme famille linguistique) : la representation et la bidirectionnalite graphiques ou textuelles. Le mecanisme de la representation et du traitement des caracteres et de leurs soubassements de codage et de normalisation constituent encore un point contraignant a la transparence linguistique des systemes et des interfaces homme-machines multilingues. Si le probleme est partiellement resolu sur les plates-formes monopostes et locales, les systemes d'information scientifique et technique ouverts et distribues (i. E. Internet) sont encore soumis a l'hegemonie linguistique latine et plus particulierement anglo-saxonne. L'introduction de la langue arabe (et autres non latines) y est certes en progression, mais elle reste encore interdite aux zones systemes (uris, protocoles, systemes operatoires. . . ). Notre contribution a l'il8n et la 11 on des systemes d'information multilingues en general et les interfaces homme-machine en particulier prend forme d'une proposition qui part du principe de correspondance entre un mecanisme numerique et un jeu de caracteres unifies (unicode, iso 10464). La bidirectionnalite est aussi un facteur de contrainte qui pese sur les interfaces multilingues homme-machine. Les algorithmes de tri, les methodes des traitements logiques et visuels des incises et des bris, les techniques de l'etiquetage et de la negociation linguistiques entre systemes distribues, l'opposition entre la rigueur gauche-droite des chiffres et leur traitement algorithmique de droite a gauche constituent les points les plus importants de notre etude du mecanisme bidi. Notre objectif essentiel est la revocation des systemes d'information et de communication multilingue herites pour ouvrir d'autres pistes de recherche dans les domaines de l'industrie de la langue et de la sociolinguistique<br>The arab-latin multilingualism that we identify as a hard multilingualism presents two major peculiarities that make it distinguishable from soft multilingualism (the same linguistic family) : graphic or textual representation and bidirectionnality. The mechanism of characters representation and processing on basis of coding and standards requirements constitute one of the prime constraints to linguistic transparency of multilingual systems and human-computer interfaces. Even tough the problem has been well addressed within the context of desktop and local platforms, open and distributed network systems (i. E. Internet) are still under control of latin oriented linguistic, and particularly anglo-saxon, hegemony. Other non latin languages are yet on their ways to integrate these systems but they are generally excluded from operating system areas (uris, protocols. . . ). Our contribution to i18n and li on of multilingual information systems and human-computer interfaces is proposed in terms of a combinatory mechanism between a numeric resources identification system and a unified coded character set (unicode or iso 10646). Bidirectionnality is also a constraining factor that weighs on human-computer multilingual interfaces. Sorting algorithms, logical and visual processing of text breaking and interpolation, linguistic labeling and negotiation between distributed systems, the opposition between left-to-right restrictive orientation of numeral and their internal right-to-left algorithmic way of processing constitute the major focal points of our analysis of the bidi mechanism. Our major concern in conducting this research is to revoke inherited and state-of-the-art multilingual scientific information and communication systems in order to dig deeper in specialized research areas like linguistic engineering and socilinguistics
APA, Harvard, Vancouver, ISO, and other styles
37

Trouilleux, François. "Identification des reprises et interprétation automatique des expressions pronominales dans des textes en français." Clermont-Ferrand 2, 2001. https://hal.archives-ouvertes.fr/tel-01152394.

Full text
APA, Harvard, Vancouver, ISO, and other styles
38

Michel, Johan. "Modèles d'activités pédagogiques et de support à l'interaction pour l'apprentissage d'une langue : le système Sampras." Phd thesis, Université du Maine, 2006. http://tel.archives-ouvertes.fr/tel-00090250.

Full text
Abstract:
Nos recherches s'inscrivent dans le domaine des EIAH et plus particulièrement dans les recherches menées sur la conception d'environnements d'apprentissage des langues étrangères. Nous nous intéressons à la conception et au support d'activités interactives au sein d'un micromonde dédié à l'apprentissage du français langue étrangère. L'idée sur laquelle repose la thèse est que l'apprentissage de la langue peut prendre place dans l'interaction entre un apprenant et un agent conversationnel. L'usage de la langue étrangère est mis en jeu au travers de la simulation d'une tâche applicative à accomplir dans un monde virtuel, réalisation impliquant la communication entre un apprenant et son partenaire virtuel. Nous élaborons des modèles qui décrivent les activités pédagogiques mises en place et le support aux interactions qu'elles génèrent. Ces modèles se décrivent selon trois dimensions qui permettent de caractériser la conception : tâche, interaction et langue. La description de la dimension tâche recouvre la description des tâches pédagogiques proposées aux apprenants, des tâches interactives créées à partir des spécifications des tâches pédagogiques et de la tâche applicative dont la résolution sert de prétexte à l'interaction. La description de la dimension interaction présente les types d'interaction attendus entre l'apprenant et son partenaire au cours des activités pédagogiques et le modèle d'interaction qui articule ces types d'interaction. La présentation de la dimension langue décrit le modèle du lexique, les mécanismes d'analyse des énoncés de l'apprenant et de génération des réactions du partenaire. Ces modèles ont été mis en œuvre lors de l'implémentation d'un prototype. Ce prototype a été expérimenté auprès de débutants en français langue étrangère.
APA, Harvard, Vancouver, ISO, and other styles
39

Jejcic, Fabrice. "Aménagements de la norme, variation et permanence dans l'écriture de variétés de français." Paris 10, 2002. http://www.theses.fr/2002PA100168.

Full text
Abstract:
L'analyse de corpus dialectaux (1911-1997), à partir d'une méthodologie informatisée, a permis d'identifier des systématiques d'écriture dans lesquelles la variation graphique s'avère fonctionnelle. Ces systèmes graphiques d'auteurs, construits selon des modalités contrastives (contrastes graphiques, phonologiques, lexicaux) reposent sur une interaction avec la norme graphique usuelle du français. En dépit de leur diversité, ces écrits présentent des caractéristiques communes dont les deux procédures majeures sont la dialectalisation graphique où les opérations de distanciation et de rapprochement consistent à donner une identité dialectale à la forme écrite ; et le dosage du patois où le contrôle de la variation permet d'assurer la bonne réception du texte à la lecture. La dynamique de ces écritures repose sur des registres oraux (notation du parler) et des registres scripturaux (mise en écriture) dont la lecture fait sens avec les représentations sociales<br>This computer-based analysis of a corpus made up of French dialectal texts (1911-1997) identifies systematic approaches to spelling in which variation has a specific function. The spelling systems of the authors studied here, whose aim is to design systems that are contrastive (through orthographical, phonological and lexical contrastivity), function through an interaction with the usual spelling norms of standard French. Beyond their differences, these texts all share common features : their two main modes of operation are orthographical dialectalisation in which the operations both of differentiation and of assimilation confer upon the written form its particular dialectal identity; and the dosing of patois forms, in which careful control of variation allows the author to ensure that his text can be read and easily understood. The dynamics of these written systems is based both on oral registers (noting the spoken language) and on written registers (the conventions of written language), which should be taken together with social representations
APA, Harvard, Vancouver, ISO, and other styles
40

Baldo, Sabrina. "Représentation des valeurs sémantiques de l'auxiliaire modal would en anglais : étude linguistique et système d'exploration contextuelle en vue du traitement informatique de sa traduction automatique en français." Paris 4, 2000. http://www.theses.fr/2000PA040221.

Full text
Abstract:
Le sujet de mon doctorat « représentation des valeurs sémantiques de l'auxiliaire modal would en anglais : étude linguistique et système d'exploration contextuelle en vue du traitement informatique de sa traduction automatique en français » se situe à la charnière de diverses disciplines : - la linguistique théorique avec l'analyse du modal would et de sa traduction en français ; - la linguistique appliquée à l'informatique avec la méthode d'exploration contextuelle ; - la traduction automatique unilatérale : de l'anglais vers le français. Ce travail s'articule en deux parties : d'abord une description linguistique où les valeurs sémantiques de would sont étudiées (translatif, hypothétique, volitif et autres). Cette première partie fait le bilan sur la polysémie des traductions possibles de would en français ainsi que sur sa valeur invariante. Ensuite, une partie de mise en application de l'exploration contextuelle pour la traduction automatique de would. La méthodologie de l'exploration contextuelle intègre linguistique, formalisation / informatique et aspects cognitifs du langage. Elle a été élaborée en plusieurs étapes : le repérage des indices linguistiques pertinents pour chaque valeur sémantique de would à partir de l'étude empirique d'un corpus, l'élaboration de plus de cent règles heuristiques et l'organisation hiérarchisée de l'ensemble sous la forme d'un système à base de connaissances. L'objectif de cette étude est de permettre la création d'un système expert apte à déduire la valeur sémantique de n'importe quelle occurrence du modal would en vue de sa traduction automatique.
APA, Harvard, Vancouver, ISO, and other styles
41

Lee, Kangho. "Les classes d'objets dans le domaine militaire : étude contrastive français-coréen." Paris 13, 2012. http://www.theses.fr/2012PA131023.

Full text
Abstract:
Nous adoptons le modèle des classes d’objets, qui s’inscrit dans la lignée de la grammaire transformationnelle de Z. S. HARRIS et des travaux sur le Lexique-grammaire de M. GROSS, pour décrire la langue spécialisée du domaine militaire en français et en coréen. Dans ce cadre théorique, l’unité minimale de sens est la phrase élémentaire qui est définie en termes de prédicats et d’arguments. Partant de ce principe, les termes relatifs aux opérations terrestres sont décrits et classés à partir de leur sémantique sur la base de critères syntaxiques. L’analyse est fondée sur une description fine du fonctionnement des termes militaires dans le cadre de la phrase, de la même manière que les mots dans la langue générale. Elle permet d’expliquer les intuitions terminologiques et de rendre compte des rapports entre leur sémantique et leur syntaxe. Le recours aux classes d’objets des termes militaires de nature prédicative et argumentale met en évidence la combinatoire entre des prédicats nominaux et leurs verbes supports, et entre des arguments et leurs prédicats appropriés. Il en résulte la possibilité de décrire de manière systématique et explicite le comportement syntaxique des termes militaires à partir de leurs classes d’objets<br>Our study adopts the model of object classes, in the tradition of Z. S. Harris’ transformational grammar and M. Gross’ work on Lexicon-Grammar, to describe the specialized language of the military in French and Korean. In this theoretical framework, the smallest unit of meaning is the elementary sentence, which is defined in terms of predicates and arguments. Following this principle, the terms related to land operations are described and classified according to their semantics based on syntactic criteria. Our analysis builds on a detailed description of the functioning of military terms within the elementary sentence, in the same way as words in general language. This helps explain terminological intuition and show the correlation between semantics and syntax. The use of object classes for the description of the predicative and argumental properties of military terms highlights the combinations between predicate nouns and their support verbs, as well as between arguments and their appropriate predicates. As a result, it becomes possible to describe in a systematic and explicit manner, the syntactic behaviour of military terms through their object classes
APA, Harvard, Vancouver, ISO, and other styles
42

Najai, Mouna. "Développement lexical précoce et biais nominal : études expérimentales et approche interlangue français / arabe." Clermont-Ferrand 2, 2010. http://www.theses.fr/2010CLF20026.

Full text
Abstract:
Gentner (1982) propose que le biais nominal (tendance précoce à produire davantage des noms) est un phénomène universel et tient aux propriétés du système cognitif qui traiterait plus facilement les éléments concrets vs. Abstraits. L’universalité du biais nominal est toutefois remise en cause. D’une part, l’ampleur du biais nominal n’est pas une constante lorsqu’on compare les langues entre elles. D’autre part, des variations d’ampleur du biais nominal semblent dépendre des méthodes de recherche. A propos des variations interlangues, nous nous inscrivons dans une approche fonctionnaliste selon laquelle les propriétés structurelles et statistiques de la langue maternelle influencent le développement langagier. C’est ainsi que nous avons comparé les productions réelles d’enfants arabophones et francophones (20 à 30 mois). Comme attendu, on constate un biais nominal dans les 2 langues, biais qui s’atténue avec l’âge et qui est moins important chez les enfants arabophones. Dans un 2e temps, nous avons montré que la capacité des sujets adultes à repérer les mots d’un langage artificiel dépend de leur position dans les phrases. Concernant l’effet des méthodes de recherche sur le lexique précoce, nous avons trouvé que le biais nominal est plus important dans l’inventaire parental que dans les productions réelles et, dans ces dernières, qu’il est dépendant du contexte d’observation. Ainsi, le lexique précoce est contraint par des propriétés du système cognitif qui interceptent en priorité les éléments les plus saillants du langage. Par ailleurs, les comparaisons interlangues ne peuvent prendre sens qu’à condition de standardiser les méthodes de recherche
APA, Harvard, Vancouver, ISO, and other styles
43

Panckhurst, Rachel. "Description linguistique et implémentation en FX des structures interrogatives (directes) du français." Phd thesis, Université Blaise Pascal - Clermont-Ferrand II, 1990. http://tel.archives-ouvertes.fr/tel-00923809.

Full text
Abstract:
L'objectif de cette recherche est de bâtir un répertoire descriptif généralisé des structures interrogatives directes du français. Le travail est pluridisciplinaire : linguistique, informatique, documentation. La partie linguistique consiste à dresser un répertoire descriptif formel dans lequel toutes les propriétés pertinentes concernent l'interrogation. Ces propriétés doivent être suffisamment abstraites pour que n'importe quel formalisme puisse les incorporer au besoin. L'implémentation sous forme d'un répertoire vise ensuite l'incorporation des contraintes apportées par la description linguistique. Enfin, nous proposons une consultation de bases de données à visée linguistique, qui est reliée par interface à l'analyse informatique.
APA, Harvard, Vancouver, ISO, and other styles
44

Mela, Augusta. "Traitement automatique de la coordination par et." Paris 13, 1992. http://www.theses.fr/1992PA132040.

Full text
Abstract:
L'analyse des constructions coordonnées a toujours constitué un centre d'intérêt aussi bien en linguistique théorique qu'en linguistique computationnelle. Le phénomène de la coordination par "et" est à la fois large et subtil. Une chaîne conjonctionnelle peut apparaître à droite de presque n'importe quel élément d'une chaîne, constituant ou non-constituant mais pas n'importe où. Cela pose à la fois le problème théorique de rendre compte précisément de l'ensemble des constructions autorisées et le problème calculatoire d'analyser ces constructions le plus efficacement possible. Dans cette thèse nous dressons un inventaire des difficultés occasionnées par ces constructions; nous présentons un état de l'art: précisement nous exposons comme différents formalismes syntaxiques, (tg, gpsg, lfg, ccg) abordent ces problèmes. Nous en tirons des conséquences concernant le choix d'un cadre formel adéquat pour la description de la coordination. Nous proposons un critère de coordination base sur le pouvoir constructeur de têtes lexicales. Nous prétendons que ce critère rend compte des phénomènes structurels que sont les coordinations de constituants de même catégorie et des coordinations de plus d'un constituant, et qu'il est pertinent mais insuffisant pour la coordination de catégories différentes et la coordination à trouée qui sont des phénomènes plus sémantiques.
APA, Harvard, Vancouver, ISO, and other styles
45

Naray-Szabo, Marton. "Les phrases à sujet figé : étude pragmatique, syntaxique et sémantique." Paris 13, 2006. http://www.theses.fr/2006PA131010.

Full text
Abstract:
Divers réseaux, regroupés sous le terme générique de réseau numérique éducatif, se sont développés dans le système scolaire français de 1987 à 2005 : télématique, réseaux locaux, Internet, Intranet et espaces numériques se sont stratifiées, élaborant progressivement une composante d'une communication scolaire médiatisée. La recherche se place sous les éclairages de la technique, des usages et de l'organisation ; elle s'inspire de la théorie de l'acteur-réseau, dans une analyse des conditions d'implantation d'innovations sociotechniques. Elle révèle des tendances lourdes et concomitantes, déterminantes dans un processus général de globalisation et de banalisation des fonctions de communication à l'école : organisation progressive d'une architecture globale d'information, affirmation de l'importance d'une démarche stratégique qui place les dynamiques d'usage au second plan, logique d'industrialisation et extension progressive du domaine scolaire vers le domicile<br>Various networks, gathered under the generic term of educational digital network, developed in the French school system since 1987 to 2005: telematics, local area networks, Internet, Intranet and digital spaces were laminated, gradually working out a component of a mediatized school communication. This research is located under lightings of the technique, the uses and the organization; it takes as a starting point the actor-network theory (ANT), in an analysis of the conditions of sociotechnic innovations establishment. It reveals heavy and concomitant tendencies, determining in a general globalisation and vulgarizing process of the communication functions at school: progressive organization of a total architecture of information, assertion of the importance of a strategic step which puts the dynamic ones of use on the second level, logic of industrialization and progressive extension of the school field towards the residence
APA, Harvard, Vancouver, ISO, and other styles
46

Renard, Carole. "Etude linguistique et didactique des collocations verbe / substantif en français langue étrangère : vers la conception d'une activité informatisée de sensibilisation." Clermont-Ferrand 2, 2007. http://www.theses.fr/2007CLF20012.

Full text
Abstract:
La thèse s'interroge globalement sur l'intégration du multimédia dans l'enseignement / apprentissage du vocabulaire en Français Langue Etrangère. L'étude se focalise non pas sur les mots isolés, mais sur certaines combinaisons appelées collocations verbe / substantif (par exemple : dépêcher un expert, donner son avis, prendre un bain, faire le pitre, etc. ). En effet, associations d'unités du lexique, et plus particulièrement celles qui sont constituées d'un élément verbal et d'un élément nominal, constituent une difficulté majeure pour les apprenants non francophones : comment savoir quel verbe va avec quel nom, quel nom va avec quel verbe ? Pourquoi, en aglais, on "prend une promenade"( to take a walk) et en espagnol, on "donne une promenade" (dar un paseo) alors qu'en français on "fait une promenade". D'un point de vue théorique, le travail envisagé se propose de mieux cerner ce que sont les collocations verbe / substantif d'un point de vue interne, c'est-à-dire en envisageant ces structures à la lumière de la linguistique ( quelles sont leur propriétés, leur mode de fonctionnement dans la langue ?) mais également d'un point externe, c'est -à-dire en les étudiant sous un angle didactique (comment présenter et faire travailler ces structures dans un cadre d'enseignement / apprentissage ?). D'un point de vue pratique, nous nous sommes appuyés sur cette double réflexion pour penser et réaliser une activité informatisée ayant pour objectif une sensibilisation à la collocativité verbo-nominale en Français Langue Etrangère
APA, Harvard, Vancouver, ISO, and other styles
47

Gosme, Julien. "Énumération exhaustive et détection spécifique des analogies : étude pour les modèles de langue et la traduction automatique." Phd thesis, Université de Caen, 2012. http://tel.archives-ouvertes.fr/tel-00700559.

Full text
Abstract:
Ce travail de thèse s'inscrit dans le cadre de la traduction automatique. En étudiant les fondements de la traduction automatique par l'exemple, et plus particulièrement le système Aleph, nous mettons en évidence le problème de la sélection des exemples. Le système Aleph emploie exclusivement l'analogie afin de produire de nouvelles phrases et de nouvelles traductions. Le problème est de sélectionner les phrases dans un grand corpus d'exemples afin de produire de nouvelles phrases par analogie. Notre premier apport consiste en l'élaboration d'une méthode permettant d'énumérer l'intégralité des analogies entre chaînes d'un texte. Cette méthode nous permet ensuite de mettre en œuvre une étude statistique des analogies les plus fréquentes entre trigrammes de mots et de mettre en évidence les patrons d'analogie les plus fréquents. Ces résultats permettent alors de concevoir une nouvelle méthode de lissage d'un modèle de langue trigramme basé sur un petit nombre d'analogies. Nos expériences montrent que cette méthode est très compétitive vis-à-vis des méthodes classiques.
APA, Harvard, Vancouver, ISO, and other styles
48

Zumstein, Franck. "Variation accentuelle, variation phonétique : étude systématique fondée sur des corpus lexico-phonétiques informatisés anglais." Poitiers, 2007. http://www.theses.fr/2007POIT5025.

Full text
Abstract:
Dans ce travail, nous abordons le problème de la variation accentuelle du lexique de l'anglais contemporain, tel qu'il se manifeste dans le mot "controversy" (schéma accentuel /1000/ ou /0100/), par exemple. Notre corpus de référence est une version électronique du "Longman Pronunciation Dictionary" de John Wells, dont la version papier fut publiée en 1990. Suite au traitement informatique du corpus, nous avons mené des analyses linguistiques dans le cadre de travaux de Lionel Guierre sur l'accentuation lexicale de l'anglais. Afin de déterminer le caractère archaïque ou [sic. ] émergent des variantes en jeu, nous avons également repris les enregistrements dictionnairiques de plusieurs lexicographes anglais des XVIIIè et XIXè siècles. Au terme de notre étude, nous avons pu dégager des constantes touchant aux facteurs déterminants de la variation et faire apparaître la directionnalité de la variation examinée. Parmi ces constantes, nous avons pu constater le rôle important de la sémantique lexicale<br>In this piece of work is examined word-stress variation in contemporary English, such as in the word "controversy" (stressed /1000/ or /0100/). Our linguistic analyses are based on automatic data retrieval from a computer-readable version of John Well's "Longman Pronunciation Dictionary" published in 1990. Eighteenth and nineteenth century English dictionaries are also consulted so as to determine whether variants are old stressings or new patterns. The results of this study, which is a follow-up of Lionel Guierre's work on word stress in English, highlight the direction of the change of the alternating stress patterns and show that regular criteria, notably the meaning of words, account for such variations
APA, Harvard, Vancouver, ISO, and other styles
49

Ranaivoson, Jeannot Fils. "Etude des constructions à prédicat mx-N en malgache : classe d'objets et traduction." Paris 13, 1996. http://www.theses.fr/1996PA131003.

Full text
Abstract:
Les predicats mx-n, dans lesquels n est un substantif non predicatif designant la plupart du temps un objet concret, sont dans la langue malgache, des verbes ou des adjectifs de formation particuliere. En general, dans cette langue, les verbes et les adjectifs sont derives de radicaux notionnels ou de noms predicatifs. La presente etude est axee sur la syntaxe de ces elements et vise leur traduction en francais. La methode utilisee est le lexique-grammaire complete par l'emploi des classes d'objets. La transformation de nominalisation par l'intermediaire des verbes appropries et des verbes operateurs a ete la base de la typologie des elements etudies. L' element n du predicat s'est revele, apres application de ces types de nominalisation, etre soit un objet, soit un moyen, soit un attribut du sujet ou du premier complement de la phrase, soit un objet auquel le sujet ne s'applique pas mais qu'il produit, soit encore un instrument, un lieu ou un element qui exige des arguments symetriques. En ce qui concerne la traduction, elle a ete faite de deux manieres : les radicaux n ont ete traduits litteralement, tandis que les operateurs mx-n l'ont ete de facon equivalente. Cette approche met en evidence les glissements, voire, parfois, les changements de sens qui peuvent avoir lieu dans le passage d'un radical a une forme verbale ou adjectivale<br>In the malagasy language, the predicates mx-n, where n is a non-predicative noun that normally designates a concrete object, are verbs or adjectives peculiarly formed generally, the verbs and adjectives in that language are derived from notional radicals or predicative nouns. This study is concerned with the syntax of these elements and their translation into french. The method used is the lexique-grammaire completed by the use of object classes. The nominalization process, with the help of appropriate verbs and operative verbs, has been used as the basis for the study of typology of these elements. Through the use of these types of nominalization, it was discovered that the element n of the predicate was either an object, or a means, an attribute of the subject or the first object of the sentence, or an object to which the subject does not apply but is produced by the latter, or else an instrument, a place or an element requiring symetrical arguments. As regard the translation, it has been done in two ways : the n radicals have been translated literally, whereas the operators mx-n have been translated by using equivalent. This approach clearly shows the shift or even sometimes, the loss in meaning that may occur when changing from a radical to a verbal or adjectival form
APA, Harvard, Vancouver, ISO, and other styles
50

Mermet, Michel Favereau Francis. "Informatique et maîtrise de l'oral en maternelle bilingue breton-français modèle de l'élève dans le dialogue enfant-ordinateur et ergonomie de la parole /." Rennes : Université Rennes 2, 2007. http://tel.archives-ouvertes.fr/tel-00199337/fr.

Full text
APA, Harvard, Vancouver, ISO, and other styles
We offer discounts on all premium plans for authors whose works are included in thematic literature selections. Contact us to get a unique promo code!

To the bibliography