To see the other types of publications on this topic, follow the link: Malgache (langue) – Traduction automatique.

Dissertations / Theses on the topic 'Malgache (langue) – Traduction automatique'

Create a spot-on reference in APA, MLA, Chicago, Harvard, and other styles

Select a source type:

Consult the top 50 dissertations / theses for your research on the topic 'Malgache (langue) – Traduction automatique.'

Next to every source in the list of references, there is an 'Add to bibliography' button. Press on it, and we will generate automatically the bibliographic reference to the chosen work in the citation style you need: APA, MLA, Harvard, Chicago, Vancouver, etc.

You can also download the full text of the academic publication as pdf and read online its abstract whenever available in the metadata.

Browse dissertations / theses on a wide variety of disciplines and organise your bibliography correctly.

1

Rakotoalimanana, Herizo David. "Structure morphosyntaxique et modélisation informatique de la langue malgache." Nancy 2, 2000. http://www.theses.fr/2000NAN21035.

Full text
Abstract:
La présente étude s'inscrit dans le cadre d'un essai de traitement automatique de la langue malgache visant à construire un dictionnaire électronique. Notre travail est articulé autour de deux axes principaux : une étude descriptive de la langue d'une part et une modélisation informatique d'autre part. Après un chapitre préliminaire consacré à une présentation générale, nous présentons dans la première partie une analyse des termes malgaches portant tant sur les formes de la structure morphologique ou morphématique que sur leur comportement syntaxique. Les relations entre les constituants d'un énoncé sont détaillées. Nous décrivons les différentes voix des énoncés malgaches et les modalités : le temps, l'aspect et le mode. Dans la deuxième partie, nous formalisons les données linguistiques dégagées dans la partie descriptive pour en faire une implantation informatique d'un système d'Analyseur-Générateur des Termes prédicatifs Malgaches (AGTM). L'analyse automatique d'un terme consiste à repérer ses constituants, identifier leurs relations et assigner leur traduction en français. Notre système fournit toutes les formes dérivées possibles d'un terme. Nous terminons cette partie pratique par le bilan de notre étude et les perspectives d'avenir. La thèse est complétée par des annexes qui rassemblent le module de programmation et les résultats obtenus
This study is intented to provide a first framework for the definition of an electronic dictionary of the Malagasy language to be used in the context of Natural Language Processing components. Our work is based, on the one hand, on a descriptive study of the Malagasy language, and, on the other hand, on the proposition of a computer representation of the corresponding phenomena. Following a preliminary chapter dedicated to a general presentation of the geographical and sociological context, the first part of the thesis presents a thorough analysis of Malagasian terms from the point of view of their morphology and syntactic behaviour. In particular, we describe the various voices and modalities of Malagasian utterances : tense, aspect and mood. The second part of the thesis comprises the formel representation that we associate to the linguistic data that have been previously described, so that a possible implementation can be derived in the form of a parser / generator of Malagasian predicative terms (AGTM). The automatic analysis of a term is based upon the identification of its various constituants, the relations that link these together and the identification of a possible translation in French for the term. Our system can also provide all the possible forms that can be derived from a root, given a set of restrictions provided as input. The thesis comprises several appendixes which present the whole software implemented in Prolog, as well as sample results
APA, Harvard, Vancouver, ISO, and other styles
2

Ranaivoson, Jeannot Fils. "Etude des constructions à prédicat mx-N en malgache : classe d'objets et traduction." Paris 13, 1996. http://www.theses.fr/1996PA131003.

Full text
Abstract:
Les predicats mx-n, dans lesquels n est un substantif non predicatif designant la plupart du temps un objet concret, sont dans la langue malgache, des verbes ou des adjectifs de formation particuliere. En general, dans cette langue, les verbes et les adjectifs sont derives de radicaux notionnels ou de noms predicatifs. La presente etude est axee sur la syntaxe de ces elements et vise leur traduction en francais. La methode utilisee est le lexique-grammaire complete par l'emploi des classes d'objets. La transformation de nominalisation par l'intermediaire des verbes appropries et des verbes operateurs a ete la base de la typologie des elements etudies. L' element n du predicat s'est revele, apres application de ces types de nominalisation, etre soit un objet, soit un moyen, soit un attribut du sujet ou du premier complement de la phrase, soit un objet auquel le sujet ne s'applique pas mais qu'il produit, soit encore un instrument, un lieu ou un element qui exige des arguments symetriques. En ce qui concerne la traduction, elle a ete faite de deux manieres : les radicaux n ont ete traduits litteralement, tandis que les operateurs mx-n l'ont ete de facon equivalente. Cette approche met en evidence les glissements, voire, parfois, les changements de sens qui peuvent avoir lieu dans le passage d'un radical a une forme verbale ou adjectivale
In the malagasy language, the predicates mx-n, where n is a non-predicative noun that normally designates a concrete object, are verbs or adjectives peculiarly formed generally, the verbs and adjectives in that language are derived from notional radicals or predicative nouns. This study is concerned with the syntax of these elements and their translation into french. The method used is the lexique-grammaire completed by the use of object classes. The nominalization process, with the help of appropriate verbs and operative verbs, has been used as the basis for the study of typology of these elements. Through the use of these types of nominalization, it was discovered that the element n of the predicate was either an object, or a means, an attribute of the subject or the first object of the sentence, or an object to which the subject does not apply but is produced by the latter, or else an instrument, a place or an element requiring symetrical arguments. As regard the translation, it has been done in two ways : the n radicals have been translated literally, whereas the operators mx-n have been translated by using equivalent. This approach clearly shows the shift or even sometimes, the loss in meaning that may occur when changing from a radical to a verbal or adjectival form
APA, Harvard, Vancouver, ISO, and other styles
3

Kuroda, Kyoko. "Traduction automatique : divergences de traduction entre le japonais et le français." Besançon, 2006. http://www.theses.fr/2006BESA1004.

Full text
Abstract:
Des phrases obtenues à l'issue de traduction montrent des divergences variées et importantes surtout quand il s'agit de langues éloignées comme le japonais et le français. Le but du présent travail est de mettre en évidence la divergence de traduction de ces langues et d'appliquer ce qui en sera dégagé à un système de transfert. Pour ce faire nous nous intéressons particulièrement à leur disparité qui s'observe au niveau de la structure prédicat-arguments. Nous y avons entre autres recensé des changements de catégorie prédicative, changement de voix, une diversification de la distribution actancielle et différentes formes du prédicat actualisé. Ces disparités sont souvent, d'après nous, corrélées et ont des souches communes. Elles peuvent s'expliquer par ce que Pottier appelle statuts événementiels du prédicat, c'est-à-dire que selon que le procès à exprimer est au statif ou à l'évolutif, la façon de le représenter devient différente. Cette différenciation dépend largement du lexique dont chaque langue dispose et des contraintes syntactico-sémantiques que chaque langue impose à son lexique. Nous avons ainsi essayé de dégager des facteurs qui sont à la fois corrélés entre les faits divergents et communs à nos deux langues. Nous les avons par la suite inscrits dans la description de chaque item lexical, en considérant qu'ils permettent au système de transfert de déclencher des opérations qui neutralisent la disparité. Après avoir présenté la formalisation de ces descriptions lexicales qui sont basées sur la grammaire de l'unification, nous montrons le processus de transfert que le système mène à l'aide des indications des facteurs communs
Sentences obtained by translation show varied and important syntactic discrepancies. This is true especially when the sentences are in distant languages such as Japanese and French. This work described here explores the issue of translation divergence of these particular languages in order to apply the results of this investigation to our transfer system. With this intention we are interested in the discrepancy observed at the level of verbal argument structures. We put special focus on changes of lexical category, changes of voice, diversification of the actancial distribution and various forms of actualized predicate. These disparities often are correlated with each other and have common origins. For example they can be explained by what Pottier calls ‘event statutes' of the predicate. That is, according to whether the event to be expressed is one of state or evolution, the way of representing the event is different. Furthermore, this differentiation largely depends on the lexicon of each language and also on the syntactico-semantic constraints which each language imposes on its lexicon. We have thus endeavored to extract factors which, on the one hand, are correlated between the diverging facts and, on the other hand, are common to our two languages. We have included these factors in the lexical description, in considering that they thus enable the transfer system to apply operations which neutralize the disparity. Having formalized these lexical descriptions which are based on unification grammar, we show how the transfer system uses the common factors in order to neutralize the discrepancy
APA, Harvard, Vancouver, ISO, and other styles
4

Lin, Hsiang-I. "Vers une traduction automatique des expressions figées françaises en chinois : la traduction canonique." Besançon, 2004. http://www.theses.fr/2004BESA1023.

Full text
Abstract:
Les expressions figees, qui reviennent si souvent dans la presse, dans les textes litteraires et dans le discours quotidien, donnent souvent du fil a retordre aux apprenants de la langue mais aussi aux traducteurs. Les resultats rendus par les systemes de traduction automatique (ta) n'en restent pas moins frustrants, surtout quand il s'agit de traduire une expression figee française en chinois. Peut-on alors realiser un systeme de TA capable de reconnaitre correctement le sens d'une expression figee française, et de la traduire en chinois d'une maniere intelligible ? Apres avoir fait le tour d'horizon des expressions figees, de la traduction (humaine), et de la TA, nous avons degage les problemes inherents a ces domaines : la nature polysemique des expressions figees françaises ; le principe de fidelite en traduction : la fidelite au sens ; la reconnaissance du sens de l'expression française, et la generation d'une traduction sensee en chinois - par la machine : la formalisation de tous les aspects linguistiques et traductionnels est donc imperative. Nous avons constate que le sens occupe une place centrale dans les domaines concernes, et que le sens est sous-jacent aux formes tangibles. Le sens d'une expression figee peut non seulement etre cerne par la forme qu'elle presente, mais il peut aussi prendre une valeur unique par rapport aux co-textes de l'expression. Ainsi, nous avons etabli une approche canonique basee sur les aspects semantiques et formels des expressions figees françaises et de leurs traductions en chinois, avant d'elaborer le systeme trace (traduction canonique des expressions), capable de traduire correctement une expression figee française en chinois
Fixed expressions are frequently used in the media, in the literature and in daily conversations. Thus, they often perplex learners of a new language, but also translators. Moreover, existing machine translation systems give frustrating results for fixed expression entries, especially when it comes to translating french fixed expressions into chinese. Would it be possible to create a machine translation system that is able to recognize the right sense of a french fixed expression and then to translate it into chinese in an intelligible way ? After studying fixed expressions, (human) translation and machine translation, we find out the principal problems that are inherents in the related areas : the polysemic nature of french fixed expressions ; the principle of fidelity in translation: fidelity to the sense ; the recognization of the right sense of a french fixed expression, and the output of an intelligible chinese translation - by a machine : the formalization of all linguistic and translating respects is therefore indispensable. These problems show that the sense is the essential element in the related areas, and that the sense underlies concrete forms. The sense of a fixed expression may not only be determined by the form that the expression takes, but also be outlined by its co-textes. Based on these findings, We suggest the canonical approach on the bassis of semantic and formal respects of french fixed expressions and their chinese translations. With this approach, We establish the trace system (canonical translation of expressions) which is able to translate correctly a french fixed expression into chinese
APA, Harvard, Vancouver, ISO, and other styles
5

Pétry, Jean-Luc. "Le prénom "il" en traduction assistée par ordinateur étude théorique /." Metz : Université Metz, 2008. ftp://ftp.scd.univ-metz.fr/pub/Theses/1996/Petry.Jean_Luc.LMZ969.pdf.

Full text
APA, Harvard, Vancouver, ISO, and other styles
6

Severini, Alfiero. "Mise au point d'un système de traduction automatique italien-français." Paris 13, 2001. http://www.theses.fr/2001PA131007.

Full text
Abstract:
Nous présentons dans ce travail, qui a une connotation méthodologique et qui est orienté vers lápplication, les résultats d'une étude et d'une activité de développement qui se sont concrétisés dans la mise au point d'un système de traduction automatique italien-français. Dans la première des trois parties, dans lesquelles s'articule ce travail, nous décrivons les différentes composantes d'un système de traduction automatique Systran ainsi que les étapes successives qui nous ont permit d'aboutir à partir des ressources disponibles, à un système de traduction italien-français opérationnel. Nous décrivons également le processus de création et l'élargissement du lexique de base. Dans la deuxième partie, nous illustrons, avec beaucoup de détails et d'exemples, les activités de développement linguistique et les interventions effectuées aux différents niveaux du système qui, graduellement, ont permis d'améliorer la qualité et de stabiliser le système dans son ensemble. Dans la troisième partie, nous évaluons le travail accompli et jetons un regard critique sur ce couple de langues ainsi que sur le système Systran en général et sur ses réelles limites. En guise de conclusion, nous avançons quelques propositions pour élargir la couverture sémantique du lexique et pour améliorer le traitement des expressions figées et des expressions idiomatiques.
APA, Harvard, Vancouver, ISO, and other styles
7

Maillot, Catherine DIMON PIERRE. "LE TRAITEMENT DES PREPOSITIONS SPATIALES DANS UN SYSTEME DE TRADUCTION AUTOMATIQUE FRANCAIS-ALLEMAND, ALLEMAND-FRANCAIS BASE SUR L'UNIFICATION /." [S.l.] : [s.n.], 1997. ftp://ftp.scd.univ-metz.fr/pub/Theses/1997/Maillot.Catherine.LMZ9718_1.pdf.

Full text
APA, Harvard, Vancouver, ISO, and other styles
8

Maillot, Catherine. "Le traitement des prépositions spatiales dans un système de traduction automatique français-allemand, allemand-français, basé sur l'unification." Metz, 1997. http://docnum.univ-lorraine.fr/public/UPV-M/Theses/1997/Maillot.Catherine.LMZ9718_1.pdf.

Full text
Abstract:
Le présent travail s'intéresse au traitement des prépositions spatiales dans un système de traduction automatique français-allemand, allemand-français base sur l'unification. Il se compose de deux tomes : le premier traite de la partie théorique. Il comporte une étude des prépositions du point de vue morphologique, syntaxique, sémantique et pragmatique, et présente les travaux actuels sur le traitement automatique de la localisation spatiale. Il se poursuit par une présentation des différents modèles existants : la grammaire des cas et les grammaires d'unification, ainsi que les implémentations informatiques dans lesquelles elles sont employées. Il se termine par une présentation du système cat2 et du fonctionnement du programme de traduction. Le second volume traite de la partie pratique, il se compose des organigrammes utilises pour l'implémentation et de l'ensemble du programme de traduction que nous avons créé. Il intègre les dictionnaires morphologiques français et allemand, les dictionnaires sémantiques français et allemand, le programme en lui-même ainsi que les corpus
This thesis deals with the + processing of spatial prepositions in a french-german, german- french unification-based machine translation system ;. It is divided into two volumes : the first one deals with theoritical concerns and first with the study of prepositions in four fields : morphology, syntax, semantics and pragmatics, and presents the current studies on computer-oriented processing of spatial localization. It is followed by a presentation of already existing models: case grammar and unification grammars, and the computer implementation in which they are used. It ends with a presentation of the cat2-system and of the way the translation program functions. The second volume corresponds to the pratical part of our work and presents organigrams used for the translation program we have created. It also includes french and german morphological dictionaries, french and german semantical dictionaries, along with the computer-program and the different test-examples
APA, Harvard, Vancouver, ISO, and other styles
9

Nakamura, Delloye Yayoi. "Alignement automatique de textes parallèles français - japonais." Paris 7, 2007. http://www.theses.fr/2007PA070054.

Full text
Abstract:
L'alignement automatique consiste à trouver une correspondance entre des unités de textes parallèles. Nous nous intéressons plus particulièrement à la réalisation d'un système qui procède à l'alignement au niveau des propositions, unités profitables dans beaucoup d'applications. La présente thèse est constituée de deux types de travaux : les travaux introducteurs et ceux constituant le noyau central. Ce dernier s'articule autour de la notion de proposition syntaxique. Les travaux introducteurs comprennent l'étude des généralités sur l'alignement ainsi que des travaux consacrés à l'alignement des phrases. Ces travaux ont conduit à la réalisation d'un système d'alignement des phrases adapté au traitement des textes français et japonais. Le noyau de la thèse est composé de deux types de travaux, études linguistiques et réalisations informatiques. Les études linguistiques se divisent elles-mêmes en deux sujets : la proposition en français et la proposition en japonais. Le but de nos études sur la proposition française est de définir une grammaire pour la détection des propositions. Pour cet effet, nous avons cherché à définir une typologie des propositions, basée sur des critères uniquement formels. Dans les études sur le japonais, nous définissons d'abord la phrase japonaise sur la base de l'opposition thème-rhème. Nous tentons ensuite d'élucider la notion de proposition. Les réalisations informatiques comportent trois tâches composant ensemble au final l'opération d'alignement des propositions, incarnées par trois systèmes informatiques distincts : deux détecteurs de propositions (un pour le français et un pour le japonais), ainsi qu'un système d'alignement des propositions
Automatic alignment aims to match elements of parallel texts. We are interested especially in the implementation of a System which carries out alignment at the clause level. Clause is a beneficial linguistic unit for many applications. This thesis consists of two types of works: the introductory works and those that constitute the thesis core. It is structured around the concept of syntactic clause. The introductory works include an overview of alignment and studies on sentence alignment. These works resulted in the creation of a sentence alignment System adapted to French and Japanese text processing. The thesis core consists of two types of works: linguistic studies and implementations. The linguistic studies are themselves divided into two topics: French clause and Japanese clause. The goal of our French clause studies is to define a grammar for clause identification. For this purpose, we attempted to define a typological classification of clauses, based on formal criteria only. In Japanese studies, we first define the Japanese sentence on the basis of the theme-rheme structure. We then try to elucidate the notion of clause. Implementation works consist of three tasks which finally constitute the clause alignment processing. These tasks are carried out by three separate tools: two clauses identification Systems (one for French texts and one for Japanese texts) and a clause alignment System
APA, Harvard, Vancouver, ISO, and other styles
10

Lab, Frédérique. "Linguistique contrastive et traduction automatique, une étude de cas : les traductions anglaises du présent français." Paris 7, 1991. http://www.theses.fr/1991PA070041.

Full text
Abstract:
Apres une breve introduction a la traduction automatique et quelques definitions relatives a ce domaine, l'auteur etudie plus particulierementles problemes du traitement du temps et de l'aspect dans certains systemes de t. A. Existants. Un chapitre entier, d'approche critique, est consacre au projet europeen eurotra. La partie principale de la these consiste en un examen attentif des traductions du present francais francais en anglais : 1) quelles sont les possibilites de traduction du present (etude de corpus)? 2) que faut-il prendre en compte pour deduire la valeur du present et donc le traduire (interpretation referentielle, statut du proces, determination nominale, aspect lexical), 3) quelles regles peut-on etablir pour la traduction automatique des formes verbales au present?
After a brief introduction to machine translation, with a few definitions relating to this domain, the author studies the treatment of time and aspect in some of the existing m. T. Systems. A whole section is devoted to the european pr0ject "eurotra", with a critical approach. The main partof the thesis consists of a thorough examination of the translations of the french "present" tense into english : 1) what are the various possible translations (study of a corpus)? 2) what has to be taken into account in order to infer the value of the present and hence translate it (referential interpretation, status of the process, noun determination, lexical aspect), 3) what are the rules that can be drawn for the automatic translation of these verbal forms?
APA, Harvard, Vancouver, ISO, and other styles
11

Anchaleenukoon, Sunant. "Etude contrastive des systemes predicatifs francais et thai en vue de la traduction automatique." Paris 3, 1993. http://www.theses.fr/1993PA030135.

Full text
Abstract:
Les systemes predicatifs francais et thai sont analyses en termes de logique et de semantique parce que ces langues sont tres eloignees au niveau syntaxique. Pour neutraliser les differences de classes syntaxiques pour la meme classe semantique, nous utilisons la notion d'unite lexicale, qui joue un role important en tao. Dans les systemes de tao, construits selon la methodologie de b. Vauquois, une structure multiniveau est une arborescence dontles noeuds sont pourvus d'etiquettes complexes contenant, outre une unite lexicale pour les noeuds a contenu lexical, des informations permettant d'interpreter la structure a plusieurs niveaux. Par ordre de "profondeur", on utilise en tao les niveaux syntaxique et syntagmatique, syntaxique fonctionnel, et logico-semantique. L'analyse generale que nous avons effectuee montre que la langue francaise et la langue thai ont les memes types de concepts. Il s'agit du proces, de l'etat et de l'entite, qui sont les types derivationnels, des predicats. Les resultats de notre analyse detaillee des predicats francais et thai montrent qu'il existe de grandes ressemblances entre les systemes predicatifs de deux langues. Ces deux systemes ne presentent en fait que peu de differences menant a des problemes difficiles pour la tao. D'une part, il y a peu de differences en ce qui concerne les restrictions semantiques en francais et en thai. D'autre part, les differences de temps, de modes, et d'ordre des mots entre le francais et le thai ne posent en principe pas de probleme pour la tao, parce qu'on peut en decrire les. .
The predicative systems of french and thai are analyzed with a view to machine translation. This analysis is carried out in terms of logic and semantics, as these two languages are quite different at the syntactic level. We then use the notion of lexical units. The lexical units concerning the predicative system play a very important role in machine translation. They allow to neutralize the differences of the syntactic classes for the same semantic class. According to the method of prof. B. Vauquois, multilevel structures are used in mt systems to represent the analysis of units of translation. A multilevel structure is a tree structure where the nodes bear complex labels contraining the necessary informations to interpret each level selected. These levels are presented by the hierarchy of their "deep structure". The general analysis allow us to observe that the french and thai languages have the same kinds of concepts : process, state and entity, which constitute the derivative types of the predicates. The result of this analysis shows that the greater part of the predicative system in french and thai is quite the same. We found that there will be very few difficult points in french-thai machine translation caused by differences in the predicative systems. On the one hand, there are very few differences concerning semantic restrictions on arguments of. .
APA, Harvard, Vancouver, ISO, and other styles
12

Anchaleenukoon, Sunant. "Étude contrastive des systèmes prédicatifs français et thai en vue de la traduction automatique." Paris 3, 1993. http://www.theses.fr/2003PA03A135.

Full text
APA, Harvard, Vancouver, ISO, and other styles
13

Wu, Xiaohong. "Conception d'une langue contrôlée pour un système de traduction automatique de protocoles médicaux : applications aux domaines de l'échinococcose et au clonage moléculaire." Besançon, 2006. http://www.theses.fr/2006BESA1012.

Full text
Abstract:
Cette thèse propose une étude linguistique en vue de la création d'un modèle de système de traduction automatique anglais-chinois dans deux sous-domaines de la médecine : l'échonococcose et le clonage moléculaire. L'objectif principa consiste à mettre en lumière, au moyen d'une analyse contrastive détaillée, les différences (lexicales, syntaxiques et sémantiques) entre ces deux langues, qui, souvent, pour une machine, constituent la cause d'une traduction erronée. Nous avons comparée les protocoles médicaux traduits par les traducteurs humains et les protocoles traduits en utilisant les traducteurs automatiques gratuits que l'on trouve sur l'Internet (Systran, WorldLingo et Babelfish Translation). De cette façon, nous avons détecté quelques problèmes spécifiques à ces langues et nous avons exploré des solutions envisageables : les langues humaines étant criblées d'ambiguïtés, cette recherche propose aussi la conception et le développement d'une langue controlée, en tant que support technique permettant de réduire la complexité des analyses linguistiques et accroître la qualité de la traduction par la machine. Nous avons créé des instructions détaillées d'écriture sous forme, elles-mêmes, d'un protocole afin de permettre aux auteurs des protocoles médicaux de composer des phrases plus claires et relativement plus simples, qui pourraient faciliter à la machine le traitement des phrases d'entrée et aller ainsi vers une traduction fiable
This research is based on a lingusitic study to design an English-Chinese machine translation system to be applied in two sub-medical domains : echinococcosis and molecular cloning. By means of a detailled contrastive analysis, we focused on analysing the lexical, syntactic and semantic differences and the discrepancies prevalent between these two languages and which are frequently the cause of mistranslation by the machine. We compared the medical protocols translated by human translators with the protocols which were translated using the free MT systems on Internet (Systran, WordlLingo and Babelfish Translation). Some language-specific problems were thus detected and feasible solutions were explored. Therefore this research focused on designing and developing a controlled language (CL) as a supporting technique to reduce the complexity of linguistic analysis and to enhance the translation quality of the machine. While designing the CL, we also take into account the possibility of a future application of this technique in a multilingual environment. Moreover, detailed writing guidelines were designed in the form of a protocol to enable the authors of the medical protocols to compose clerer and relatively simpler sentences which would facilitate the machine to process the input sentences and thus obtain good translations
APA, Harvard, Vancouver, ISO, and other styles
14

You, Eun Soon. "Le Traitement des unités lexicales polysémiques (l'adjectif et le verbe) : vers un système de traduction automatique." Besançon, 2007. http://www.theses.fr/2007BESA1014.

Full text
Abstract:
Notre thèse se donne comme objectif le traitement de l’adjectif polysémique applicable au domaine du traitement automatique des langues(TAL) et plus particulièrement à la traduction automatique (TA) (français-coréen). La variabilité du sens des lexiques boursiers génère plusieurs interprétations sémantiques différentes et donc plusieurs traductions. Pour résoudre ce genre de problèmes dans le cadre du TAL, nous proposons un modèle de désambiguïsation en mettant en œuvre des informations co-textuelles et plus particulièrement le nom. Ce dernier constitue un syntagme nominal en se combinant avec un adjectif et permet de lever l’ambiguïté sémantique de l’adjectif et déterminer son sens adéquat. Les indices co-textuels sur lesquels nous nous appuyons sont les suivants : l’ordre syntaxique de l’adjectif, la propriété du nom et la classe sémantique à laquelle le nom appartient. Notre travail consiste à attribuer à chacun des adjectifs polysémiques sélectionnés les informations co-textuelles ci-dessus pour que la machine puisse trouver leur sens correct. La méthodologie proposée est généralisable à d’autres parties du discours, nous l’avons nous-même appliquée au verbe et à son co-texte, le nom
Our thesis has for objective the processing of the polysemic adjective applicable to the domain of Natural Language Processing (NLP) and particularly to automatic translation (French-Korean). The various meaning of the lexicon used in the stock market generates several different semantic interpretations and therefore several translations. To resolve this problem in NLP, we propose a disambiguisation model making use of co-textual information and more particularly the noun. The latter forms a noun clause with the adjective thus allowing one to remove the semantic ambiguity of the adjective and determine its correct meaning. The co-textual hints that we have used are the following: the syntactic order of the adjective, the property of the noun and the semantic class to which the noun belongs. Our work consists in attributing to each polysemic adjective selected the co-textual information mentioned above so that the machine can find its correct meaning. The methodology can be generalized to other parts of speech, we have already applied it to the verb and its co-text, the noun
APA, Harvard, Vancouver, ISO, and other styles
15

Ramavonirina, Oliva Rahantamalala. "Langage juridique et processus de développement : le cas de Madagascar." Paris, INALCO, 2011. http://www.theses.fr/2011INAL0021.

Full text
Abstract:
Langue très technique, archaïque, utilisant des termes et des phraséologismes produits· dans un moule de pensée venu d'ailleurs par la force de l'Histoire, le langage juridiquemalgache reste difficile d'accès pour le justiciable pour qui il a été élaboré. En conséquence, il n'est pas rare que les décisions de justice soient mal exécutées ou pas dutout par leurs destinataires qui n'en comprennent pas la teneur. Il en découle de graves préjudices pour le justiciable dont la seule faute est de ne comprendre ni le français juridique construit sur un moule de pensée qui lui est étranger, ni le malgache juridique officiel calqué sur le français juridique, arborant une structure logique aux antipodes de son mode de raisonnement. Ce travail vise donc à apporter une contribution, d'une part, à la modernisation des termes archaïques encore véhiculés par le malgache juridique, et d'autre part, à la restructuration des textes de jugement, pour les rendre conformes aux processus de raisonnement des Malgaches. Ainsi, le malgache juridique sera beaucoup plus compréhensible pour le justiciable qui sera alors réconcilié avec la justice, laquelle pourra mieux son rôle de régulateur social pour un développement durable et intégral de l'homme
As a very technical and old fashion language that makes use of terms and phrases drawn from a foreign mind frame by the craft of History, the Malagasy law speech is hardly accessible to the population, though it has been intended to him. Consequently, it is not rare that justice decisions are barely executed, or even not at all, by the receivers who just do not understand what they are supposed to do. Hence, very serious prejudices come up for him/her whose sole guilt is not to understand neither French law speech due to amadel of thought that is far away from his own, nor official Malagasy law speech mould on the French madel with a thematic structure based on a logic system which is at the straight opposite of his/her way of thinking. This work is a contribution to modernize some old fashion terms still found in the Malagasy law speech on one hand, and on the other hand to modify the structure of the justice decision texts in order to fit Malagasy people's own mind frame. This should hopefully make Malagasy law speech much more understandable for the people, and by this way, to improve their relationship with Justice, so that the institution to fully play its role of a social regulator leading to a sustainable and integral human development
APA, Harvard, Vancouver, ISO, and other styles
16

Cennamo, Ilaria. "Enseigner la traduction humaine en s'inspirant de la traduction automatique." Thesis, Brest, 2015. http://www.theses.fr/2015BRES0021/document.

Full text
Abstract:
Notre projet de recherche concerne l’étude de l’interaction homme-machine (H-M) en situation d’enseignement/apprentissage de la traduction de l’italien au français.Notre thèse est centrée notamment sur l’analyse de l’utilité pédagogique issue de l’intégration d’un traducteur automatique basé sur des règles dans un contexte d’apprentissage de la traduction de niveau Master, auprès de l’université de Gênes.Existerait-il une possibilité d’interaction entre la pensée traductionnelle humaine et la pensée traductionnelle machine qui puisse s’avérer efficace dans un contexte de pédagogie de la traduction ?Notre projet de recherche vise à répondre à cette question à travers la mise en place d’une expérimentation pédagogique qui s’appuie sur l’interaction entre l’apprenti traducteur humain et le système Apertium.L’hypothèse émise est qu’une telle interaction entre l’apprenti humain et notre prototype de traducteur automatique puisse favoriser la réflexion méta-traductionnelle chez l’apprenti humain, en encourageant sa prise de conscience des nombreux facteurs impliqués dans l’activité traduisante, et en contribuant à son apprentissage de la traduction au niveau de la systématisation de ses connaissances traductionnelles
Our project aims at studying human-machine (H-M) interaction in the context of Italian to French translation teaching and learning, at a master degree level in translation and interpretation. More precisely, our focus is on the pedagogical usefulness of such a H-M interaction having been put in place thanks to the integration of a rule-based machine translator, namely the system Apertium , in a prototypical version.Can this interaction between machine translation and human translation strategies represent a useful pedagogical tool for translation training? Our hypothesis is that H-M interaction taking place between human translation learners and our machine translation prototype can encourage learners’ meta-translational reflection. This process would help them in becoming aware of all the factors implied in translating, and would allow the systematisation of their translation knowledge
APA, Harvard, Vancouver, ISO, and other styles
17

Badia, Toni. "Aspectes del sintagma nominal en català des de la perspectiva de la traducció automàtica /." Montserrat : Abadia de Montserrat, 1994. http://catalogue.bnf.fr/ark:/12148/cb357951358.

Full text
APA, Harvard, Vancouver, ISO, and other styles
18

Pétry, Jean-Luc. "Le pronom "il" en traduction assistée par ordinateur : étude théorique." Metz, 1996. http://docnum.univ-lorraine.fr/prive/UPVM_T_1996_Petry_Jean_Luc_LMZ9609.pdf.

Full text
Abstract:
Le but de notre recherche en linguistique porte sur l'analyse du pronom "il" en langue française et sur la recherche de son antécédent. Pour effectuer cette recherche, nous sommes imposés la nécessité de la formaliser dans une perspective de traduction assistée par ordinateur (T. A. O. ). Il ne s'agit donc pas d'un traité sur l'anaphore, bien que cette notion soit au coeur de l'étude. Notre travail concerne essentiellement la première phase de la T. A. O. : l'analyse ; nous considérons l'impersonnel "il" et le calcul de son antécédent à l'intérieur d'un corpus composé d'oeuvre littéraire : Les mots de Jean-Paul Sartre et d'un rapport administratif de la C. E. E. : Esprit ; l'angle d'étude est donc théorique. Notre interrogation porte en effet sur la possibilité de construire une grammaire de type logique et modulaire ainsi qu'un dictionnaire, utilisables par une intelligence artificielle dans le repérage automatique de cet antécédent. Cette réflexion a exclu l'intuition dont la T. A. O. S'accommode très mal. L'utilisation d'une connaissance du monde a, quant à elle, été exploitée. La validation de ces opérations n'a été faite que si la formalisation était possible. Le cadre de cette étude concerne donc le dialogue homme/machine. A l'issue de cette étude il apparaît que l'impersonnel "il" a pu être identifié dans 96% des cas ; l'antécédent du pronom "il" a pu être reconnu dans 95,52% des occurences étudiées. L'analyse quantitative ainsi que la représentation des connaissances en pragmatique, et l'utilisation de grammaires d'unification, de la D. R. S. , de la D. R. T. Et des fonctions lexicales ont apporté des solutions intéressantes, lors de la recherche de l'antécédent des 5% de cas ambigus. Enfin, la suite logique et passsionnante de cette étude théorique du calcul de la nature du morphème "il" et des antécédents du pronom personnel, serait bien entendu la phase d'implémentation des données que nous avons recueillies ; celle-ci pourrait donner lieu à une simulation consécutive à la rédaction du programme. L'emploi de l'outil informatique permettrait de vérifier la vigueur des modèles proposés
The object of our research in linguistics was basically the identification process of the referent of french personal pronoun il. The process calls for a formalisation procedure in the perspective of computer-aided translation (CAT) systems. Consequently, this research is not a study on anaphora, even if this concept remains central to the investigation. The study refers essentially to the first stage of the CAT procedures : analysis. We examined il successively as an impersonal and personal pronoun, and tried to identify or rather "calculate" the right antecedent. The corpora used for experimentation were of two types : literary (Les mots by Jean-Paul Sartre) and legal / technical (Esprit Report published by the EEC Commission). The research is therefore primarily theoritical. The point was to investigate the possibility of elborating a grammar of logic or modular type, and a dictionnary or data base that could be used at a later stage by an expert system designed to identify automatically the right antecedent. The process had to leave no room to intuitive procedures that cannot be supported by CAT systems in current state-of-the-art conditions. As a consequence, operations can be validated only if formalisation is possible. However, some amount of knowledge can be integrated into the process. In short, the study can be considered as a contribution to some of the issues involved in the man-machine dialogue issue. The application of the model provided following results : il is properly identified as an impersonal pronoun in 96% cases and the antecedent of the personal pronoun is recognised in 95. 52 occurences. Various methods including quantitative analysis, knowledge representation in pragmatics, application of unification-based grammars, Discourse Representation Theory (DRT), lexical functions, pointed at interesting solutions to solve the remaining 5% ambiguous cases. The obvious follow-up to this study would consist in the writing of a program and an implementation of the data collected to check on the valididity of the results mentioned above
APA, Harvard, Vancouver, ISO, and other styles
19

Khruathong, Sombat. "Vers une analyse micro-systémique en vue d'une traduction automatique thaï-français : application aux verbes sériels." Besançon, 2007. http://www.theses.fr/2007BESA1004.

Full text
Abstract:
La thèse intitulée « vers une analyse micro-systémique en vue d’une traduction automatique thaï-français : application aux verbes sériels », s’articule en 6 chapitres : Le premier présente les approches linguistiques et informatiques utilisées dansle domaine du traitement automatique du langage. Le deuxième aborde les caractéristiques de la langue thaïe par rapport aufrançais, les problèmes généraux de traduction thaï-français, ainsi que les modèles d’analyse du syntagme nominal du thaï. Le troisième concerne un essai d’analyse des syntagmes adjectivaux et adverbiaux du thaï. Le quatrième est consacré à notre analyse en vue d’élaborer notre modèle pour le traitement automatique des verbes sériels. L’hypothèse est née de nos réflexionssuccessives sur les problèmes généraux de notre langue maternelle, le thaï, notamment en ce qui concerne le traitement automatique des langues. Nous avons constaté que les verbes sériels jouent un rôle particulier non seulement dans la formation lexicale, mais aussi dans l’ordre syntaxique de la phrase. Nul n’est besoin de dire combien ilspourraient faire obstacle à l’interprétation du sens, s’ils étaient mal analysés. Sur le plan quantitatif, les verbes sériels en thaï ne sont pas nombreux. Pourtant, en emploi pré ou post verbal et nominal, voire au niveau de la phrase, nous trouvons qu’ils occupent une place particulière qui mérite d’être étudiée. Le cinquième chapitre applique les résultats des chapitres 3 et 4 pour la réalisation d’un système de traduction thaï-français en « mode interactif » : nous démontrons que de telles analyses pour une traduction automatique peuvent être mieux développées en mode interactif car ainsi sont mis en évidence les problèmes qui relèvent de la différence de deux langues éloignées tant dans la formation lexicale que syntaxique. Dans notre conclusion, nous soulignons qu’un système de traduction automatique thaï-français pourrait avoir de nombreuses applications notamment dans le cadre de l’enseignement du français pour le public thaï ou l’enseignement du thaï pour le public francophone
This thesis, "Towards a Micro-Systemic Parsing for a Thai-French Machine Translation: Application to the Serial Verbs", is divided into 6 chapters : Chapter one presents the linguistic and data-processing approaches used in the field of computational linguistics. Chapter two explains the characteristics of the Thai language compared to the French language, the general problems of Thai-French translation, as well as the parsing models of noun phrases in Thai. Chapter three is concerned with trying to parse adjectival and adverbial syntagms of Thai. Chapter four is devoted to the parsing models for Thai serial verbs. The hypothesis there presented is the result of successive observations on the general problems of our mother tongue, the Thai language, in particular with regard to natural language processing. This has enabled us to observe that Thai serial verbs play a particular role not only in lexical formation, but also in the syntactic order of the sentence. It is not necessary to say how much the interpretation of the meaning would be obstructed if these verbs were badly analyzed. Quantitatively, Thai serial verbs are not numerous. However, in their pre or post verbal and nominal employment, even at the level of the sentence, the research outcome shows that they play a particular role which deserves to be studied. Chapter five applies the results of chapters 3 and 4 to the implementation of a Thai-French machine translation system in "interactive mode"; we believe that such analysis models for machine translation can be better developed in interactive mode because the problems, which concern the difference of the two distant languages as well as in the lexical formation in syntax, are thereby highlighted. In conclusion, we wish to underline that a Thai-French machine translation system could have many applications in particular in the area of Teaching of French as a Foreign Language for the Thai public or Teaching of Thai as a Foreign Language for French speaking countries
APA, Harvard, Vancouver, ISO, and other styles
20

Thollard, Franck. "Inférence grammaticale probabiliste pour l'apprentissage de la syntaxe en traitement de la langue naturelle." Saint-Etienne, 2000. http://www.theses.fr/2000STET4010.

Full text
Abstract:
L'objectif de la thèse consiste à utiliser les langages formels pour modéliser la langue naturelle. Les techniques utilisées en reconnaissance de la langue naturelle estiment la probabilité d'un mot étant donnée son contexte. En raison de l'information structurelle qu'elle contiennent, les grammaires formelles semblent bien adaptées à cette tâche. Nous étudions les automates déterministes et probabilistes (PDFA). Une théorie formelle de ces objets est proposée. Nous montrons par ailleurs que les automates probabilistes peuvent être appris dans un cadre d'apprentissage dérivé de l'identification à la limite proposé par Gold. Nous proposons ensuite un nouvel algorithme (MDI) basé sur un calcul efficace de la divergence de Kullback-Leibler entre automates. L'algorithme MDI cherche à inférer un PDFA compromis entre la divergence par rapport aux données d'apprentissage et une petite taille. Une étude expérimentale montre que l'algorithme MDI améliore significativement le pouvoir de prédiction de l'algorithme de référence du domaine : ALERGIA. Ces expérimentations montrent par ailleurs l'importance du lissage lors de la modélisation de la langue naturelle
APA, Harvard, Vancouver, ISO, and other styles
21

Losson, Olivier Toulotte Jean-Marc. "Modélisation du geste communicatif et réalisation d'un signeur virtuel de phrases en langue des signes française." [S.l.] : [s.n.], 2000. http://www.univ-lille1.fr/bustl-grisemine/pdf/extheses/50376-2000-13-14.

Full text
APA, Harvard, Vancouver, ISO, and other styles
22

Baldo, Sabrina. "Représentation des valeurs sémantiques de l'auxiliaire modal would en anglais : étude linguistique et système d'exploration contextuelle en vue du traitement informatique de sa traduction automatique en français." Paris 4, 2000. http://www.theses.fr/2000PA040221.

Full text
Abstract:
Le sujet de mon doctorat « représentation des valeurs sémantiques de l'auxiliaire modal would en anglais : étude linguistique et système d'exploration contextuelle en vue du traitement informatique de sa traduction automatique en français » se situe à la charnière de diverses disciplines : - la linguistique théorique avec l'analyse du modal would et de sa traduction en français ; - la linguistique appliquée à l'informatique avec la méthode d'exploration contextuelle ; - la traduction automatique unilatérale : de l'anglais vers le français. Ce travail s'articule en deux parties : d'abord une description linguistique où les valeurs sémantiques de would sont étudiées (translatif, hypothétique, volitif et autres). Cette première partie fait le bilan sur la polysémie des traductions possibles de would en français ainsi que sur sa valeur invariante. Ensuite, une partie de mise en application de l'exploration contextuelle pour la traduction automatique de would. La méthodologie de l'exploration contextuelle intègre linguistique, formalisation / informatique et aspects cognitifs du langage. Elle a été élaborée en plusieurs étapes : le repérage des indices linguistiques pertinents pour chaque valeur sémantique de would à partir de l'étude empirique d'un corpus, l'élaboration de plus de cent règles heuristiques et l'organisation hiérarchisée de l'ensemble sous la forme d'un système à base de connaissances. L'objectif de cette étude est de permettre la création d'un système expert apte à déduire la valeur sémantique de n'importe quelle occurrence du modal would en vue de sa traduction automatique.
APA, Harvard, Vancouver, ISO, and other styles
23

Limame, Dalila. "Vers un système de traduction des expressions polysémiques : le système S.T.E.P. : modèle français [vers] italien, anglais." Besançon, 2002. http://www.theses.fr/2002BESA1004.

Full text
Abstract:
Ce travail présente un modèle théorique pour la traduction automatique des expressions polysémiques. Les expressions polysémiques sont un problème majeur pour les apprenants d'une langue étrangère mais également pour la machine à traduire car elles peuvent prétendre à plusieurs lectures (littérale ou idiomatique). La traduction automatique d'un texte suppose la reconnaissance de celui-ci en vue d'accéder au stade supérieur : celui de la génération. Toute langue possède ses propres expressions. Ainsi pour traduire une expression d'une langue source à une langue cible, il est indispensable de la soumettre au préalable aux différents stades d'analyse linguistique. L'observation des structures lexico-syntaxiques effectuée par des manipulations transformationnelles et distributionnelles
APA, Harvard, Vancouver, ISO, and other styles
24

Ledouble, Hélène. "Contribution à la traduction de documents économiques anglais : importance de l'extraction et de la représentation du sens : thèse." Nice, 2002. http://www.theses.fr/2002NICE2021.

Full text
Abstract:
Face à la prédominance de la langue anglaise dans la communication internationale, le développement d'outils d'aide à la traduction est fondamental. L'objet de la thèse est de montrer l'apport de la traduction à base de connaissances pour accroître l'efficacité de tels outils. Cette approche est fondée sur la compréhension d'une information préalable à sa traduction, exigeant la construction et la représentation du sens avant toute reformulation en langue cible. Après avoir défini les connaissances requises pour cette compréhension (connaissance interlinguistiques et intralinguistiques ), nous les identifions à partir d'un corpus de documents économiques anglais. Nous insistons sur la nécessaire combinaison de ces connaissances dans l'analyse syntactico-sémantique d'une information et sa représentation à l'aide des graphes conceptuels. Nous montrons enfin l'adéquation de la structure conceptuelle à la reformulation de l'information dans un contexte bilingue ou multilingue
In view of the predominant use of the English language in the international communication, the development of translation aids has become a fundamental issue. In this project, we present the advantages of knowledge-based machine translation in the constitution of translation aids. This translation principle aims at extracting and representing the meaning of information in the source language as a preliminary step to reformulation this meaning in a target language. After defining knowledge that is required for interpreting the meaning of information (interlinguistic and intralinguistic knowledge), we identify it in a corpus of economic documents. In our syntactico-semantic approach, we emphasize the necessary combination of inter and intralinguistic knowledge for source language analysis. The meaning of information is then modelled into a conceptual graph structure, thus enabling the reformulation of information in a target language, in a bilingual or multilingual context
APA, Harvard, Vancouver, ISO, and other styles
25

Hadj, salah Marwa. "Désambiguïsation lexicale de l'arabe pour et par la traduction automatique." Thesis, Université Grenoble Alpes (ComUE), 2018. http://www.theses.fr/2018GREAM089/document.

Full text
Abstract:
Nous abordons dans cette thèse une étude sur la tâche de la désambiguïsation lexicale qui est une tâche centrale pour le traitement automatique des langues, et qui peut améliorer plusieurs applications telles que la traduction automatique ou l'extraction d'informations. Les recherches en désambiguïsation lexicale concernent principalement l'anglais, car la majorité des autres langues manque d'une référence lexicale standard pour l'annotation des corpus, et manque aussi de corpus annotés en sens pour l'évaluation, et plus important pour la construction des systèmes de désambiguïsation lexicale. En anglais, la base de données lexicale wordnet est une norme de-facto de longue date utilisée dans la plupart des corpus annotés et dans la plupart des campagnes d'évaluation.Notre contribution porte sur plusieurs axes: dans un premier temps, nous présentons une méthode pour la création automatique de corpus annotés en sens pour n'importe quelle langue, en tirant parti de la grande quantité de corpus anglais annotés en sens wordnet, et en utilisant un système de traduction automatique. Cette méthode est appliquée sur la langue arabe et est évaluée sur le seul corpus arabe, qui à notre connaissance, soit annoté manuellement en sens wordnet: l'OntoNotes 5.0 arabe que nous avons enrichi semi-automatiquement. Son évaluation est réalisée grâce à la mise en œuvre de deux systèmes supervisés (SVM, LSTM) qui sont entraînés sur les corpus produits avec notre méthode.Grâce ce travail, nous proposons ainsi une base de référence solide pour l'évaluation des futurs systèmes de désambiguïsation lexicale de l’arabe, en plus des corpus arabes annotés en sens que nous fournissons en tant que ressource librement disponible.Dans un second temps, nous proposons une évaluation in vivo de notre système de désambiguïsation de l’arabe en mesurant sa contribution à la performance de la tâche de traduction automatique
This thesis concerns a study of Word Sense Disambiguation (WSD), which is a central task in natural language processing and that can improve applications such as machine translation or information extraction. Researches in word sense disambiguation predominantly concern the English language, because the majority of other languages lacks a standard lexical reference for the annotation of corpora, and also lacks sense annotated corpora for the evaluation, and more importantly for the construction of word sense disambiguation systems. In English, the lexical database wordnet is a long-standing de-facto standard used in most sense annotated corpora and in most WSD evaluation campaigns.Our contribution to this thesis focuses on several areas:first of all, we present a method for the automatic creation of sense annotated corpora for any language, by taking advantage of the large amount of wordnet sense annotated English corpora, and by using a machine translation system. This method is applied on Arabic and is evaluated, to our knowledge, on the only Arabic manually sense annotated corpus with wordnet: the Arabic OntoNotes 5.0, which we have semi-automatically enriched.Its evaluation is performed thanks to an implementation of two supervised word sense disambiguation systems that are trained on the corpora produced using our method. We hence propose a solid baseline for the evaluation of future Arabic word sense disambiguation systems, in addition to sense annotated Arabic corpora that we provide as a freely available resource.Secondly, we propose an in vivo evaluation of our Arabic word sense disambiguation system by measuring its contribution to the performance of the machine translation task
APA, Harvard, Vancouver, ISO, and other styles
26

Gouirand, Olivier. "Méthodologie de l'évaluation de la traduction assistée par ordinateur : application au traducteur professionnel en français-anglais et vice versa." Toulouse 2, 2005. http://www.theses.fr/2005TOU20069.

Full text
Abstract:
Cette recherche a pour objectif de jeter les bases d'une évaluation essentiellement linguistique de la traduction assistée par ordinateur, restreinte à l'usage que peuvent en faire les traducteurs professionnels indépendants sur les paires de langues français-anglais. Au-delà de la définition de la spécificité de ces derniers, jamais effectuée auparavant, ainsi que l'étude critique et systématique des nombreuses approches de l'évaluation, a été menée une expérience d'analyse de corpus ayant permis de confirmer l'étroite dépendance de la sémantique et de la syntaxe, celle-ci répondant à une distribution catégorielle proche de la loi sur les chiffres significatifs. Les invariants obtenus par voie statistique ont ensuite été rapprochés de primitives syntaxiques et conceptuelles d'inspiration continuiste et connexionniste pour former un système d'analyse dynamique de la qualité linguistique en traduction automatique dont la finalité ultime est de l'aider à dépasser la barrière du sens
This research aims at laying the foundations of an essentially linguistic evaluation of computer-aided translation limited to its use by independent translators on French-English language pairs. More than defining the specificities of the former - which had never been done before - and carrying out a critical and systematic study of the numerous approaches to evaluation, an experiment was conducted on corpora, confirming the tight dependency of semantics and syntax, the latter matching a categorial distribution close to the law on anomalous numbers. The invariants obtained in a statistical fashion were then compared to syntactic and conceptual primitives in the continuity and connexionist paradigm in view to forming a dynamic analysis system for linguistic quality in machine translation, the aim of which is helping it to break the semantic barrier
APA, Harvard, Vancouver, ISO, and other styles
27

Thomas, Izabella. "Vers un modèle d'interprétation du groupe Adjectif Nom/Nom Adjectif en vue de la traduction automatique : application du français vers le polonais." Besançon, 2002. http://www.theses.fr/2002BESA1034.

Full text
Abstract:
Cette thèse se donne comme objectif le traitement de la sémantique des adjectifs en vue de créer un système de traduction automatique. Elle propose un modèle d'interprétation et de désambigui͏̈sation de la sémantique des adjectifs dans la langue source (le Français), qui permet de trouver l'équivalent de l'adjectif dans la langue cible (le Polonais) sur la base d'une représentation intermédiaire relationnelle, indépendante de la langue. La recherche entreprise répond à trois objectifs généraux : (1) comprendre comment se construit la compatibilité sémantique à l'intérieur d'un syntagme nominal (à l'aide de notions de propriété, polysémie, multi-facialité, relation indirecte ; (2) trouver des règles générales de prédiction du sens d'un adjectif dans un groupe nominal (règles de base et règles de corrélation) ; (3) finalement, modéliser les résultats obtenus afin de construire un système formel (sous la forme d'un algorithme modulaire divisé en configuration et cas).
APA, Harvard, Vancouver, ISO, and other styles
28

Do, Thi Ngoc Diep. "Extraction de corpus parallèle pour la traduction automatique depuis et vers une langue peu dotée." Phd thesis, Université de Grenoble, 2011. http://tel.archives-ouvertes.fr/tel-00680046.

Full text
Abstract:
Les systèmes de traduction automatique obtiennent aujourd'hui de bons résultats sur certains couples de langues comme anglais - français, anglais - chinois, anglais - espagnol, etc. Les approches de traduction empiriques, particulièrement l'approche de traduction automatique probabiliste, nous permettent de construire rapidement un système de traduction si des corpus de données adéquats sont disponibles. En effet, la traduction automatique probabiliste est fondée sur l'apprentissage de modèles à partir de grands corpus parallèles bilingues pour les langues source et cible. Toutefois, la recherche sur la traduction automatique pour des paires de langues dites "peu dotés" doit faire face au défi du manque de données. Nous avons ainsi abordé le problème d'acquisition d'un grand corpus de textes bilingues parallèles pour construire le système de traduction automatique probabiliste. L'originalité de notre travail réside dans le fait que nous nous concentrons sur les langues peu dotées, où des corpus de textes bilingues parallèles sont inexistants dans la plupart des cas. Ce manuscrit présente notre méthodologie d'extraction d'un corpus d'apprentissage parallèle à partir d'un corpus comparable, une ressource de données plus riche et diversifiée sur l'Internet. Nous proposons trois méthodes d'extraction. La première méthode suit l'approche de recherche classique qui utilise des caractéristiques générales des documents ainsi que des informations lexicales du document pour extraire à la fois les documents comparables et les phrases parallèles. Cependant, cette méthode requiert des données supplémentaires sur la paire de langues. La deuxième méthode est une méthode entièrement non supervisée qui ne requiert aucune donnée supplémentaire à l'entrée, et peut être appliquée pour n'importe quelle paires de langues, même des paires de langues peu dotées. La dernière méthode est une extension de la deuxième méthode qui utilise une troisième langue, pour améliorer les processus d'extraction de deux paires de langues. Les méthodes proposées sont validées par des expériences appliquées sur la langue peu dotée vietnamienne et les langues française et anglaise.
APA, Harvard, Vancouver, ISO, and other styles
29

Jaozandry, Marie. "Les prédicats nominaux du Malgache : étude comparative avec le français." Thesis, Paris 13, 2014. http://www.theses.fr/2014PA131005/document.

Full text
Abstract:
Cette thèse s’inscrit dans le cadre des travaux sur la description des prédicats nominaux du LDI (Lexiques, Dictionnaire, Informatique), un laboratoire de l’Université Paris 13. Nous étudions les constructions prédicatives du malgache en les comparant à celles du français, langue pour laquelle on a mis au point une méthodologie adéquate à la description de ces structures. Le premier chapitre présente les outils descriptifs utilisés ainsi qu’une vue générale de la langue malgache. Le deuxième chapitre offre une vue d’ensemble des recherches faites sur les verbes supports, à la fois en français et en malgache, en insistant en particulier sur l’importance de la détermination nominale. Le choix des bverbes supports dépend de la nature des prédicats nominaux qui sont subdivisés selon qu’ils dénotent des actions, des états ou des événements. Ce classement est repris au troisième chapitre (prédicats d’actions), au quatrième chapitre (prédicats d’états) et au cinquième chapitre (prédicats d’événements). Dans chacun de ces chapitres, sont décrits avec précision quelques substantifs prototypes selon des critères constants et syntaxiquement fondés. On met ainsi en évidence le fait que les verbes supports ne sont qu’un des éléments de l’actualisation des prédicats nominaux, parallèlement aux déterminants et à certains adjectifs ou adverbes aspectuels. Cette thèse fournit un cadre à une future étude plus complète des prédicats nominaux du malgache
AThis thesis is part of the work of L.D.I (Lexiques, Dictionnaire, Informatique) of the University of Paris 13 on the description of the nominal predicates. We study the predicative constructions of the Malagasy by comparing them with those of the French, the language for which was proposed the development of a methodology appropriate to the description of its structures. The first chapter presents the descriptive tools and a short description of the Malagasy language. The second chapter provides an overview of the research done on «verbs supports», both in French and Malagasy, with particular emphasis on the importance of nominal determination. The choice of «verbes supports» depends on the nature of the nominal predicates which are thus divided into three classes : actions, states and events. This classification specified in the third chapter (predicates of actions), in the fourth chapter (predicates of states) and in the fifth chapter (event predicates). In each chapter, some accuracy substantives prototypes were described, according to consistent criteria which are syntactically based. It thus highlights that «verbs supports» are only one part of discounting nominal predicates, along with determination and aspectual adverbs or adjectives. This thesis provides a framework for a future more comprehensive study of the Malagasy nominal predicates
APA, Harvard, Vancouver, ISO, and other styles
30

Jin, Gan. "Système de traduction automatique français-chinois dans le domaine de la sécurité globale." Thesis, Besançon, 2015. http://www.theses.fr/2015BESA1006.

Full text
Abstract:
Dans ce mémoire, nous présentons outre les résultats de recherche en vue d’un système de traduction automatique français–chinois, les apports théoriques à partir de la théorie SyGULAC et de la théorie micro-systémique avec ses calculs ainsi que les méthodologies élaborées tendant à une application sure et fiable dans le cadre de la traduction automatique. L’application porte sur des domaines de sécurité critique tels que l’aéronautique, la médecine, la sécurité civile. Tout d’abord un état de l’art du domaine de la traduction automatique, en Chine et en France, est utile pour commencer la lecture. Les faiblesses des systèmes actuels à travers des tests que nous réalisons prouvent l’intérêt de cette recherche. Nous donnons les raisons pour lesquelles nous avons choisi la théorie micro-systémique et la théorie SyGULAC. Nous expliquons ensuite les problématiques rencontrées au cours de notre recherche. L’ambigüité, obstacle majeur pour la compréhensibilité et la traductibilité d’un texte, se situe à tous les niveaux de la langue : syntaxique, morphologique, lexical, nominal ou encore verbal. L’identification des unités d’une phrase est aussi une étape préalable à la compréhension globale, que cela soit pour un être humain ou un système de traduction. Nous dressons un état des lieux de la divergence entre la langue française et la langue chinoise en vue de réaliser un système de traduction automatique. Nous essayons d’observer la structure aux niveaux verbal, nominal et lexical, de comprendre leurs liens et leurs interactions. Egalement nous définissons les obstacles sources d’entrave à la réalisation de cette recherche, avec un point de vue théorique mais aussi en étudiant notre corpus concret. Le formalisme pour lequel nous avons opté part d’une étude approfondie de la langue utilisée dans les protocoles de sécurité. Une langue ne se prête au traitement automatique que si elle est formalisée. De ce fait, nous avons procédé à l’analyse de plusieurs corpus bilingues français/chinois mais aussi monolingues émanant d’organismes de sécurité civile. Le but est de dégager les particularités linguistiques (lexicales, syntaxiques, …) qui caractérisent la langue de la sécurité en général et de recenser toutes les structures syntaxiques qu’utilise cette langue. Après avoir présenté la formalisation de notre système, nous montrons les processus de reconnaissance, de transfert et de génération
In this paper, in addition to our research results for a French-Chinese machine translation system, we present the theoretical contributions from the SyGULAC theory and from the micro-systemic theory with its calculations as well as the methodologies developed aimed at a secure and reliable application in the context of machine translation. The application covers critical safety areas such as aerospace, medicine and civil security.After presenting the state of the art in the field of machine translation in China and France, the reasons of the choice of the micro-systemic theory and SyGULAC theory are explained. Then, we explain the problems encountered during our research. The ambiguity, which is the major obstacle to the understandability and to the translatability of a text, is present at all language levels: syntactic, morphological, lexical, nominal and verbal. The identification of the units of a sentence is also a preliminary step for global understanding, whether for human beings or for a translation system. We present an inventory of the divergences between the french and the chinese language in order to achieve an machine translation system. We try to observe the verbal, nominal and vocabulary structure levels, in order to understand their interconnections and their interactions. We also define the obstacles to this research, with a theoretical point of view but also by studying our corpus.The chosen formalism starts from a thorough study of the language used in security protocols. A language is suitable for automatic processing only if this language is formalized. Therefore, An analysis of several French/Chinese bilingual corpora, but also monolingual, from civil security agencies, was conducted. The goal is to find out and present the linguistic characteristics (lexical, syntactic ...) which characterize the language of security in general, and to identify all the syntactic structures used by this language. After presenting the formalization of our system, we show the recognition, transfer and generation processes
APA, Harvard, Vancouver, ISO, and other styles
31

Kakoyianni, Doa Fryni. "Adverbes de phrase français et grecs : étude contrastive et perspectives didactiques." Toulouse 2, 2008. http://www.theses.fr/2008TOU20111.

Full text
Abstract:
Le présent travail fait une étude descriptive et comparative des adverbes de phrase français et grecs à partir des adverbes d’énonciation et des adverbes d’énoncé français. Les structures morphosyntaxiques des adverbes d’énonciation et d’énoncé du français et du grec moderne sont d’abord présentées. Puis sont examinés les aspects sémantiques de ces adverbes, distribués en ensembles et sous-ensembles correspondants. Ainsi, les adverbes concernant la disposition psychologique ou morale du locuteur vis-à-vis de l’interlocuteur, les adverbes exprimant un commentaire du locuteur sur la formulation de l’énoncé, les adverbes concernant la source de l’information et les adverbes d’individuation sont les ensembles qui font partie des adverbes d’énonciation ; les adverbes d’habitude, les adverbes évaluatifs, les adverbes modaux et les adverbes d’attitude orientés vers le sujet sont les ensembles faisant partie des adverbes d’énoncé. Les critères et les tests proposés pour le français et appliqués au grec sont sollicités pour identifier ces deux classes d’adverbes de phrase, les regrouper et en étudier plus particulièrement les valeurs sémantiques, les positions ainsi que les différents types de variations morphosyntaxiques possibles. Nous dégageons ainsi de cette étude les caractéristiques communes et les différences entre la langue française et la langue grecque pour ce qui est des adverbes d’énonciation et des adverbes d’énoncé, avant d’esquisser, en conclusion, les perspectives en didactique et en traduction automatique qui en découlent
This contrastive study examines the sentential Greek adverbs in comparison with the French adverbs of enunciation and to the adverbs of statement, for didactic and automatic translation purposes. In this descriptive and comparative study are presented, on the one hand, the morphosyntaxic structures of the adverbs of enunciation and statement in French and modern Greek and, on the other hand, semantic aspects that categorize these adverbs into sets and subsets. The adverbs concerning the psychological or moral perspective of the speaker with respect to the interlocutor, the adverbs expressing a comment of the speaker on the formulation of the statement, the adverbs relating to the source of information and the adverbs of individuation constitute the adverbs of stating, whereas the adverbs of attitude, the evaluation adverbs, the modal adverbs and the subject oriented adverbs of attitude are the groups belonging to the adverbs of statement. The thesis has examined if and to what extent the criteria and the tests valid for French apply to Greek. This was done in order to identify the two classes of adverbs of sentence, to collect and study them especially in their semantic values, their positions as well as the various types of possible morphosyntaxic variations. This study has attempted to underline the common characteristics and the differences between the French and the Greek language as regards the enunciation adverbs and the statement adverbs, before outlining, in conclusion, the possible implications for didactic and automatic translation which result from this work
APA, Harvard, Vancouver, ISO, and other styles
32

Kervajan, Loïc. "Contribution à la traduction automatique Français/Langue des Signes Française (LSF) au moyen de personnages virtuels." Phd thesis, Université de Provence - Aix-Marseille I, 2011. http://tel.archives-ouvertes.fr/tel-00697726.

Full text
Abstract:
Depuis la loi du 11-02-2005 pour l'égalité des droits et des chances, les lieux ouverts au public doivent accueillir les Sourds en Langue des Signes Française (LSF). C'est dans le cadre du développement d'outils technologiques de diffusion de LSF que nous avons travaillé, plus particulièrement au niveau de la traduction automatique du français écrit vers la LSF. Notre thèse commence par un état de l'art relatif aux connaissances sur la LSF (ressources disponibles et supports d'expression de la LSF) avant d'approfondir des notions de grammaire descriptive. Notre hypothèse de travail est la suivant : la LSF est une langue et, à ce titre, la traduction automatique lui est applicable. Nous décrivons ensuite les spécifications linguistiques pour le traitement automatique, en fonction des observations mises en avant dans l'état de l'art et des propositions de nos informateurs. Nous détaillons notre méthodologie et présentons l'avancée de nos travaux autour de la formalisation des données linguistiques à partir des spécificités de la LSF dont certaines (model verbal, modification adjectivale et adverbiale, organisation des substantifs, problématiques de l'accord) ont nécessité un traitement plus approfondi. Nous présentons le cadre applicatif dans lequel nous avons travaillé : les systèmes de traduction automatique et d'animation de personnage virtuel de France Telecom R&D. Puis, après un rapide état de l'art sur les technologies avatar nous décrivons nos modalités de contrôle du moteur de synthèse de geste grâce au format d'échange mis au point. Enfin, nous terminons par nos évaluations et perspectives de recherche et de développements qui pourront suivre cette Thèse. Notre approche a donné ses premiers résultats puisque nous avons atteint notre objectif de faire fonctionner la chaîne complète de traduction : de la saisie d'un énoncé en français jusqu'à la réalisation de l'énoncé correspondant en LSF par un personnage de synthèse.
APA, Harvard, Vancouver, ISO, and other styles
33

Messeri, Anne. "Terminologie juridique pénale et pénitentiaire biblingue français-italien assistée par ordinateur." Nice, 2001. http://www.theses.fr/2001NICE2006.

Full text
Abstract:
Ce corpus comprend un lexique de la terminologie pénale et pénitentiaire, française et italienne, élaboré à l'aide d'un système de gestion de base de données relationnelles. Cette démarche a consisté à replacer la terminologie dans un espace traductionnel, en privilégiant l'outil d'aide à la traduction ou OAT, branche de la traduction assistée par ordinateur ou TAO, qui réserve d'énormes possibilités de développement notamment l'adaptation et l'utilisation pour la traduction automatique. Il a fallu mener une étude comparative des systèmes pénaux français et italien pour appréhender de l'intérieur le langage juridique et tenter d'apporter une réponse à certaines des difficultés de fond que pose la traduction juridique, et qui viennent des disparités des systèmes judiciaires et de la diversité des droits pénaux entre Pays européens.
APA, Harvard, Vancouver, ISO, and other styles
34

Beddar, Mohand. "Vers un prototype de traduction automatique contrôlée français/arabe appliquée aux domaines à sécurité critique." Thesis, Besançon, 2013. http://www.theses.fr/2013BESA1013/document.

Full text
Abstract:
La présente recherche propose un modèle de traduction automatique français-arabe contrôlée appliquée aux domaines à sécurité critique. C’est une recherche transverse qui traite à la fois des langues contrôlées et de la traduction automatique français-arabe, deux concepts intimement liés. Dans une situation de crise où la communication doit jouer pleinement son rôle, et dans une mondialisation croissante où plusieurs langues cohabitent, notre recherche montre que l’association de ces deux concepts est plus que nécessaire. Nul ne peut contester aujourd’hui la place prépondérante qu’occupe la sécurité dans le quotidien des personnes et les enjeux qu’elle représente au sein des sociétés modernes. Ces sociétés davantage complexes et interconnectées manifestent une vulnérabilité flagrante qui les oblige à repenser leurs moyens d’organisation et de protection dont les systèmes de communication. La communication langagière à l’aide de systèmes informatisés est l’une des formes de communication la plus souvent utilisée pour le transfert des connaissances nécessaires à l’accomplissement des tâches et le déroulement des diverses actions. Toutefois, et contrairement à une idée bien ancrée qui tend à associer les risques d’une mauvaise communication à l’oral uniquement, l’usage de la langue écrite peut lui aussi comporter des risques. En effet des messages mal écrits peuvent conduire à de réelles catastrophes et à des conséquences irréversibles notamment dans des domaines jugés sensibles tels que les domaines à sécurité critique. C’est dans ce contexte que s’inscrit notre recherche. Cette thèse est une approche novatrice dans les domaines des langues contrôlées et de la traduction automatique. Elle définit avec précision, en s’appuyant sur une analyse microsystémique de la langue et un travail en intension sur le corpus, des normes pour la rédaction de protocoles de sécurité et d’alertes ainsi que leur traduction automatique vers l’arabe. Elle apporte en effet des notions nouvelles à travers plusieurs procédés normatifs intervenant non seulement dans le processus de contrôle mais également dans le processus de traduction. Le système de traduction automatique français-arabe TACCT (Traduction Automatique Contrôlée Centre Tesnière) mis au point dans cette thèse est un système à base de règles linguistiques qui repose sur un modèle syntaxico-sémantique isomorphique issu des analyses intra- et interlangues entre le français et l’arabe. Il introduit de nouveaux concepts notamment celui des macrostructures miroir contrôlées, où la syntaxe et la sémantique des langues source et cible sont représentées au même niveau
The result of our research is a proposal for a controlled French to Arabic machine translation model, applied to security critical domains. This cross-disciplinary research study covers controlled languages and French to Arabic machine translation, two intimately related concepts. In a situation of crisis where communication must play its full role, and in the context of increasing globalisation where many languages coexist, our research findings show that the combination of these two concepts is sorely needed. No one can deny today the predominant role played by security in people’s daily life and the significant challenges it presents in modern societies. These more and more complex and interconnected societies present evident vulnerabilities that force them to rethink their means of protection and in particular that of their communication systems. Language communication with computerised systems is one of the most widely used forms of communication for the transfer of knowledge required in carrying out and completing tasks and in the good conduct of various activities. However, and contrary to an entrenched idea that tends to associate the risk of poor communication only with oral transmission, the use of written language can also be subject to risk. Indeed, a protocol or an alert which is badly formulated can provoke serious accidents due to misunderstanding, in particular during a crisis and under stress. It is in this context that our research has been undertaken. Our thesis proposes an innovative approach in the fields of controlled language and machine translation in which, relying on a microsystemic analysis of the language and a study of the corpus in intension, precise standards are defined for writing and translating protocols and security alerts written in French automatically into Arabic. Indeed, new concepts are introduced by means of several normative methods involved not only in the controlling process but also in the machine translation process. The French to Arabic machine translation system TACCT (Traduction Automatique Contrôlée Centre Tesnière) developed during our research is a rule-based system based on an isomorphic syntactic and semantic model stemming from intra- and interlanguage analysis between French and Arabic. It introduces new concepts including controlled mirror macrostructures, where the syntax and semantics of the source and target languages are represented at the same level
APA, Harvard, Vancouver, ISO, and other styles
35

Apidianaki, Marianna. "Acquisition automatique de sens pour la désambiguïsation et la sélection lexicale en traduction." Phd thesis, Université Paris-Diderot - Paris VII, 2008. http://tel.archives-ouvertes.fr/tel-00322285.

Full text
Abstract:
Le travail présenté dans cette thèse explore la question de l'acquisition automatique de sens pour la désambiguïsation lexicale dans un cadre de traduction. Partant de l'hypothèse du besoin de conformité des inventaires sémantiques utilisés pour la désambiguïsation dans le cadre d'applications précises, la problématique du repérage des sens se situe dans un cadre bilingue et le traitement s'oriente vers la traduction.
Nous proposons une méthode d'acquisition de sens permettant d'établir des correspondances sémantiques de granularité variable entre les mots de deux langues en relation de traduction. L'induction de sens est effectuée par une combinaison d'informations distributionnelles et traductionnelles extraites d'un corpus bilingue parallèle. La méthode proposée étant à la fois non supervisée et entièrement fondée sur des données, elle est, par conséquent, indépendante de la langue et permet l'élaboration d'inventaires sémantiques relatifs aux domaines représentés dans les corpus traités.
Les résultats de cette méthode sont exploités par une méthode de désambiguïsation lexicale, qui attribue un sens à de nouvelles instances de mots ambigus en contexte, et par une méthode de sélection lexicale, qui propose leur traduction la plus adéquate. On propose finalement une évaluation pondérée des résultats de désambiguïsation et de sélection lexicale, en nous fondant sur l'inventaire construit par la méthode d'acquisition de sens.
APA, Harvard, Vancouver, ISO, and other styles
36

Gosme, Julien. "Énumération exhaustive et détection spécifique des analogies : étude pour les modèles de langue et la traduction automatique." Phd thesis, Université de Caen, 2012. http://tel.archives-ouvertes.fr/tel-00700559.

Full text
Abstract:
Ce travail de thèse s'inscrit dans le cadre de la traduction automatique. En étudiant les fondements de la traduction automatique par l'exemple, et plus particulièrement le système Aleph, nous mettons en évidence le problème de la sélection des exemples. Le système Aleph emploie exclusivement l'analogie afin de produire de nouvelles phrases et de nouvelles traductions. Le problème est de sélectionner les phrases dans un grand corpus d'exemples afin de produire de nouvelles phrases par analogie. Notre premier apport consiste en l'élaboration d'une méthode permettant d'énumérer l'intégralité des analogies entre chaînes d'un texte. Cette méthode nous permet ensuite de mettre en œuvre une étude statistique des analogies les plus fréquentes entre trigrammes de mots et de mettre en évidence les patrons d'analogie les plus fréquents. Ces résultats permettent alors de concevoir une nouvelle méthode de lissage d'un modèle de langue trigramme basé sur un petit nombre d'analogies. Nos expériences montrent que cette méthode est très compétitive vis-à-vis des méthodes classiques.
APA, Harvard, Vancouver, ISO, and other styles
37

Losson, Olivier. "Modélisation du geste communicatif et réalisation d'un signeur virtuel de phrases en langue des signes française." Lille 1, 2000. https://pepite-depot.univ-lille.fr/LIBRE/Th_Num/2000/50376-2000-13-14.pdf.

Full text
Abstract:
Dans le cadre du geste communicatif, la langue des signes francaise (lsf) constitue un sujet d'etude privilegie, par la richesse que lui confere precisement son statut de langue. Notre etude vise a obtenir un systeme de synthese de phrases en lsf a partir d'une representation textuelle intermediaire, dans l'optique d'une traduction globale du francais en signes. Issue des traits linguistiquement pertinents, une grammaire formelle est proposee pour specifier le signe, avec pour principe la decomposition en primitives formationnelles (configurations manuelles, mouvement,). La description hierarchique obtenue inclut des caracteristiques spatio-temporelles (points corporels, symetrie des articulateurs, repetition) ; une etude poussee des profils de vitesse a par ailleurs ete effectuee pour representer finement la dynamique du mouvement. Au niveau du discours interviennent les processus grammaticaux propres aux langues gestuelles : le parametrage des signes permet, outre de decrire des items lexicaux generiques, de prendre en charge les mecanismes de localisation ou de reference pronominale
Afin de marquer le type de clause, l'expressivite non-manuelle - notamment faciale - est de premiere importance. Le systeme a ete integralement implante pour aboutir a l'animation d'un signeur virtuel. L'exigence de configurations naturelles pour les chaines articulaires a necessite le developpement d'un modele realiste pour l'avatar, et de methodes specifiques de cinematique inverse pour l'orientation et le positionnement manuels. L'ensemble, de l'analyseur syntaxique au module de generation graphique tridimensionnelle, constitue un prototype performant d'obtention de phrases signees. Dote d'une interface graphique, il laisse entrevoir (comme le prouve un exemple illustratif) toute une gamme d'applications pour lesquelles la video n'est pas adaptee, tirant principalement profit de la compacite de l'encodage et de la rapidite avec laquelle sont produits les signes
APA, Harvard, Vancouver, ISO, and other styles
38

Laporte, Elena-Mirabela. "La traduction automatique statistique factorisée : une application à la paire de langues français - roumain." Thesis, Strasbourg, 2014. http://www.theses.fr/2014STRAC022/document.

Full text
Abstract:
Un premier objectif de cette thèse est la constitution de ressources linguistiques pour un système de traduction automatique statistique factorisée français - roumain. Un deuxième objectif est l’étude de l’impact des informations linguistiques exploitées dans le processus d’alignement lexical et de traduction. Cette étude est motivée, d’une part, par le manque de systèmes de traduction automatique pour la paire de langues étudiées et, d’autre part, par le nombre important d’erreurs générées par les systèmes de traduction automatique actuels. Les ressources linguistiques requises par ce système sont des corpus parallèles alignés au niveau propositionnel et lexical. Ces corpus sont également segmentés lexicalement, lemmatisés et étiquetés au niveau morphosyntaxique
Our first aim is to build linguistic resources for a French - Romanian factored phrase - based statistical machine translation system. Our second aim is to study the impact of exploited linguistic information in the lexical alignment and translation process. On the one hand, this study is motivated by the lack of such systems for the studied languages. On the other hand, it is motivated by the high number of errors provided by the current machine translation systems. The linguistic resources required by the system are tokenized, lemmatized, tagged, word, and sentence - aligned parallel corpora
APA, Harvard, Vancouver, ISO, and other styles
39

Yan, Yongfeng Peccoud François. "Vers une ingénierie de la production de linguiciels spécification et réalisation d'un prototype de poste de travail linguistique pour la spécification de correspondances structurales /." S.l. : Université Grenoble 1, 2008. http://tel.archives-ouvertes.fr/tel-00325682.

Full text
APA, Harvard, Vancouver, ISO, and other styles
40

Poïarkova, Elena. "L' enseignement assisté par ordinateur de la traduction français-russe." Aix-Marseille 1, 2006. http://www.theses.fr/2006AIX10018.

Full text
Abstract:
L'intégration de la traduction et des outils informatiques dans l'apprentissage des langues vivantes étrangères (LVE) est le sujet abordé dans la présente thèse. L'actualité de la recherche est déterminée par la réhabilitation de la traduction dans l'enseignement des LVE et le rôle croissant que jouent les TIC dans l'enseignement. La méthode proposée vise l'initiation des futurs professeurs de langue à la traduction professionnelle. L'étude pluridisciplinaire des sciences connexes à la didactique des langues, et notamment des théories de la traduction, du TAL, de la linguistique contrastive et des sciences de l'éducation, constitue le fondement théorique de la méthode. L'hypothèse de la recherche expérimentale consiste en une augmentation de la motivation des apprenants et en une meilleure progression en compétence traductionnelle grâce à l'utilisation des TIC. L'analyse statistique et qualitative des données de l'enseignement expérimental confirment en partie cette hypothèse
APA, Harvard, Vancouver, ISO, and other styles
41

Kervajan, LoÏc. "Contribution à la traduction automatique français/langue des signes française (LSF) au moyen de personnages virtuels : Contribution à la génération automatique de la LSF." Thesis, Aix-Marseille 1, 2011. http://www.theses.fr/2011AIX10172.

Full text
Abstract:
Depuis la loi du 11-02-2005 pour l’égalité des droits et des chances, les lieux ouverts au public doivent accueillir les Sourds en Langue des Signes Française (LSF). C’est dans le cadre du développement d’outils technologiques de diffusion de LSF que nous avons travaillé, plus particulièrement au niveau de la traduction automatique du français écrit vers la LSF. Notre thèse commence par un état de l’art relatif aux connaissances sur la LSF (ressources disponibles et supports d’expression de la LSF) avant d’approfondir des notions de grammaire descriptive. Notre hypothèse de travail est la suivant : la LSF est une langue et, à ce titre, la traduction automatique lui est applicable.Nous décrivons ensuite les spécifications linguistiques pour le traitement automatique, en fonction des observations mises en avant dans l’état de l’art et des propositions de nos informateurs. Nous détaillons notre méthodologie et présentons l’avancée de nos travaux autour de la formalisation des données linguistiques à partir des spécificités de la LSF dont certaines (model verbal, modification adjectivale et adverbiale, organisation des substantifs, problématiques de l’accord) ont nécessité un traitement plus approfondi. Nous présentons le cadre applicatif dans lequel nous avons travaillé : les systèmes de traduction automatique et d’animation de personnage virtuel de France Telecom R&D. Puis, après un rapide état de l’art sur les technologies avatar nous décrivons nos modalités de contrôle du moteur de synthèse de geste grâce au format d’échange mis au point. Enfin, nous terminons par nos évaluations et perspectives de recherche et de développements qui pourront suivre cette Thèse.Notre approche a donné ses premiers résultats puisque nous avons atteint notre objectif de faire fonctionner la chaîne complète de traduction : de la saisie d'un énoncé en français jusqu'à la réalisation de l'énoncé correspondant en LSF par un personnage de synthèse
Since the law was voted the 11-02-2005 for equal rights and opportunities: places open to anyone (public places, shops, internet, etc.) should welcome the Deaf in French Sign Language (FSL). We have worked on the development of technological tools to promote LSF, especially in machine translation from written French to FSL.Our thesis begins with a presentation of knowledge on FSL (theoretical resources and ways to edit FSL) and follows by further concepts of descriptive grammar. Our working hypothesis is: FSL is a language and, therefore, machine translation is relevant.We describe the language specifications for automatic processing, based on scientific knowledge and proposals of our native FSL speaker informants. We also expose our methodology, and do present the advancement of our work in the formalization of linguistic data based on the specificities of FSL which certain (verbs scheme, adjective and adverb modification, organization of nouns, agreement patterns) require further analysis.We do present the application framework in which we worked on: the machine translation system and virtual characters animation system of France Telecom R&D.After a short avatar technology presentation, we explain our control modalities of the gesture synthesis engine through the exchange format that we developed.Finally, we conclude with an evaluation, researches and developments perspectives that could follow this thesis.Our approach has produced its first results since we have achieved our goal of running the full translation chain: from the input of a sentence in French to the realization of the corresponding sentence in FSL with a synthetic character
APA, Harvard, Vancouver, ISO, and other styles
42

Falaise, Achille. "Conception et prototypage d'un outil web de médiation et d'aide au dialogue tchaté écrit en langue seconde." Phd thesis, Université Joseph Fourier (Grenoble), 2009. http://tel.archives-ouvertes.fr/tel-00442754.

Full text
Abstract:
Notre thème de recherche général concerne les aides informatisées au dialogue en langue seconde, oral et/ou écrit. Cette thèse se concentre sur la dénition et l'étude, au moyen de corpus et d'un prototype, de procédés d'aide au dialogue écrit (tchat) en langue seconde, dans un contexte de médiation faible. Nous présentons dans un premier temps ce qu'est le tchat "ordinaire" en langue première, ses divergences de surface et ses convergences profondes vis à vis des autres formes d'écrit. Nous montrons ensuite les limites des aides actuelles, à médiation forte, dans laquelle l'outil d'aide est interposé entre des locuteurs supposés totalement incapables de communiquer par un autre biais, de sorte qu'on ne traite jamais le cas pourtant fréquent où ils peuvent utiliser une langue intermédiaire. Nous adaptons au tchat le scénario du projet VerbMobil (1992-2000) et proposons une approche à médiation faible pour locuteurs partiellement bilingues, capable de tenir compte de leurs compétences et de leurs problèmes spéciques. Le prototype développé dans ce cadre, Koinè, permet d'étudier les contraintes informatiques, ergonomiques et linguistiques d'un tel système, de proposer des solutions, et de les expérimenter. Des aides au dialogue oral ont été prévues, mais, comme la reconnaissance vocale du tout venant au téléphone ou sur IP n'est pas encore assez avancée pour ce type d'utilisation, la version actuelle est centrée sur l'écrit. Koinè est un service Web, construit à l'aide de la bibliothèque logicielle Krater, qui accélère et simplifie le développement d'applications Web. Koinè agrège des fonctionnalités utiles pour surmonter les obstacles de la communication en langue non native, telle que tableau blanc, livre de phrases interactif personnalisable, pré- traduction par traduction automatique, mesures d'intelligibilité et de prototypicalité des énoncés, et possibilité de désambiguïsation interactive et participative.
APA, Harvard, Vancouver, ISO, and other styles
43

Fehri, Héla. "Reconnaissance automatique des entités nommées arabes et leur traduction vers le français." Thesis, Besançon, 2012. http://www.theses.fr/2012BESA1031/document.

Full text
Abstract:
La traduction des Entités Nommées (EN) est un axe de recherche d'actualité vu la multitude des documents électroniques échangés à travers Internet. Ainsi, le besoin de traiter ces documents par des outils de TALN est devenu nécessaire et intéressant. La modélisation formelle ou semi formelle de ces EN peut intervenir dans les processus de reconnaissance et de traduction. En effet, elle permet de rendre plus fiable la constitution des ressources linquistiques, de limiter l'impact des spécificités linguistiques ct de faciliter les transformations d'une représentation à une autre. Dans ce contexte, nous proposons un outil de reconnaissance ct de traduction vers le français des EN arabes basé essentiellement sur une représentation formelle et sur un ensemble de transducteurs. L'outil prend en compte l'intégration d'un module de translittération. L'implémentation de cet outil a été effectuée en utilisant la plateforme NooJ. Les résultats obtenus sont satisfaisants
The translation of named entities (NEs) is a current research topic with regard to the proliferation of electronic documents exchanged through the Internet. So, the need to process these documents with NLP tools becomes necessary and interesting. Formal or semi-formal modeling of these NEs may intervene in both processes of recognition and translation. Indeed, it makes the accumulation of linguistic resources more reliable, limits the impact of linguistic specificities and facilitates the transformation from one representation to another. In this context, we propose a tool for the recognition and translation of Arabic NEs into French, based primarily on formal .representation and a set of transducers. This tool takes into account the integration of a module of transliteration. Its implementation was performed using the NooJ platform and the results obtained proved to be satisfactory
APA, Harvard, Vancouver, ISO, and other styles
44

Biloré, Christine. "Analyse phraséologique de documents économiques et financiers russes en vue de la création d'outils d'aide à la traduction." Nice, 2003. http://www.theses.fr/2003NICE2036.

Full text
Abstract:
L'évolution des relations économiques entre la France et la Russie a créé de nouveaux besoins de traduction. Or, les ressources consacrées à la langue russe sont rares. Cette thèse a pour objectif de contribuer à la réalisation d'outils d'aide à la traduction du russe économique. Notre étude souligne les besoins en ressources phraséologiques et la nécessité de mener une analyse basée sur l'observation de documents réels. Elle comporte trois volets: constitution d'un corpus composé de documents réels; analyse de la structure des textes et de leur terminologie; analyse d'unités phraséologiques bilingues extraites des textes. L'analyse des unités phraséologiques est abordée sous un angle sémantique. Le domaine de l'économie est représenté par une grille de concepts organisés permettant l'indexation des unités phraséologiques. Celles-ci sont accessibles par les lexies qui les composent mais aussi par leur sens, ce qui est d'un intérêt particulier pour le traducteur
The expanding communication between France and Russia requires additional tools for translation. However, only a few lexicographic resources are dedicated to the Russian language. This thesis aims to develop a new approach of the translation of Russian economic documents into French; the study emphasizes the importance of phraseological resources derived from genuine documents. It presents, therefore, three constituents: the creation of a corpus of documents, the detailed description of the structure of the documents and their terminology and the analysis of the bilingual phraseological units (PU) extracted from the texts. The PU are analysed from a semantic point of view; an organised system of concepts is used to tabulate the units. They can be found through their lexical items (listed in alphabetical order) or through their meaning (using a set of concepts). Both ways to access the units are of great assistance to the translator
APA, Harvard, Vancouver, ISO, and other styles
45

Svášek, Martin. "Définitions, élaboration et exploitation d'un corpus parallèle bidirectionnel français-tchèque tchèque français." Paris, INALCO, 2007. http://www.theses.fr/2007INAL0020.

Full text
Abstract:
D’abord, nous introduisons le concept de corpus parallèle. Fratchèque est un corpus parallèle de ressources écrites dont les textes en français et en tchèque proviennent de la littérature écrite après 1945. Il ne contient pas de balises XML, le logiciel ParaConc utilisé pour le traitement du corpus n’en a pas besoin. L’élaboration du corpus est décrite d’une façon détaillée en suivant toutes les démarches et tout le paramétrage des logiciels utilisés. Elle commence avec le logiciel de reconnaissance optique de caractères FineReader et après le contrôle de la qualité des textes numérisés sous MS Word 2002 on procède à la constitution d’un corpus parallèle géré par ParaConc. La partie linguistique de la thèse s’appuie sur le corpus parallèle réalisé. Elle aborde un phénomène connu en tchèque sous le terme částice qui n’a d’équivalent univoque en français. Les termes le plus souvent liés en français à la question sont mots du discours et particules énonciatives. Selon les descriptions existantes, il y a une relation étroite entre ces mots et le discours. Cette constatation est démontrée pour deux částice – vždyt̕, přece et leurs variantes – sur les grands corpus tchèques (Analyse A) et Fratchèque (Analyse B). L’étude continue avec l’analyse systématique des types variés d’usage de vždyt̕, přece dans le but de proposer une description lexicographique pour un dictionnaire bilingue tchèque-français. Quelques exercices basés sur les résultats de l’étude montrent comment utiliser le corpus bilingue dans la didactique des langues. Enfin, on discute quelques questions qui concernent la possibilité d’évaluer automatiquement la qualité de traductions liées à la présence de částice
At the beginning the concept of a parallel corpus is defined. French and Czech texts forming the parallel Fratchèque corpus come from literature; only texts after the year 1945 have been selected. Fratchèque is not marked up explicitly by XML tags because the tagging is not necessary for the proper functioning of the corpus manager ParaConc. The building-up of the corpus is thoroughly described following all steps and settings of the software used. The process starts with the optical character recognition program FineReader and, after checking the accuracy of numerical texts by using MS Word 2002, it goes on building up a corpus managed by ParaConc. The linguistic investigations of the thesis rely primarily on the realization of a parallel corpus. The main purpose is to tackle a phenomenon that is known in Czech as částice but has no direct equivalent in French. The most frequent terms used in the French approach are mots du discours and particules énonciatives. The existing descriptions suggest a close relationship between these words and the discourse. It is demonstrated on two Czech částice - přece, vždyt̕ and their variants - using huge Czech corpora (Analysis A) and Fratchèque (Analysis B). The study continues analysing systematically all kind of usage of vždyt̕, přece in order to present lexicographical description for a bilingual Czech-French dictionary. Through some exercices based on the results of the linguistic analysis it is shown how to use the bilingual corpus in teaching foreign languages. Finally, some issues concerning automatic evaluation of translation quality are discussed taking into account the work with částice
APA, Harvard, Vancouver, ISO, and other styles
46

Sandford, Eugène. "Augmentation lexicale sémantique et désambigui͏̈sation lexicale sémantique : application à la traduction du français vers le tahitien." Montpellier 2, 1998. http://www.theses.fr/1998MON20265.

Full text
Abstract:
Dans la perspective de la realisation d'un systeme de traduction automatique du francais vers le tahitien, nous utilisons une methode de deuxieme generation : celle des transferts. Dans cette approche, nous nous sommes concentres sur l'analyse semantique du francais et sur la generation syntaxique du tahitien. L'apport de notre analyse semantique reside dans l'integration des criteres semantiques des mots - recueillis par une methode vectorielle - a une structure morpho-syntaxique construite par une methode symbolique. La demarche retenue represente les sens des mots dans un espace vectoriel de notions issues d'un thesaurus d'idees. Les vecteurs obtenus sont ensuite integres dans la structure syntaxique au niveau des unites lexicales par un lexique semantique. Enfin, les syntagmes, les phrases et les textes s'enrichissent des notions des mots par une suite d'operations effectuees sur la structure syntaxique. La desambiguisation lexicale semantique intervient par une distance calculee entre les sens et les contextes notionnels - phrases ou textes. Dans la phase intermediaire situee entre l'analyse semantique et la generation syntaxique, nous avons etudie les transferts lexical et structurel ainsi que la structure intermediaire. L'originalite dans la generation syntaxique repose sur la prise en compte de phenomenes contrastifs : des exemples viennent illustrer la maniere dont nous les avons traites. La conception de la generation est generique et derive de la grammaire de l'academie tahitienne. Soulignons que pour le tahitien, il s'agit d'un travail original. C'est en effet la premiere fois qu'une telle informatisation est entreprise. L'implementation de ces deux parties est faite en utilisant le systeme sygmart, un systeme de programmation de grammaires structurelles.
APA, Harvard, Vancouver, ISO, and other styles
47

Ignat, Camelia. "Amélioration de l'alignement et de la traduction statistique par utilisation de corpus parallèles multilingues." Phd thesis, Université de Strasbourg, 2009. http://tel.archives-ouvertes.fr/tel-00405733.

Full text
Abstract:
Cette thèse porte sur la constitution d'un corpus parallèle multilingue (JRC-Acquis) et son application à l'amélioration de l'alignement et de la traduction statistique par triangulation, processus de traduction d'une langue source vers une langue cible par le biais d'une langue tierce. Dans ce cadre, nous avons développé des approches basées sur l'utilisation de corpus parallèles multilingues alignés au niveau des phrases dans plusieurs langues dites ‘pivots'. Les deux méthodes principales proposées par notre étude permettent de générer un modèle de traduction par combinaison de plusieurs systèmes créés pour différentes langues pivots. Nous démontrons ainsi que des textes parallèles multilingues en vingt-deux langues peuvent améliorer sensiblement la traduction automatique.
APA, Harvard, Vancouver, ISO, and other styles
48

Menacer, Mohamed Amine. "Reconnaissance et traduction automatique de la parole de vidéos arabes et dialectales." Electronic Thesis or Diss., Université de Lorraine, 2020. http://www.theses.fr/2020LORR0157.

Full text
Abstract:
Les travaux de recherche ont été développés dans le cadre du projet AMIS (Access to Multilingual Information and opinionS) dont l'objectif principal est de développer un système d’aide à la compréhension de vidéos dans des langues étrangères en générant un résumé automatique de ces dernières dans une langue compréhensible par l'utilisateur. Dans le cadre de cette thèse, nous nous sommes concentrés sur la reconnaissance et la traduction automatique de la parole de vidéos arabes et dialectales. Les approches statistiques proposées dans la littérature pour la reconnaissance automatique de la parole (RAP) sont indépendantes de la langue et elles sont applicables à l'arabe standard. Cependant, cette dernière présente quelques caractéristiques que nous devons prendre en considération afin de booster les performances du système de RAP. Parmi ces caractéristiques on peut citer l'absence de l'indication des voyelles dans le texte ce qui rend difficile leur apprentissage par le modèle acoustique. Nous avons proposé plusieurs approches de modélisation acoustique et/ou de langage afin de mieux reconnaître la parole arabe. L'arabe standard n'est pas la langue maternelle, c'est pourquoi dans les conversations quotidiennes, on utilise le dialecte, un arabe inspiré de l'arabe standard, mais pas seulement. Nous avons travaillé sur l'adaptation du système développé pour l'arabe standard au dialecte algérien qui est l'une des variantes de la langue arabe les plus difficiles à reconnaître par les systèmes de RAP. Cela est dû aux mots empruntés d'autres langues, au code-switching et au manque de ressources. Notre proposition pour remédier à ces problèmes est de tirer profit des données orales et textuelles d'autres langues impactant le dialecte. Le texte résultant de la RAP arabe a été utilisé pour la traduction automatique (TA). Nous avons réalisé dans un premier temps une étude comparative entre l'approche statistique à base de segments et l'approche neuronale utilisées dans le cadre de la TA. Ensuite, nous nous sommes intéressés à l’adaptation de ces deux approches pour traduire le texte code-switché. Notre étude portait sur le mélange de l'arabe et de l'anglais dans des documents officiels des nations unies. Pour pallier les différents problèmes dus à la propagation des erreurs dans le système séquentiel, nous avons travaillé sur l'adaptation du vocabulaire du système de RAP et sur la proposition d'une nouvelle modélisation permettant la traduction directe de la parole
This research has been developed in the framework of the project AMIS (Access to Multilingual Information and opinionS). AMIS is an European project which aims to help people to understand the main idea of a video in a foreign language by generating an automatic summary of it. In this thesis, we focus on the automatic recognition and translation of the speech of Arabic and dialectal videos. The statistical approaches proposed in the literature for automatic speech recognition are language independent and they are applicable to modern standard Arabic. However, this language presents some characteristics that we need to take into consideration in order to boost the performance of the speech recognition system. Among these characteristics we can mention the absence of short vowels in the text, which makes their training by the acoustic model difficult. We proposed several approaches to acoustic and/or language modeling in order to better recognize the Arabic speech. In the Arab world, modern standard Arabic is not the mother tongue, that is why daily conversations are carried out with dialect, an Arabic inspired from modern standard Arabic, but not only. We worked on the adaptation of the speech recognition system developed for the modern standard Arabic to the Algerian dialect, which is one of the most difficult variants of the Arabic language to recognize by automatic speech recognition systems. This is mainly due to the borrowed words from other languages, the code-switching and the lack of resources. Our approach to overcome all these problems is to take advantage from oral and textual data of other languages that have an impact on the dialect in order to train the required models for dialect speech recognition. The resulting text from Arabic speech recognition system was then used for machine translation. As a starting point, we conducted a comparative study between the phrase based approach and the neural approach used in machine translation. Then, we adapted these two approaches to translate the code-switched text. Our study focused on the mix of Arabic and English in a parallel corpus extracted from official documents of the United Nations. In order to prevent the error propagation in the pipeline system, we worked on the adaptation of the vocabulary of the automatic speech recognition system and on the proposition of a new model that directly transforms a speech signal in language A into a sequence of words in another language B
APA, Harvard, Vancouver, ISO, and other styles
49

Lasfer-Kedad, Sandra. "Étude syntaxique des Wh-questions en vue de leur traduction automatique de l’anglais vers l’arabe." Thesis, Paris 4, 2014. http://www.theses.fr/2014PA040011.

Full text
Abstract:
Premièrement, ce travail de recherche a pour objet d’esquisser une étude syntaxique des wh-questions, et d’analyser les aspects de la formation des wh-questions dans deux langues différentes : l’anglais et l’arabe , dans le cadre de la Grammaire Générative et de l’Approche Minimaliste. Il sera démontré et allégué que dans les deux langues respectives, le wh-mot qui se trouve au début de la phrase interrogative est déplacé vers le [Spec, CP] et que le wh-movement est visible.Deuxièmement, cette thèse tente d’examiner et d’analyser la traduction des wh-questions de l’anglais vers l’arabe par trois systèmes de traduction automatique, employant différentes méthodes de traduction selon trois méthodes d’évaluation. Nous décrirons les problèmes liés aux différences linguistiques entre les deux langues. Ces problèmes ont une grande influence sur la qualité et l’acceptabilité de l’output. L’évaluation de l’output nous permettra de présenter les informations concernant les aspects positifs à conserver et les aspects négatifs à faire évoluer des systèmes. En se basant sur l’étude syntaxique préalable des wh-questions, nous fournirons une étude comparative qui déterminera le meilleur système quant à la qualité de la traduction et à la performance de ce système. A travers l’analyse des résultats de l’évaluation, nous spécifierons les raisons pour lesquelles le système produit des traductions de mauvaise qualité. Enfin, nous proposerons quelques recommandations qui pourraient être nécessaires aux concepteurs et aux développeurs de systèmes de traduction afin de résoudre les problèmes linguistiques et opérationnels susceptibles d’entraver le processus de traduction
Firstly, this research aims to outline a syntactic study of the wh-questions, and analyse aspects of wh-question formation in typologically two different languages: Arabic and English within the framework of Generative Grammar and Minimalist Approach. It will be shown and argued that in both languages, the wh-phrase, which is in initial position, is moved to [Spec, CP] and that wh-movement applies overtly.Secondly, the thesis attempts to discuss and analyse the translation of English wh-questions into Arabic by three machine translation systems using different methods of translation through different methods of evaluation. We describe a set of important problems related to linguistic differences between the two languages. These problems have great influence not only on the quality of the output but also on its acceptability. The evaluation of the output will help us to present a diagnostic information about where a given system succeeds or needs improvement, relative to its intended users and use based on the syntactic study of wh-questions, to provide a comparative information which allows identifying the best system with respect to the translation quality and performance, to specify through the analysis of the results of evaluation the sources of problems that are responsible for producing ill-formed translations and inadequate systems’ performance and finally to outline some recommendations that are useful for system’s designers and developers to overcome various linguistic and operational problems that might impede the translation process
APA, Harvard, Vancouver, ISO, and other styles
50

Meneses, Lerin Luis. "Dictionnaire électronique monolingue coordonné du verbe Donner FR-ES-MEX : approche syntactico-sémantique." Paris 13, 2012. http://www.theses.fr/2012PA131035.

Full text
Abstract:
C’est à partir du nombre croissant des documents informatisé qui rend indispensable le traitement automatique des langues, en vue de la reconnaissance, de la génération et de la traduction automatique, que ce travail se propose d’étudier la continuité entre les différents statuts du verbe donner, à savoir: - donnei verbe prédicatif - donner verbe support - donner, dans une expression figée. Cette continuité se traduit par des phénomènes liés à l’appropriation, aux collocations, au semi 1 6 figement et au figement. L’élaboration du dictionnaire électronique nous permettra de catégoriser. Les entrées du verbe donner selon des critères syntaxiques et sémantiques. Une fois élaboré dictionnaire électronique en français, nous appliquerons la même méthodologie pour traiter les variantes diatopiques de l’espagnol du Mexique en passant par l’espagnol péninsulaire.
APA, Harvard, Vancouver, ISO, and other styles
We offer discounts on all premium plans for authors whose works are included in thematic literature selections. Contact us to get a unique promo code!

To the bibliography