To see the other types of publications on this topic, follow the link: Lexicales.

Dissertations / Theses on the topic 'Lexicales'

Create a spot-on reference in APA, MLA, Chicago, Harvard, and other styles

Select a source type:

Consult the top 50 dissertations / theses for your research on the topic 'Lexicales.'

Next to every source in the list of references, there is an 'Add to bibliography' button. Press on it, and we will generate automatically the bibliographic reference to the chosen work in the citation style you need: APA, MLA, Harvard, Chicago, Vancouver, etc.

You can also download the full text of the academic publication as pdf and read online its abstract whenever available in the metadata.

Browse dissertations / theses on a wide variety of disciplines and organise your bibliography correctly.

1

Morlane-Hondère, François. "Une approche linguistique de l'évaluation des ressources extraites par analyse distributionnelle automatique." Phd thesis, Université Toulouse le Mirail - Toulouse II, 2013. http://tel.archives-ouvertes.fr/tel-00937926.

Full text
Abstract:
Dans cette thèse, nous abordons du point de vue linguistique la question de l'évaluation des bases lexicales extraites par analyse distributionnelle automatique (ADA). Les méthodes d'évaluation de ces ressources qui sont actuellement mises en œuvre (comparaison à des lexiques de référence, évaluation par la tâche, test du TOEFL...) relèvent en effet d'une approche quantitative des données qui ne laisse que peu de place à l'interprétation des rapprochements générés. De ce fait, les conditions qui font que certains couples de mots sont extraits alors que d'autres ne le sont pas restent mal connues. Notre travail vise une meilleure compréhension des fonctionnements en corpus qui régissent les rapprochements distributionnels. Pour cela, nous avons dans un premier temps adopté une approche quantitative qui a consisté à comparer plusieurs ressources distributionnelles calculées sur des corpus différents à des lexiques de références (le Dictionnaire électronique des synonymes du CRISCO et le réseau lexical JeuxDeMots). Cette étape nous a permis, premièrement, d'avoir une estimation globale du contenu de nos ressources, et, deuxièmement, de sélectionner des échantillons de couples de mots à étudier d'un point de vue qualitatif. Cette deuxième étape constitue le cœur de la thèse. Nous avons choisi de nous focaliser sur les relations lexico-sémantiques que sont la synonymie, l'antonymie, l'hyperonymie et la méronymie, que nous abordons en mettant en place quatre protocoles différents. En nous appuyant sur les relations contenues dans les lexiques de référence, nous avons comparé les propriétés distributionnelles des couples de synonymes/antonymes/hyperonymes/méronymes qui ont été extraits par l'ADA avec celles des couples qui ne l'ont pas été. Nous mettons ainsi au jour plusieurs phénomènes qui favorisent ou bloquent la substituabilité des couples de mots (donc leur extraction par l'ADA). Ces phénomènes sont considérés au regard de paramètres comme la nature du corpus qui a permis de générer les bases distributionnelles étudiées (corpus encyclopédique, journalistique ou littéraire) ou les limites des lexiques de référence. Ainsi, en même temps qu'il questionne les méthodes d'évaluation des bases distributionnelles actuellement employées, ce travail de thèse illustre l'intérêt qu'il y a à considérer ces ressources comme des objets d'études linguistiques à part entière. Les bases distributionnelles sont en effet le résultat d'une mise en œuvre à grande échelle du principe de substituabilité, ce qui en fait un matériau de choix pour la description des relations lexico-sémantiques.
APA, Harvard, Vancouver, ISO, and other styles
2

Jousse, Anne-Laure. "Modèle de structuration des relations lexicales fondé sur le formalisme des fonctions lexicales." Thèse, Paris 7, 2010. http://hdl.handle.net/1866/4347.

Full text
Abstract:
Cette thèse porte sur l’élaboration d’un modèle de structuration des relations lexicales, fondé sur les fonctions lexicales de la Théorie Sens-Texte [Mel’cuk, 1997]. Les relations lexicales considérées sont les dérivations sémantiques et les collocations telles qu’elles sont définies dans le cadre de la Lexicologie Explicative et Combinatoire [Mel’cuk et al., 1995]. En partant du constat que ces relations lexicales ne sont pas décrites ni présentées de façon satisfaisante dans les bases de données lexicales, nous posons la nécessité d’en créer un modèle de structuration. Nous justifions l’intérêt de créer un système de fonctions lexicales puis détaillons les quatre perspectives du système que nous avons mises au point : une perspective sémantique, une perspective axée sur la combinatoire des éléments d’une relation lexicale, une perspective centrée sur leurs parties du discours, ainsi qu’une perspective mettant en avant l’élément sur lequel se focalise la relation. Le système intègre l’ensemble des fonctions lexicales, y compris les fonctions lexicales non standard, dont nous proposons une normalisation de l’encodage. Le système a été implémenté dans la base de données lexicale du DiCo. Nous présentons trois applications dans lesquelles il peut être exploité. Premièrement, il est possible d’en dériver des interfaces de consultation pour les bases de données lexicales de type DiCo. Le système peut également être directement consulté en tant qu’assistant à l’encodage des relations lexicales. Enfin, il sert de référence pour effectuer un certain nombre de calculs sur les informations lexicographiques, qui pourront, par la suite, être implémentés pour automatiser la rédaction de certains champs de fiches lexicographiques.
This thesis proposes a model for structuring lexical relations, based on the concept of lexical functions (LFs) proposed in Meaning-Text Theory [Mel’cuk, 1997]. The lexical relations taken into account include semantic derivations and collocations as defined within this theoretical framework, known as Explanatory and Combinatorial Lexicology [Mel’cuk et al., 1995]. Considering the assumption that lexical relations are neither encoded nor made available in lexical databases in an entirely satisfactory manner, we assume the necessity of designing a new model for structuring them. First of all, we justify the relevance of devising a system of lexical functions rather than a simple classification. Next, we present the four perspectives developped in the system: a semantic perspective, a combinatorial one, another one targetting the parts of speech of the elements involved in a lexical relation, and, finally, a last one emphasizing which element of the relation is focused on. This system covers all LFs, even non-standard ones, for which we have proposed a normalization of the encoding. Our system has already been implemented into the DiCo relational database. We propose three further applications that can be developed from it. First, it can be used to build browsing interfaces for lexical databases such as the DiCo. It can also be directly consulted as a tool to assist lexicographers in encoding lexical relations by means of lexical functions. Finally, it constitutes a reference to compute lexicographic information which will, in future work, be implemented in order to automatically fill in some fields within the entries in lexical databases.
Thèse réalisée en cotutelle avec l'Université Paris Diderot (Paris 7)
APA, Harvard, Vancouver, ISO, and other styles
3

Tirvassen, Rada. "Les Particularités lexicales du français mauricien." Aix-Marseille 1, 1986. http://www.theses.fr/1986AIX10071.

Full text
Abstract:
Nous fondant schematiquement sur deux types de productions langagieres l'une caracterisee par une confrontation avec la norme, l'autre par une absence de confrontation, nous avons essaye de preciser ce qui est commun et ce qui differencie les vocabulaires actualises dans les productions langagieres en francais a l'ile maurice d'une part et d'autre part demontrer l'ecart entre ces vocabulaires et le francais standard. Nous pensons qu'un tel travail nous permet d'affirmer que pour des raisons socio-linguistiques, le vocabulaire du francais mauricien a ses propres specificites: il est temps non seulement que celles-ci soient reconnues et cceptes mais pour qu'un travail d'amenagement linguistique soit effectue afin que les locuteurs devant user de termes qui ne font pas partie du francais standard ne soient pas en situation d'insecurite linguistique
The differnce between the actual use of french and the rules proposed by grammaticals text-books and dictionaries, the different perceptions of lexical norms, and the presence of lexical strategies typical of mauritian french are some of the various motivations behind this research work. Basing myself on real speech (oral and written), i have to point out the common and different particualrities of the different usages of the french vocabulary in mauritius. I hope that i have been able to show that the rules which govern the use of french vocabulary is specific to mauritius, whereby the necessity of preparing a dictionary in order (a) to choose a standard graphy for "non standard" words (b) to define them and specially (c) to settle once for all on their status
APA, Harvard, Vancouver, ISO, and other styles
4

Sérasset, Gilles. "Sublim : un systeme universel de bases lexicales multilingues et NADIA : sa specialisation aux bases lexicales interlingues par acceptations." Université Joseph Fourier (Grenoble), 1994. http://tel.archives-ouvertes.fr/tel-00005112.

Full text
Abstract:
Le but de cette these est de definir et developper un systeme de bases lexicales multilingues independant des applications et des theories linguistiques. Elle debute donc par une etude des dictionnaires (imprimes ou electroniques) et des outils de gestion de bases lexicales, avec, notamment, le projet ESPRIT MULTILEX, considere comme l'effort le plus avance, mais qui presente quelques faiblesses (architecture lexicale par transfert, structures linguistiques codees sous forme de structures de traits types. ). La deuxieme partie de cette these est consacree a la definition de SUBLIM, un systeme de gestion de bases lexicales multilingues qui permet de specifier l'architecture lexicale (organisation des dictionnaires) et l'architecture linguistique (organisation des informations linguistiques des unites des dictionnaires), sans imposer de contraintes ni sur les types de dictionnaires choisis, ni sur les structures linguistiques utilisees. La troisieme et derniere partie de cette these presente une specialisation de ce systeme generique en un systeme dedie a la gestion de bases lexicales multilingues fondees sur les acceptions interlingues : NADIA. Cette approche generalise certaines methodes interlingues comme celle du projet de traduction multilingue ULTRA, et permet la definition de bases lexicales multilingues ne se basant pas sur une approche par connaissances
APA, Harvard, Vancouver, ISO, and other styles
5

Gouedan, Aké Lucien. "Particularités lexicales du français de Côte d'Ivoire." Villeneuve d'Ascq : Presses universitaires du Septentrion, 2000. http://books.google.com/books?id=k0lcAAAAMAAJ.

Full text
APA, Harvard, Vancouver, ISO, and other styles
6

Moussa-Aghali, Fatimane. "Les créations lexicales en hawsa du Niger." Paris 3, 1994. http://www.theses.fr/1995PA030074.

Full text
Abstract:
Langue tchadique de la famille chamito-semitique, le hawsa est parle principalement au nord ud nigeria, au centre sud du niger et un peu partout en afrique de l7ouest par plus de quarante millions de locuteurs. L'objet de ce travail est de decrire les procedes de creation et d'integration de nouvelles unites lexicales creees ou empruntees pour exprimer ou denommer de novueaux concepts et notions en hawsa. Constitue a partir des documents ecrits en francais et traduits en hawsa, notre corpus comporte environ deux mille deux cent vingt-quatre entree lexicales dont quatre cent quatre-vingt-et-onze emprunts ainsi denombres : arabe : cent soixante dix-sept, anglais : cent, francais : deux cent vingt-quatre; les autres sont issues du hawsa lui-meme. Nous presentons deux lexiques bilingues hawsa francais et francais hawsa dans l'ordre alphabetique latin. Le developpement socio-economique, culturel et politique des pays africains en general, et du niger en particulier, doit necessairement commencer par la promotion effective de ses propres langues. La recherche terminologique doit etre le passage oblige d'une telle promotion car, cela favorisera l'enrichissement de la langue et l'expression de certaines realites scientifiques et techniques
Chadic language belonging to the hamito-semitic famaly, hawsa language is spoken in the north of nigeria, in the middlewest of niger and in certain areas of west africa by approximatively fourty millions native speakers. The objective of this study is to describe the specific methods of creation and integration of new lexical items created or borrowed to denote new concepts and new notions in hawsa. Built up from french writing documents translated into hawsa, our corpus is made of two thousand two hundred and twenty four lexical entries, including four hundred and ninety one lexical borrowings classified as follow : arabe : one hundred and seventy seven ; english : hundred and french two hundred and seventy four loan-words. Other entries come from hawsa itself. We present two bilingual lexicons hawsa french and french hawsa in latin alphabetic order. The socio-economic, culturel and political development of african countries in general and of niger in particular, should go through the real promotion of its languages. The terminological research must be the figurehead of such a promotion because it will favour the enrichment of the language and the denomination of certain technic and scientific notions or concepts
APA, Harvard, Vancouver, ISO, and other styles
7

Rilly, Claude. "Le méroi͏̈tique : données grammaticales, lexicales : position linguistique." Paris, EPHE, 2003. http://www.theses.fr/2003EPHE4068.

Full text
APA, Harvard, Vancouver, ISO, and other styles
8

Gouédan, Aké Lucien. "Particularités lexicales du français de Côte d'Ivoire." Paris 5, 1998. http://www.theses.fr/1998PA05H050.

Full text
Abstract:
La cote d'Ivoire est un pays dont la situation linguistique est complexe. En effet, elle compte plus d'une soixantaine de langues originaires du pays et plus d'une quinzaine de langues étrangères venus d’Afrique, d’Europe et d’Asie. Le français introduit, avec la colonisation en 1893, reste la langue officielle et exclusive de l'administration et de l'enseignement. Vers 1912, cet enseignement, que j'ai d'abord qualifie d'assimilateur non délibère, est apparu dans les réalités locales, non-sens révéler des inadaptations dans les contenus et les programmes. De ce contact force du français avec les langues en présence est né une variété de français parle de Côte d'Ivoire, le français populaire ivoirien (FPI), qui est devenu aujourd'hui la principale langue de communication du pays. D'un point de vue lexical, le contact du français avec les langues locales et les réalités ivoiriennes, a entrainé des emplois inhabituels (français inadéquat). On note ainsi des changements de sens de ces mots (africanismes sémantiques), des créations tout à fait nouvelles par rapport au français central (africanismes lexématiques), et des glissements de sens, d'emprunts et de mots hybrides. Cette étude nous a permis d'expliquer l'origine des néologismes qui constituent le français populaire ivoirien. Ces nouvelles unités lexicales prouvent le dynamisme du français dans ce nouveau contexte, et la volonté des ivoiriens d'adapter cet outil à leur besoin de communication
The Ivory Coast is a country with a complex linguistic situation. It nombers in fact more than sixty original native languages and over fifteen foreign languages from Africa, Europe and Asia. The French introduced with the colonisation in 1893 is still the official language and the are used exclusively in administration and teaching. Towards 1912 this teaching, which I at first qualified as non-deliberate assimilation, has appeared in local context, of without revealing certaine inadequacies as far as content and carricula are concerned. The French contact between French and the languages already in use gave birth to a version of Ivory Coast spoken French (F. P. I. - francais populaire ivorien). Which has today become the mayor language for communicating in the country. The contact between French, the local languages and the realities of the country has led to unusual uses from a lexical point of view (inadequacy of the French). We were also changes in the meaning of wonds (semantic africanisms), entirely new creations companed with standard French (lexematic africanisms) and shifts in meaning,correwed and hybrid wonds. This study has enabled as to explain the origin of the neologisms which make up popular Ivory Coast French. These new lexical unities prouve how dynamic french has become in this new context and the wish expressed by the population of the Ivory Coast, to adapt this element to their needs in communication
APA, Harvard, Vancouver, ISO, and other styles
9

Aliukonytė, Aurelija. "Les series lexicales, leur role dans le texte." Master's thesis, Lithuanian Academic Libraries Network (LABT), 2006. http://vddb.library.lt/obj/LT-eLABa-0001:E.02~2006~D_20060605_093139-93112.

Full text
Abstract:
All the words can be classified by their forms, their meanings and their forms. In my work I presented the synonyms, antonyms, homonyms, hyperonyms, hoponyms, paronyms and autonyms and their fonctionement in the text. The synonyms, the antonyms, the homonyms and the others are very important for the language. The synonyms and the antonyms are very closely related to the polysemy of the words. Synonyms are different words with similar or identical meanings. The synonyms are used to describe qualities and defects of English and French peoples, for better express one or other idea, to give more color and details to the text, to convince the reader. Very often the synonyms create ironic situations. The synonyms are also very attractive for the publicity which objective is to persuade that such or such product is better than others. Antonym is the word that means the opposite of another. The writers are using the antonyms in their works to create the antitheses. In the analyzed book we can notice that almost all the text is created at the base of the antithesis, where the author opposes two nations to show their way to live, their characters, their habits and their traditions. Generally the antitheses created contain the ironic character. Homonym is a word that is written and pronounced the same way as another, but which has a different meaning. The homonyms especially the homophons are used in publicity. The homophons are used to make the products more attractive to the... [to full text]
APA, Harvard, Vancouver, ISO, and other styles
10

Fagua, Rincon Doris Patricia. "Aspects morphosyntaxiques de l'ocaina : autour des classes lexicales." Paris 7, 2013. http://www.theses.fr/2013PA070098.

Full text
Abstract:
L'ocaina (famille witoto), jusque là peu décrit, est parlé par quelque 50 locuteurs en Amazonie Nord-Ouest. Notre description porte sur les catégories lexicales et leurs (sous-)classe, identifiées suivant leurs corrélats morphosyntaxiques. Une grande division correspond à leur aptitude à se constituer en centre prédicatif ; les sous-divisions renvoient à leur capacité d'instaurer des syntagmes et d'accueillir de la morphologie flexionnelle : catégories non prédicatives, n'instaurant pas de syntagmes : lexies-énoncés, particules, adverbes, adjectif (non flexionnables), adverbes (flexionnables) ; instaurant des syntagmes : postposition (flexionnables) ; catégories prédicatives, instaurant des syntagmes : idéophones (non flexionnables), verbes, noms et adverbes (flexionnables). La riche morphologie de l'ocaina (en particulier des catégories prédicatives flexionnables) justifie un exposé détaillé des processus morphologiques : flexion, translation et dérivation. Cette tripartition est obtenue par le croisement de la présence ou l'absence de l'un de ces critères : régularité, applicabilité à toute une (sous-)classe, variation sémantique impliquant un changement de (sous-)catégorie lexicale. Des analyses complétant l'abord théorique de certaines questions sont proposées. Par exemple, l'ocaina illustre un fait non documenté auparavant : la coexistence d'un système de genre et d'un système de suffixes classificatoires de discrétisation (cf «classificateurs »), exprimant la catégorie de nombre. D'autre part, les concepts de qualité, dits adjectivaux, sont exprimés par le seul adjectif de la langue, quelques noms substantifs et majoritairement par les adverbes prédicatifs
Ocaina (Witotoan), a language with little previous description, is still spoken by about fifty speakers in North-West Amazon. Our description focuses on lexical categories, its classes and sub-classes, identified by means of their morphosyntactic properties. The first distinction is based on the aptitude of the lexical categories to fonction as predicate nucleus; further distinctions can be made according to their ability to form phrases for which they are the head; and/or their ability to receive inflectional morphology: non predicative, with impossibility of heading phrases: lexical statements, particules, adverbs, adjectif (non inflectable), adverbs (inflectable); heading phrases: postposition (inflectable); predicative catégories, heading phrases: ideophones (non inflectables), verbs, noms and adverbs. The rich morphology of the language justifies a detailed presentation in terras of morphological processes: inflectional, transferential, and derivational. This subdivision is distinguished according to their regularity and their scope of application (a class or sub-class) and, whether or not they induce a semantic change involving a change of lexical category or sub-class. We propose analyses that complement the theoretical approach to certain issues. For instance, Ocaina illustrates the co-existence in the same language of a gender system and a system of classificatory suffixes of discretisation (see "classifiers"), markers which, in our analysis, express the number category. Furthermore, concepts of quality and property (adjectival concepts) are expressed in: adjective (just one); noun, with a handful of commun nouns; and, predicative adverbs, with (large inventory)
APA, Harvard, Vancouver, ISO, and other styles
11

Briand, Michel. "Pindare : ombres et lumières : études lexicales et sémantiques." Nice, 1990. http://www.theses.fr/1990NICE2022.

Full text
Abstract:
Pindare, poète de la lumière, poète "obscur" : ce jugement est discutable. La lumière grecque et ignée ; briller, voir et brûler sont analogues ; et la réflexion culturelle et stylistique doit soutenir l'analyse linguisitique. Les valeurs concrètes et abstraites de phaos ("lumière diurne", "éclat glorieux") interviennent dans les réseaux phoniques, sémantiques et poétiques du texte figuratif. Son groupe lexical (phaennos, phaino, phaneros), comme aglaos et liparos, lient la lumière diffuse aux notions de gloire, parole, bonheur, richesse, sacré. Mais argos, aigla, lampo, aktis évoquent une combustion vive, un rayonnement coloré. Nux, melas et skia partagent des connotations de phaos, contrairement aux ténèbres et noirceur chtoniennes, notamment skotos. On trouve aussi souvent des teintes lumineuses, à valeur dynamique, matérielle, sensorielle, mythique, rituelle ou maral efortes, notamment leukos, xanthos, poikilos. Le caractère substantiel des notations visuelles apparait dans leurs supports : métaux (or, bronze) ; astres, météores ; feu, flammes, fumée. Ces images forment cinq groupes : lumière diurne, diffuse, harmonieuse ; rayonnement vif ou trouble ; éclat flamboyant ; ombre, nuit, noirceur ; ténèbres. Poète de la lumière,Pindare évoque aussi couleurs, matières, ombres, éclats et feux. Son oeuvre, alliant tradition et création, rigueur et vigueur, figuration et réalisme, n'est pas "obscur"
Pindar's reputation, as "obscure" poet of the light, needs discussion. The greek light is fire ; seeing, shinning and burning are similar ; and linguistic analysis must rely upon culture and style references the concrete and abstract values of phaos ("day-light" and "glorious brightness") occur simultaneously through the sound, meaning and style system of the figurative text. Its lexical family (phaennos, phaino, phaneros) like aglaos and liparos, relate diffuse light to glory, voice, happiness, wealth, divinity. But argos, aigla, lampo, aktis refer to vivid combustion or colored radiation. Nux, melas and skia share connotations with phaos, which words like skotos, meaning "deep darkness" or "chtonian blackness" don't. Pindar often emphasizes gleaming colours, expressing movements, matters, feelings, myth, rite and ethics, like leukos, xanthos, poikilos. Their physical supports show the substantial nature of those visual notes : metal (gold, bronze) ; stars, meteorology ; fire, flames, smoke. All these images make five groups : harmonious day-light ; vivid or dim radiation ; shining fire ; shade ; night, blackness ; gloom. Poet of the light,Pindar also shows colours ; matters, shades, gleams and fires. Combining traditions and creativity, strictness and strength, fantasy and realism, his works are not "obscure"
APA, Harvard, Vancouver, ISO, and other styles
12

Ferrané, Isabelle. "Bases de donnees et de connaissances lexicales morphosyntaxiques." Toulouse 3, 1991. http://www.theses.fr/1991TOU30157.

Full text
Abstract:
Le projet bdlex de bases de donnees et de connaissances lexicales du francais ecrit et parle a ete developpe pour repondre aux forts besoins lexicaux des differents domaines et applications du traitement du langage naturel: le traitement automatique de la parole et des textes, la neuropsycholinguistique. . . Dans le cadre de ce projet, nous avons participe a la mise en uvre d'une composante lexicale centree sur la representation des informations morphosyntaxiques et phonologiques qui caracterisent les mots. Nous avons egalement complete ce lexique d'un ensemble d'outils linguistiques regroupes au sein de la composante morphosyntaxique morgan (morphologie et generation et analyse). La premiere partie de ce memoire presente rapidement le contexte de developpement des bases de donnees lexicales. La deuxieme partie est consacree a la definition 'un modele linguistique le mieux adaptee en vue de traitements automatiques. Pour cela nous procedons a l'etude de differents travaux et theories linguistiques. Nous degageons ensuite un ensemble de principes modelisant le fonctionnement des processus morphologiques flexionnels puis derivationnels, mis en uvre par tout locuteur de langue francaise. Ces principes ne traduisent que l'aspect morphosyntaxique regulier, c'est pourquoi nous les avons completes de maniere a permettre le traitement des irregularites et des exceptions. La troisieme partie decrit la phase de developpement d'une composante lexicale de grande taille. Les bases de donnees se sont revelees etre le moyen le plus adapte pour repondre aux problemes de gestion et de coherence de donnees alors rencontres. Les differents traitements morphologiques mis en uvre et les bases de regles associees sont presentes a travers la realisation de modules de generation et d'analyse morphologiques flexionnelles, ainsi que de generation de mots derives. Cet environnement linguistique permet la generation de sous-lexiques pour diverses applications: reconnaissance et synthese automatiques de la parole, correction orthographique, recherche fondamentale en lexicologie, realisation de tests et d'exercices en neuropsycholinguistique
APA, Harvard, Vancouver, ISO, and other styles
13

Elhami, Kambiz. "Constitutions lexicales et sémantiques de l'idiomatisation en français." Toulouse 2, 1990. http://www.theses.fr/1990TOU20045.

Full text
Abstract:
Dans ce travail nous avons essayé de présenter une analyse globale de l'organisation lexicale et sémantique des structures idiomatiques du francais. Le cadre théorique en la matière vient de nos objectifs lexicographiques qui consistent essentiellement a tirer une ligne de démarcation entre la zone idiomatique et d'autres zones du vocabulaire. Les problèmes qui font l'objet de nos recherches ici ont été choisis en vue de leurs applications dans la construction des dictionnaires des locutions. Le présent travail se répartit en six chapitres. Le premier chapitre concerne l'analyse des dénominations différentes de l'unité idiomatique, suivie d'une première série de critères idiomatologiques. Dans le deuxième chapitre nous aborderons en détail les modèles de l'idiomaticité qui ont été écrits pour les structures idiomatiques de l'anglais, de l'allemand et du francais. La position et la portée de chaque modèle seront etudiées avant que nous nous embarquions sur notre modèle représentationnel d'idiomaticité. Vers le milieu de ce chapitre une deuxième série de critères idiomatologiques (redéfinition) sera présentée ou l'unité idiomatique, c. A. D. La locution sera définie comme unité polylexicale, figée, et figurée. Les considérations à propos de ces critères nous conduiront à démontrer la morphologie spécifique du système syntaxique et du système sémantique des locutions ou notre hypothèse de base consistera à établir une structure bipède dans les systèmes en question ; ainsi la syntaxe idiomatique et la sémantique idiomatique seront conçues comme deux systèmes inter-reliés qui marchent chacune sur ses deux pieds (syntaxe bipède et semantique bipède) : l'un compositionnel et l'autre non compositionnel. Dans une telle optique le figement sera demontré comme la fixité de l'inter-pénétration de compositionalité et de non compositionalité du sens idiomatique dans la mesure où ce sens spécifique qui est un sens unitaire prend le pas sur les sens des mots constitutifs de la locution, et aussi dans la mesure où les fonctions référentielles de ceux-ci sont suspendues (partiellement ou complétement) sur les plans de la syntaxe et de la sémantique. Dans le troisième chapitre nous mettrons en avant quatre zones sémantiques dans les structures idiomatiques, ce sont : la zone analogique, la zone non analogique
This research attempts to provide an overall analysis of the lexical and semantic organization of idiomatic structures in french. The theoretical framework presented here comes from our lexicographical objectives consisting primarily of drawing a line of demarcation between the idiomatic zone of the vocabulary and other lexical zones. The issues for discussion are chosen with a view to possible applications of a dictionary of french idioms. Chapter one starts out with an examination of different denominations of the idiomatic unit, which will be followed by a first series of idiomatic criteria. Chapter two presents a detailed discussion of some current models of idiomaticity written for english, german and french. Here, we will study the position of each of these models on the idiom before embarking on our own model. In the middle of this chapter we will present a second series of idiomaticity criteria according to which idiom will be defined as a polylexical, frozen and figurative (in a non-poetic sense of the term). Near the end of the chapter the specific morphology of the syntactic and semantic systems of idioms will be fully analyzed ; our basic hypothesis is that the systems in question are inter-related and they walk both on two feet, of which one is compositional and the other noncompositional, hence we will define frozenness as the fixedness of semantic interpenetration of compositionality and non-compositionality in the idiomatic meaning in such a way that (1) the unitary meaning overrides the conjoined meanings of its words, and (2) insofaras the referential functions of the latter are suspended (partially or completely) on the syntactic as well as on the semantic plane of the language. Chapter three surveys four semantic areas in idiomatic structures : analogical area, non-analogical area, forged area, and complex area. These areas will be studied in the light of different processes of frozenness. In chapter four we will deal with some microstructural facts and the epistemological dimensions of frozenness. The issues to be discussed here are the following : the internal palimpsests of certain idioms, the problem of lexico-semantic over
APA, Harvard, Vancouver, ISO, and other styles
14

Isel, Frédéric. "Perception de la parole et accès au lexique : génération des hypothèses lexicales et compétitions lexicales lors de la reconnaissance des mots." Paris 5, 1997. http://www.theses.fr/1997PA05H080.

Full text
Abstract:
La reconnaissance de la parole implique un accès au lexique en temps réel, c'est à dire un appariement entre les informations sensorielles et une représentation lexicale. Les processus d'activation des mots ainsi que les processus de compétition lexicale seront étudiés sous l'hypothèse que l'accès au lexique est réalisé de façon directe. La validité empirique des concepts fonctionnels qui rendent compte de ces deux types de processus dans les modèles Trace et Cohort a été testée dans 13 expériences utilisant le paradigme d'amorçage inter-modal avec une tache de décision lexicale. Des mots et des non- mots plurisyllabiques contenant un ou plusieurs mots enchâssés ont servi de matériel linguistique. Le chapitre 1 est consacré à l'étude des mécanismes pré-lexicaux de segmentation et des processus de génération d'hypothèses lexicales lors de la formation d'un mot. Les chapitres 2 et 3 décrivent l'architecture des modèles Trace et Cohort et formulent les propositions que l'on peut en inférer sur la reconnaissance des mots et l'accès au lexique. Le chapitre 4 a pour objet la présentation des variantes du paradigme d'amorçage inter-modal. Les résultats du chapitre 5 montrent que le recouvrement partiel entre amorces et cibles permet le traitement de candidats lexicaux mais que l'activation de la forme lexicale d'un mot implique un traitement exhaustif des informations sensorielles. L'activation des formes lexicales peut avoir lieu en différents points du signal et que les formes lexicales activées entrent dans une compétition lexicale dont l'issue se caractérise par des inhibitions des formes inappropriées (chapitre 6). Les formes sémantiques de composants enchâssés en position finale a l'intérieur d'un mot porteur dissyllabique sont traitées mais celles de mots enchâssés en position initiale ne le sont pas. Ces dernières sont transitoirement activées mais l'avantage est donne à la forme sémantique associée au mot le plus long. Le niveau de repos de la forme sémantique d'un mot ne dépend pas de la fréquence absolue de ce mot (chapitre 7). Ces résultats convergents avec les prédictions dérivées d'un modèle connexionniste qui décrit la reconnaissance des mots comme étant le résultat d'une compétition survenant entre de multiples candidats lexicaux active en différents points du signal de parole (chapitre 8)
Speech recognition implies an on-line access to the mental lexicon, a match between sensory information and lexical representations. This thesis aimes to study word activation processes and lexical competitions under the hypothesis that lexical access is direct. Empirical validity of both functional concepts corresponding respectively to these processes according to two speech recognition models trace and cohort has been tested in 13 experiments using a cross-modal priming paradigm with a lexical decision task. Polysyllabic words and non-words containing one or two embedded words have been used. The first chapter was devoted to a study of prelexical segmentation mechanism and of lexical hypotheses generation during word formation. Chapters 2 and 3 present the architecture of trace and cohort models and formulate propositions for word recognition and lexical access. The goal of chapter 4 is to describe different kinds of the cross-modal priming paradigm (form, repetition, and semantic priming). Two experiments showed that a partial overlap between primes and targets allows lexical candidate processing but that activation of lexical forms requires an exhaustif processing of sensorial information (chapter 5). Activation of lexical forms may occur at different points in speech signal and activated forms begin to compete at lexical level. Issue of this competition is characterized by inhibition of inappropriated forms (chapter 6). Semantic forms of words embedded in bisyllabic words are processed when the embedded words is in final position, but not when it is embedded in initial position. Embedded words in initial position are transitory activated but a strong advantage is given to semantic forms corresponding to the longest word. The resting level of semantic forms seems not to depend of word frequency (chapter 7). These results converge with predictions derivated from connectionist models which describe word recognition as resulting from a competition between multiple candidates activated in different points of speech signal (chapter 8)
APA, Harvard, Vancouver, ISO, and other styles
15

Dias, Gael Harry Adélio André Dias. "Extraction automatique d´associations lexicales à partir de corpora." Doctoral thesis, FCT - UNL, 2002. http://hdl.handle.net/10362/1293.

Full text
Abstract:
The automatic acquisition of lexical associations from corpora is a crucial issue for Natural Language Processing. A lexical association is a recurrent combination of words that co-occur together more often than expected by chance in a given domain. In fact, lexical associations define linguistic phenomena such as idiomes, collocations or compound words. Due to the fact that the sense of a lexical association is not compositionnal, their identification is fundamental for the realization of analysis and synthesis that take into account all the subtilities of the language. In this report, we introduce a new statistically-based architecture that extracts from naturally occurring texts contiguous and non contiguous. For that purpose, three new concepts have been defined : the positional N-gram models, the Mutual Expectation and the GenLocalMaxs algorithm. Thus, the initial text is fisrtly transformed in a set of positionnal N-grams i.e ordered vectors of simple lexical units. Then, an association measure, the Mutual Expectation, evaluates the degree of cohesion of each positional N-grams based on the identification of local maximum values of Mutual Expectation. Great efforts have also been carried out to evaluate our metodology. For that purpose, we have proposed the normalisation of five well-known association measures and shown that both the Mutual Expectation and the GenLocalMaxs algorithm evidence significant improvements comparing to existent metodologies.
APA, Harvard, Vancouver, ISO, and other styles
16

Rossignol, Mathias. "Acquisition sur corpus d'informations lexicales fondées sur la sémantique différentielle." Phd thesis, Université Rennes 1, 2005. http://tel.archives-ouvertes.fr/tel-00524299.

Full text
Abstract:
Les lexiques sémantiques sont des ressources indispensables pour permettre à de nombreuses applications de traitement automatique des langues (résumé automatique, recherche d'information, traduction automatique, etc.) d'accéder au sens d'un texte. La question de la pertinence des informations présentes dans de tels lexiques est cruciale : le sens d'un mot comme navet, par exemple, varie considérablement selon que le texte étudié est consacré à la gastronomie ou à la cinématographie. Un moyen économique et linguistiquement motivé de disposer de descriptions de sens de mots réellement pertinentes est d'« apprendre » celles-ci à partir de l'utilisation effective des mots dans un corpus, collection de textes représentative d'un domaine d'expression. Nous proposons pour tenter de répondre à ce défi une méthodologie d'acquisition automatique sur corpus d'informations lexicales sémantiques en trois étapes, fondée sur les principes linguistiques de la Sémantique interprétative de F. Rastier. Par analyse statistique et comparaison des modes d'emploi des mots, en utilisant des méthodes classiques ou originales, nous parvenons tout d'abord à rapprocher des mots appartenant à un même domaine (par exemple donnée, transfert, réseau pour les NTIC), puis des mots de sens similaires (donnée et information). Enfin, nous proposons une première méthode permettant la mise au jour de nuances fines marquant des distinctions de sens entre mots proches (donnée est plus « concret » que information), ce qui constitue un résultat encore inédit en acquisition automatique d'informations lexicales sémantiques.
APA, Harvard, Vancouver, ISO, and other styles
17

Sigogne, Anthony. "Intégration de ressources lexicales riches dans un analyseur syntaxique probabiliste." Phd thesis, Université Paris-Est, 2012. http://tel.archives-ouvertes.fr/tel-00795309.

Full text
Abstract:
Cette thèse porte sur l'intégration de ressources lexicales et syntaxiques du français dans deux tâches fondamentales du Traitement Automatique des Langues [TAL] que sont l'étiquetage morpho-syntaxique probabiliste et l'analyse syntaxique probabiliste. Dans ce mémoire, nous utilisons des données lexicales et syntaxiques créées par des processus automatiques ou par des linguistes afin de donner une réponse à deux problématiques que nous décrivons succinctement ci-dessous : la dispersion des données et la segmentation automatique des textes. Grâce à des algorithmes d'analyse syntaxique de plus en plus évolués, les performances actuelles des analyseurs sont de plus en plus élevées, et ce pour de nombreuses langues dont le français. Cependant, il existe plusieurs problèmes inhérents aux formalismes mathématiques permettant de modéliser statistiquement cette tâche (grammaire, modèles discriminants,...). La dispersion des données est l'un de ces problèmes, et est causée principalement par la faible taille des corpus annotés disponibles pour la langue. La dispersion représente la difficulté d'estimer la probabilité de phénomènes syntaxiques apparaissant dans les textes à analyser mais qui sont rares ou absents du corpus ayant servi à l'apprentissage des analyseurs. De plus, il est prouvé que la dispersion est en partie un problème lexical, car plus la flexion d'une langue est importante, moins les phénomènes lexicaux sont représentés dans les corpus annotés. Notre première problématique repose donc sur l'atténuation de l'effet négatif de la dispersion lexicale des données sur les performances des analyseurs. Dans cette optique, nous nous sommes intéressé à une méthode appelée regroupement lexical, et qui consiste à regrouper les mots du corpus et des textes en classes. Ces classes réduisent le nombre de mots inconnus et donc le nombre de phénomènes syntaxiques rares ou inconnus, liés au lexique, des textes à analyser. Notre objectif est donc de proposer des regroupements lexicaux à partir d'informations tirées des lexiques syntaxiques du français, et d'observer leur impact sur les performances d'analyseurs syntaxiques. Par ailleurs, la plupart des évaluations concernant l'étiquetage morpho-syntaxique probabiliste et l'analyse syntaxique probabiliste ont été réalisées avec une segmentation parfaite du texte, car identique à celle du corpus évalué. Or, dans les cas réels d'application, la segmentation d'un texte est très rarement disponible et les segmenteurs automatiques actuels sont loin de proposer une segmentation de bonne qualité, et ce, à cause de la présence de nombreuses unités multi-mots (mots composés, entités nommées,...). Dans ce mémoire, nous nous focalisons sur les unités multi-mots dites continues qui forment des unités lexicales auxquelles on peut associer une étiquette morpho-syntaxique, et que nous appelons mots composés. Par exemple, cordon bleu est un nom composé, et tout à fait un adverbe composé. Nous pouvons assimiler la tâche de repérage des mots composés à celle de la segmentation du texte. Notre deuxième problématique portera donc sur la segmentation automatique des textes français et son impact sur les performances des processus automatiques. Pour ce faire, nous nous sommes penché sur une approche consistant à coupler, dans un même modèle probabiliste, la reconnaissance des mots composés et une autre tâche automatique. Dans notre cas, il peut s'agir de l'analyse syntaxique ou de l'étiquetage morpho-syntaxique. La reconnaissance des mots composés est donc réalisée au sein du processus probabiliste et non plus dans une phase préalable. Notre objectif est donc de proposer des stratégies innovantes permettant d'intégrer des ressources de mots composés dans deux processus probabilistes combinant l'étiquetage ou l'analyse à la segmentation du texte
APA, Harvard, Vancouver, ISO, and other styles
18

Caza, Nicole. "Contribution des représentations sémantiques et lexicales au rappel sériel immédiat." Thesis, National Library of Canada = Bibliothèque nationale du Canada, 2001. http://www.collectionscanada.ca/obj/s4/f2/dsk3/ftp04/NQ60587.pdf.

Full text
APA, Harvard, Vancouver, ISO, and other styles
19

Théophanous, Olga. "Confusions lexicales dans l'acquisition du vocabulaire d'une langue seconde/étrangère." Thesis, National Library of Canada = Bibliothèque nationale du Canada, 2001. http://www.collectionscanada.ca/obj/s4/f2/dsk3/ftp05/NQ62105.pdf.

Full text
APA, Harvard, Vancouver, ISO, and other styles
20

Bernhard, Delphine. "Apprentissage de connaissances morphologiques pour l'acquisition automatique de ressources lexicales." Phd thesis, Université Joseph Fourier (Grenoble), 2006. http://tel.archives-ouvertes.fr/tel-00119257.

Full text
Abstract:
Les ressources lexico-sémantiques, telles que les thésaurus, les terminologies ou les ontologies, visent à organiser les connaissances en rendant explicites divers types de relations sémantiques comme la synonymie ou la spécialisation. Le coût de la construction manuelle de telles ressources reste élevé, ce qui explique l'essor des méthodes d'acquisition automatique de connaissances, allant de l'extraction des termes représentant les unités de connaissance à l'identification des relations sémantiques qui les relient. Nous nous intéressons dans cette thèse au rôle que peut jouer la morphologie, c'est-à-dire la structure interne des mots, pour l'acquisition de telles connaissances à partir de corpus de textes de spécialité, essentiellement médicaux, et dans une perspective multilingue.

Nous présentons deux systèmes d'acquisition de connaissances morphologiques non supervisés, caractérisés par des approches différentes. Le premier procède par segmentation des mots, tandis que le second regroupe les mots dans des familles morphologiques.

Nous explorons ensuite les utilisations possibles de ce type d'informations pour l'acquisition de termes et de relations sémantiques. Nous proposons notamment une méthode de pondération et de visualisation des mots clés extraits de corpus de textes de spécialité en fonction de leur famille morphologique. Nous définissons également des schémas, basés sur les résultats de la segmentation morphologique, afin de découvrir des relations sémantiques telles que la spécialisation et la cohyponymie.
APA, Harvard, Vancouver, ISO, and other styles
21

Adolf, Paul. "Structures lexicales contrastives du parler d'Obernai et de l'anglais britannique." Lille 3 : ANRT, 1986. http://catalogue.bnf.fr/ark:/12148/cb37594440c.

Full text
APA, Harvard, Vancouver, ISO, and other styles
22

Laurian, Anne-Marie. "Recherches lexicales et syntaxiques sur les discours scientifiques et techniques." Lille 3 : ANRT, 1988. http://catalogue.bnf.fr/ark:/12148/cb37607405w.

Full text
APA, Harvard, Vancouver, ISO, and other styles
23

rossignol, mathias Sébillot Pascale. "Acquisition sur corpus d'informations lexicales fondées sur la sémantique différentielle." [S.l.] : [s.n.], 2005. ftp://ftp.irisa.fr/techreports/theses/2005/rossignol.pdf.

Full text
APA, Harvard, Vancouver, ISO, and other styles
24

Millon, Chrystel. "Acquisition automatique de relations lexicales désambiguïsées à partir du web." Lorient, 2011. http://www.theses.fr/2011LORIL227.

Full text
Abstract:
La dimension phraséologique s'impose dans la production langagière, car les séquences lexicales conventionnelles, que sont spécialement les collocations, assurent la naturalité dans le discours, et facilitent sa compréhension. La naturalité est indépendante de la grammaticalité et de la compatibilité sémantique des mots entre eux dans la chaîne parlée. L'organisation du lexique d'une langue repose ainsi sur des liens syntagmatiques étroits entre les mots. La question de la combinatoire des mots occupe une place importante au sein de plusieurs disciplines comme la Sémantique, la Lexicographie ou la Didactique des langues, favorisant ainsi l'émergence d'outils d'extraction automatique de collocations, laissant transparaître l'intérêt croissant qu'elle suscite. Les méthodes existantes d’extraction automatique de collocations ne tiennent pas compte des acceptions des mots. Or, nous pensons qu’un outil générant une classification sémantique des collocations des mots permet d’obtenir des relations lexicales (du type NOM-ADJECTIF, NOM de NOM, NOM-VERBE, etc. ) beaucoup plus exploitables, parce qu’elles-mêmes catégorisées en fonction des usages. Le sujet de ce mémoire est l'acquisition automatique de base de données sémantiques de collocations à partir de ressources textuelles issues du World Wide Web. Nous présentons une méthode endogène de discrimination sémantique automatique des classes d'usages des mots, au sein desquelles les collocations, basées sur une extraction syntaxique, sont rangées. Les résultats montrent qu'une catégorisation sémantique des collocations permet d'obtenir des collocations pertinentes pour des usages très peu fréquents, alors qu’une extraction indifférenciée « noierait » ces relations au milieu de celles correspondant aux usages les plus fréquents
Phraseological dimension is essential in language use, because conventional lexical sequences, notably collocations, ensure the naturality in the speech and facilitate its comprehension. Naturality is independent of the grammaticality and the semantic compatibility of the words between them in the connected speech. The organization of the language lexicon rests on close syntagmatic links between words. The question of lexical combinatorics occupies an important place within several disciplines, thus supporting the emergence of tools for automatic collocations extraction. Nevertheless, the existing methods of automatic extraction of collocations do not take account of the meanings of the words. However, we think that a tool generating a semantic classification of collocations makes it possible to obtain lexical relations much more exploitable, because themselves categorized according to meanings. The subject of this work is to propose a protocol for automatically building, from the Web, semantic database of collocations of French nouns. An endogenous method of automatic word sense discrimination is elaborated, leading to the construction of a set of semantic classes, filled with significant collocates of the target word. The semantic classes serve to proceed to the automatic categorization within the semantic classes of ‘syntactic’ collocations, that have been extracted from Web corpus. The results show that a semantic categorization of collocations makes it possible to obtain relevant collocations for meanings, notably the ones far from frequent, whereas an undifferentiated extraction “would drown” these relations in those corresponding to the most frequent meanings
APA, Harvard, Vancouver, ISO, and other styles
25

Loffler-Laurian, Anne-Marie. "Recherches lexicales et syntaxiques sur les discours scientifiques et techniques." Paris 3, 1987. http://www.theses.fr/1987PA030010.

Full text
Abstract:
Contrairement a ce que l'on a l'habitude de penser, les discours scientifiques ne se caracterisent pas seulement par des terminologies speciales, et ils ne forment pas un registre de discours ou les differences seraient neutralisees pour faciliter la communication internationale. Tenant compte de ces deux ordres de faits, l'etude est articulee en trois parties: 1 - etudes des discours scientifiques et techniques francais; 2 - etude de ces discours par rapport a la traduction, en particulier automatique; 3 - applications de ces travaux, en particulier a l'enseignement. La premiere partie de l'etude comprend une typologie des textes scientifiques et techniques fondee sur des criteres extra-linguistiques (situation de communication) ainsi qu'une typologie fondee sur des criteres internes tels que la presence de definitions dans les textes. Suit l'etude de quelques vocables particuliers: le verbe etre, le verbe faire, le verbe mesurer et toutes les expressions de la mesure, toutes notions fondamentales dans ces types de discours. En outre, l'etude des pronoms je, nous et on permet une analyse de la presence de l'auteur dans le texte. Dans la seconde partie, portant sur la traduction des discours scientifiques et techniques, en particulier par le moyen de la traduction automatique, une typolo- gie des erreurs subsistant a la sortie de la machine a permis de poser les problemes relatifs a la notion de norme et a celle de qualite de la traduction. Ceux-ci s'integrent dans une reflexion generale de stylistique contrastive du discours specialise et aboutit a une prise de conscience de l'importance du destinataire dans la produc- tion du message scientifique et technique. Enfin sont evoquees succintement quelques possibilites d'applications a l'enseignement des langues et de la traduction specialisee : ces travaux et ces reflexions devraient permettre de renouveler et d'adapter certains enseignements aux besoins actuels
The specificity of scientific and technical texts is not only a large use of special terminologies nor is it a certain kind of international understanding in specialized fields. Starting from these observations, the study focuses on : 1 - a description of the characteristics of the french texts; 2 - a study of the translation of these texts by machine translation; 3 - a look at some applications of these studies. In the first part, a typology of the scientific and technical documents based on the situation of communication is presented, as well a typology based on internal criteria such the presence or not of definitions. Some particular items are examined : the verb etre, the verb faire, the verb mesurer and all other kind of expressions of measurement. These items represent fundamental notions in the type of texts studied. The expression of the author through the use of personal pronouns is also studied. In the second part of the work, the translation of scientific and technical texts, and specially their machine translation, is used as a tool to approach and analyze their specificities. The remaining errors after machine processing make it necessary to post-edit the raw translations. The typology of the errors and a reflexion on the notions of norm and of quality lead to a double practice of post-editing : a conventional one and a rapid one. The study of these post-editions is a part of a larger reflexion on contrastive stylistics dealing with specialized documents. The importance of the receiver of the message has to be stressed in the reflexion. Some applications of this work are finally given : as regards the teaching of a "language for special purpose" or the teaching of the translation of specialized texts this work should lead to renovating and adapting the teaching in order to get it closer to the present needs
APA, Harvard, Vancouver, ISO, and other styles
26

Trybocki, Christine. "Elaboration d'un modèle conceptuel pour les bases de données lexicales." Aix-Marseille 3, 1995. http://www.theses.fr/1995AIX30088.

Full text
Abstract:
Depuis une dizaine d'annees, des equipes scientifiques et des editeurs se penchent sur la transformation des dictionnaires editoriaux en bases de donnees destinees aux applications en langage naturel ou a la diffusion publique sous forme de cd-rom. Notre objectif ici est de decrire un nouveau schema de base de donnees dictionnairiques qui comble les manques des precedents modeles. Avant l'elaboration de ce schema, nous avons pris soin d'observer en detail plusieurs dictionnaires. En raison de leur structuration arbitraire, nous avons mis de cote le concept d'entree et propose une nouvelle unite dictionnairique. Nous avons defini formellement notre modele grace a un outil de reference: sgml, et nous avons choisi une representation informatique basee sur la representation objet. Enfin, nous avons constate sa validite sur un dictionnaire monolingue francais
APA, Harvard, Vancouver, ISO, and other styles
27

rossignol, mathias. "Acquisition sur corpus d'informations lexicales fondées sur la sémantique différentielle." Rennes 1, 2005. https://tel.archives-ouvertes.fr/tel-00524299.

Full text
Abstract:
Certaines applications de TAL requièrent des informations sémantiques spécifiques à un domaine ou à une tâche donnée. Nous présentons en réponse à ce besoin une méthodologie d'acquisition automatique sur corpus d'informations lexicales sémantiques en trois étapes, fondée sur la Sémantique interprétative de F. Rastier. Dans un premier temps, nous parvenons à caractériser et détecter de manière totalement automatique les thèmes abordés dans un corpus, ce qui permet un découpage du vocabulaire en domaines. Les mots de ces domaines sont ensuite classés selon la ressemblance de leurs contextes d'emploi afin de constituer des taxèmes, classes sémantiques de mots de sens très proches. Enfin, nous mettons au jour au sein de ces taxèmes des sèmes spécifiques, différences de sens fines entre mots. Nous combinons au cours de ce travail étude linguistique et mise au point de méthodes statistiques originales afin d'atteindre un degré de définition du sens encore inédit en acquisition automatique.
APA, Harvard, Vancouver, ISO, and other styles
28

Luste-Chaa, Olha. "Les acquisitions lexicales en français langue seconde : conceptions et applications." Thesis, Metz, 2009. http://www.theses.fr/2009METZ023L/document.

Full text
Abstract:
La thèse traite des acquisitions lexicales en français langue étrangère et seconde et plus particulièrement de la notion et du rôle de l'erreur lexicale en tant qu'indicateur et outil d'analyse du niveau de la compétence lexicale chez les apprenants non francophones. En nous appuyant sur les principales recherches dans le domaine de l'enseignement/ apprentissage du lexique en français, nous analysons les notions fondamentales du domaine du lexique, comme lexique, vocabulaire, mot, unité lexicale, accès lexical, et enfin erreur lexicale pour finalement nous concentrer sur cette dernière notion. Qu'est-ce qu’une erreur lexicale et comment doit-elle être appréhendée dans une perspective didactique ? Quelle approche ou méthode l’enseignant doit-il adopter lors d'une tâche de correction face à l'erreur lexicale ? Nous soulevons ainsi le problème d'une typologie d'erreurs, pertinent dans le contexte de la didactique du lexique, et celui de la prise en compte de plusieurs paramètres linguistiques et discursifs lors de l'analyse et du classement des erreurs lexicales. Notre approche par la correction d'une erreur lexicale consiste à adopter le principe de réécriture du segment erroné. Ce procédé permet d'associer l'analyse linguistique à la réflexion didactique. Pour appuyer nos hypothèses, nous avons élaboré notre propre typologie des erreurs lexicales en l'illustrant avec des exemples recensés dans un corpus des 63 productions écrites des étudiants universitaires non francophones
The thesis deals with lexical acquisitions in French as a foreign and second language and more particularly with the notion and the role of lexical error as an indicator and analysis tool of the lexical skill level of not French-speaking learners. By using basic researches in the field of teaching/ learning of the French lexicon, we analyze basic concepts of the lexical field, like lexicon, vocabulary, word, lexeme, lexical access and lexical error, to finally concentrate us on the last concept. What is a lexical error and how should it be apprehended from the didactic point of view? Which approach or method has to adopt a teacher while correcting a lexical error ? We raise in this way the problem of the typology of errors, relevant in the context of didactics of the lexicon, and the problem of taking into consideration some linguistic and discursive parameters during the analysis and the classification of lexical errors. Our approach to a problem of correction of lexical error consists in adopting the principle of rewriting of the erroneous segment. This method allows to associate the linguistic analysis with the didactic reflexion. To support our assumptions, we worked out our own typology of the lexical errors, illustrating it with examples, found in a corpus of 63 written productions of not French-speaking university students
APA, Harvard, Vancouver, ISO, and other styles
29

Tchechmedjiev, Andon. "Interopérabilité Sémantique Multi-lingue des Ressources Lexicales en Données Liées Ouvertes." Thesis, Université Grenoble Alpes (ComUE), 2016. http://www.theses.fr/2016GREAM067/document.

Full text
Abstract:
Lorsqu’il s’agit la construction de ressources lexico-sémantiques multilingues, la première chose qui vient à l’esprit, et la nécessité que les ressources à alignées partagent le même format de données et la même représentations (interopérabilité représentationnelle). Avec l’apparition de standard tels que LMF et leur adaptation au web sémantique pour la production de ressources lexico- sémantiques multilingues en tant que données lexicales liées ouvertes (Ontolex), l’interopérabilité représentationnelle n’est plus un verrou majeur. Cependant, en ce qui concerne l’interopérabilité des alignements multilingues, le choix et la construction du pivot interlingue est l’un des obstacles principaux. Pour nombre de ressources (par ex. BabelNet, EuroWordNet), le choix est fait d’utiliser l’Anglais, ou une autre langue comme pivot interlingue. Ce choix mène à une perte de contraste dans les cas où des sens du Pivot ont des lexicalisations différentes dans la même acception dans plusieurs autres langues. L’utilisation d’une pivot à acceptions interlingues, solution proposée il y a déjà plus de 20 ans, pourrait être viable. Néanmoins, leur construction manuelle est trop ardue du fait du manque d’experts parlant assez de langues et leur construction automatique pose problème du fait de l’absence d’une formalisation et d’une caractérisation axiomatique permettant de garantir leur propriétés. Nous proposons dans cette thèse de d’abord formaliser l’architecture à pivot interlingue par acceptions, en développant une axiomatisation garantissant leurs propriétés. Nous proposons ensuite des algorithmes de construction initiale automatique en utilisant les propriétés combinatoires du graphe des alignements bilingues, mais aussi des algorithmes de mise à jour garantissant l’interopérabilité dynamique. Dans un deuxième temps, nous étudions de manière plus pratique sur DBNary, un extraction périodique de Wiktionary dans de nombreuses éditions de langues, afin de cerner les contraintes pratiques à l’application des algorithmes proposés
When it comes to the construction of multilingual lexico-semantic resources, the first thing that comes to mind is that the resources we want to align, should share the same data model and format (representational interoperability). However, with the emergence of standards such as LMF and their implementation and widespread use for the production of resources as lexical linked data (Ontolex), representational interoperability has ceased to be a major challenge for the production of large-scale multilingual resources. However, as far as the interoperability of sense-level multi-lingual alignments is concerned, a major challenge is the choice of a suitable interlingual pivot. Many resources make the choice of using English senses as the pivot (e.g. BabelNet, EuroWordNet), although this choice leads to a loss of contrast between English senses that are lexicalized with a different words in other languages. The use of acception-based interlingual representations, a solution proposed over 20 years ago, could be viable. However, the manual construction of such language-independent pivot representations is very difficult due to the lack of expert speaking enough languages fluently and algorithms for their automatic constructions have never since materialized, mainly because of the lack of a formal axiomatic characterization that ensures the pre- servation of their correctness properties. In this thesis, we address this issue by first formalizing acception-based interlingual pivot architectures through a set of axiomatic constraints and rules that guarantee their correctness. Then, we propose algorithms for the initial construction and the update (dynamic interoperability) of interlingual acception-based multilingual resources by exploiting the combinatorial properties of pairwise bilingual translation graphs. Secondly, we study the practical considerations of applying our construction algorithms on a tangible resource, DBNary, a resource periodically extracted from Wiktionary in many languages in lexical linked data
APA, Harvard, Vancouver, ISO, and other styles
30

Schwab, Didier. "Approche hybride - lexicale et thématique - pour la modélisation, la détection et l'exploitation des fonctions lexicales en vue de l'analyse sémantique de texte." Phd thesis, Université Montpellier II - Sciences et Techniques du Languedoc, 2005. http://tel.archives-ouvertes.fr/tel-00333334.

Full text
Abstract:
Utilisée à la fois pour l'apprentissage et l'exploitation des vecteurs conceptuels, l'analyse sémantique de texte est centrale à nos recherches. L'amélioration qualitative du processus d'analyse entraîne celle des vecteurs. En retour, cette meilleure pertinence a un effet positif sur l'analyse. Parmi les différentes voies à explorer pour obtenir ce cercle vertueux, l'une des pistes les plus intéressantes semble être la découverte puis l'exploitation des relations lexicales entre les mots du texte. Ces relations, parmi lesquelles la synonymie, l'antonymie, l'hyperonymie, la bonification ou l'intensification, sont modélisables sous la forme de fonctions lexicales. Énoncées essentiellement dans un cadre de production par Igor Mel'čuk, nous cherchons, dans cette thèse, à les adapter à un cadre d'analyse. Nous introduisons ici deux classes de Fonctions Lexicales d'Analyse. Les premières, les FLA de construction permettent de fabriquer un vecteur conceptuel à partir des informations lexicales disponibles. Les secondes, les FLA d'évaluation permettent de mesurer la pertinence d'une relation lexicale entre plusieurs termes. Ces dernières sont modélisables grâce à des informations thématiques (vecteurs conceptuels) et/ou grâce à des informations lexicales (relations symboliques entre les objets lexicaux).

Les informations lexicales sont issues de la base lexicale sémantique dont nous introduisons l'architecture à trois niveaux d'objets lexicaux (item lexical, acception, lexie). Elles sont matérialisées sous la forme de Relations Lexicales Valuées qui traduisent la probabilité d'existence de la relation entre les objets. L'utilité de ces relations a pu être mis en évidence pour l'analyse sémantique grâce à l'utilisation du paradigme des algorithmes à fourmis. Le modèle introduit dans cette thèse, utilise à la fois les vecteurs conceptuels et les relations du réseau lexical pour résoudre une partie des problèmes posés lors d'une analyse sémantique.

Tous nos outils ont été implémentés en Java. Ils reposent sur Blexisma (Base LEXIcale Sémantique Multi-Agent) une architecture multi-agent élaborée au cours de cette thèse dont l'objectif est d'intégrer tout élément lui permettant de créer, d'améliorer et d'exploiter une ou plusieurs Bases Lexicales Sémantiques. Les expériences menées ont montré la faisabilité de cette approche, sa pertinence en termes d'amélioration globale de l'analyse et ouvert des perspectives de recherches fort intéressantes.
APA, Harvard, Vancouver, ISO, and other styles
31

Chaves, Nathalie. "Rôle du traitement visuel simultané dans l'acquisition des connaissances orthographiques lexicales." Phd thesis, Université Toulouse le Mirail - Toulouse II, 2012. http://tel.archives-ouvertes.fr/tel-00728785.

Full text
Abstract:
La connaissance orthographique des mots est indispensable au développement d'une lecture experte et rapide et d'une écriture correcte. L'acquisition de ces connaissances orthographiques lexicales est un processus complexe, encore mal compris. Cette acquisition se ferait en grande partie de façon implicite au cours de la lecture. Elle dépendrait alors de la qualité du décodage, d'autres facteurs restant à préciser. Des données théoriques et certains premiers résultats empiriques ont suggéré que le traitement visuel simultané de toutes les lettres du mot est un facteur important pour l'acquisition de son orthographe spécifique. Dans ce travail de thèse, cette hypothèse est testée d'une part par des études de régression, d'autre part par des études expérimentales. Les analyses de régression étudient le lien entre l'empan visuo-attentionnel (EVA), estimant les capacités maximales de traitement visuel simultané, et les connaissances orthographiques lexicales. Les résultats montrent une relation significative entre l'EVA et les connaissances orthographiques lexicales lorsque celles-ci sont évaluées par une épreuve de production écrite ou par un test d'auto-apprentissage. Cette relation est spécifique aux connaissances lexicales puisqu'elle ne se généralise pas à l'orthographe grammaticale. Elle existe indépendamment des capacités de mémoire de travail visuo-spatiale et de lecture. Les études expérimentales, tant chez l'enfant que chez l'adulte, explorent toutes le rôle du traitement visuel simultané sur l'acquisition des connaissances orthographiques en situation d'auto-apprentissage. Cette exploration est conduite en contrastant, pendant une lecture de mots nouveaux, une condition expérimentale où le traitement visuel simultané est possible avec une autre condition où ce type de traitement est impossible. Les résultats mettent en évidence un avantage de la condition avec traitement visuel simultané possible, sur la mémorisation de l'orthographe des mots nouveaux. Cet avantage n'est pas dû à des différences de temps de présentation ou de temps de traitement des items entre les deux conditions et confirme donc que, au-delà des capacités de lecture-décodage, les capacités de traitement visuel simultané sont directement impliquées dans l'acquisition des connaissances orthographiques lexicales.
APA, Harvard, Vancouver, ISO, and other styles
32

Léon, Stéphanie. "Acquisition automatique de traductions d'unités lexicales complexes à partir du Web." Phd thesis, Université de Provence - Aix-Marseille I, 2008. http://tel.archives-ouvertes.fr/tel-00359235.

Full text
Abstract:
Les systèmes de traduction automatique ont connu des progrès récents avec la prise en compte d'expressions complexes telles que " vol à main armée " ("armed robbery" en anglais). Cependant, dès que l'on sort de ces listes d'expressions figées, on retombe rapidement dans des erreurs de traduction. Par exemple, le traducteur Systran traduit " caisse centrale " par "central case" au lieu de "central fund". Cette expression aurait pu être automatiquement traduite grâce au Web. Le but de cette étude est la création d'une base bilingue français-anglais de traduction automatique d'unités lexicales complexes à partir du Web. Nous axerons notre étude sur les difficultés de traduction telles que la polysémie ou le caractère idiomatique et proposerons des traitements adaptés. Au-delà des aspects linguistiques et technologiques, nous analyserons les utilisations du Web dans le domaine de la linguistique.
APA, Harvard, Vancouver, ISO, and other styles
33

Rouveret, Alain. "Syntaxe des dépendances lexicales identité et identification dans la théorie syntaxique /." Lille 3 : ANRT, 1988. http://catalogue.bnf.fr/ark:/12148/cb37609566v.

Full text
APA, Harvard, Vancouver, ISO, and other styles
34

Laporte, Eric. "Méthodes algorithmiques et lexicales de phonétisation de textes applications au français /." Grenoble 2 : ANRT, 1988. http://catalogue.bnf.fr/ark:/12148/cb376149857.

Full text
APA, Harvard, Vancouver, ISO, and other styles
35

Mohamadou, Aliou. "Classificateurs et représentation des propriétés lexicales en peul : parlers de l'Aadamaawa /." [Vitry-sur-Seine] (1 rue Arthur-Rimbaud, 94400) : Association Linguistique africaine, 1994. http://catalogue.bnf.fr/ark:/12148/cb357157358.

Full text
APA, Harvard, Vancouver, ISO, and other styles
36

Martinet, Catherine. "Le rôle de la phonologie dans l'acquisition des connaissances lexicales orthographiques." Grenoble 2, 2001. http://www.theses.fr/2001GRE29025.

Full text
Abstract:
Les théories d'acquisition de l'orthographe postulent la nécessité pour l'enfant de présenter un niveau métaphonologique minimal et de maîtriser correctement le principe alphabétique, afin de parvenir à acquérir les connaissances lexicales orthographiques. Dans cette thèse, quatre expériences ont été réalisées auprès d'enfants normalement scolarisés, et deux autres auprès de participants présentant une dysorthographie développementale, afin de tester leurs compétences en dictée et leurs capacités métaphonologiques. Deux études ont été réalisées auprès d'étudiants normoscripteurs en situation d'apprentissage de l'orthographe de mots nouveaux. L'analyse des résultats tend à montrer que les connaissances métaphonologiques sont des pré-requis à l'acquisition de l'écriture alphabétique plus qu'orthographique et que les connaissances orthographiques et alphabétiques peuvent se développer en relative indépendance et très précocement.
APA, Harvard, Vancouver, ISO, and other styles
37

Rouveret, Alain. "Syntaxe des dépendances lexicales : identité et identification dans la théorie syntaxique." Paris 7, 1987. http://www.theses.fr/1987PA070121.

Full text
Abstract:
La these proposee s'attache a examiner la question suivante : comment sont representees dans les configurations syntaxiques les relations de dependance thematique entre categories-operateurs et arguments? il s'agit a la fois d'avancer des propositions theoriques specifiques touchant la realisation syntaxique des dependances thematiques, d'operer le depart entre les principes universaux et les grammaires particulieres, a la lumiere des donnees fournies par la recherche comparative et typologique et de confronter les resultats obtenus avec les autres approches courantes au probleme de la realisation, en particulier le modele du gouvernement et du liage, developpe par noam chomsky. On ne peut construire une reponse suffisamment generale au probleme pose sans que soient examines des systemes linguistiques configurationnellement differents du francais ou de l'anglais. Le chapitre iii s'interesse au fonctionnement des relations d'auxiliarite dans les langues romanes. On montre que les proprietes distributionnelles des elements fonctionnant comme auxiliaires dans ces systemes decoulent pour l'essentiel de leur statut lexical : tetes lexicales de plein droit selectionnant un domaine v" comme argument, tetes syntaxiques ou simples specificateurs. Dans le chapitre iv, sont examinees les proprietes de fonctionnement des dependances thematiques dans une langue instanciant la typologie vso, le gallois. Sont successivement analysees les constructions periphrastiques aspectuelles, les constructions verbo-nominales non finies, les constructions absolues, les structures dependantes d'un verbe de perception et les constructions relatives et interrogatives. Le chapitre v considere le fonctionnement des dependances thematiques dans le groupe nominal : on montre que sa description requiert la definition d'une grammaire particuliere, distincte de celle qui est en jeu dans les constructions verbales. Dans le chapitre vi, sont examinees les structures contenant un element expletif dans la position sujet. Le chapitre ii avance plusieurs propositions theoriques qui ne sont pleinement justifiees que dans les chapitres qui suivent. L'analyse assigne un role proeminent a la notion de dependance lexicale, notion qui doit etre tenue distincte de celle de dependance thematique et de dependance syntaxique.
APA, Harvard, Vancouver, ISO, and other styles
38

Mohamadou, Aliou. "Classificateurs et représentation des propriétés lexicales en peul : parlers de l'Aadamaawa." Paris, INALCO, 1991. http://www.theses.fr/1991INAL0001.

Full text
Abstract:
La valeur sémantique des seize classificateurs "primaires" des parlers peuls de l'Aadamaawa (Cameroun, Nigéria, RCA et Tchad) est analysée dans le cadre théorique de la linguistique énonciative culiolienne. Le constituant minimal (CN) est interprété comme participant de deux niveaux de représentation : 1) c'est une représentation de Niveau II (production linguistique matérialisée par le texte). Résultant du repérage d'un terme de la classe des unités lexicales (unités de base) par un terme de la classe des morphèmes nominaux (classificateurs) 2) en tant que tel, le CN est la trace d'une opération qui relève du niveau I (celui des représentations mentales) et qui détermine à l'intérieur du domaine notionnel : niveau-I (celui des représentations mentales) et qui détermine à l'intérieur du domaine notionnel de l'unité de base une classe d'occurrences abstraites définie par des propriétés fondamentales que marquent les classificateurs, notamment : (a) le continu; (b) le discret (ou le discontinu); le dense (c) le dense; (d) le compact l'analyse du cn sous cet angle permet de distinguer deux ensembles de marqueurs : 1) les classificateurs qui marquent un parcours à l'intérieur du domaine notionnel de l'unité de base : (a) parcours sans individuation (parcours lisse) marque par le classificateur de l'indéfini -d'um et par celui du continu non discrétisé -d'am ; (b) parcours avec individuation (parcours rugueux) marque par le classificateur de pluriel indéterminé -d'e et par celui de pluriel déterminé -d'i ; 2) et les classificateurs qui visent une valeur particulière et qui fonctionnent comme des extracteurs : (a) les extracteurs d'unité de série (-nde, -ndu, -ndi); (b) les extracteurs d'unité continue (-ngo, -ngal, -ngol, -ngu, -nge); (c) et les extracteurs d'unité massique (-ko, -ki, -ka, -kal)
The semantic value of the 16 "primary" classifiers of Aadamaawa fulfulde (Cameroon, Nigeria, Cra, Tchad) is analysed within the theoretical framework of enunciative linguistics developed by Antoine Culiodi. The full nominal (fn) is interpreted as participating in two representational levels : 1) it is a level-ii representation (language production materialized through text) resulting from locating relationship between a term belonging to the lexical units class (base units) and a term belonging to the markers class (classifiers); 2) this fn is then a trace of level-i process (mental representations); the operation consists of determinating an abstract occurrences class defined by fundamental properties which mainly are : (a) continuous; (b) discrete (or discontinuous); (c) dense; (d) compact. The analysis of fn from this point of view makes it possible to distinguish two ranges of classifiers : 1) classifiers which mark scanning operations through the notional domain of a base unit : (a) scanning without individuation (smooth scanning) operated by the indefinite classifier -d'um, and by the continuous non discreted classifier - d'am; (b) scanning with individuation (granular scanning) operated by the indeterminate plural classifier -d'e, and by the determinate plural classifier -d'i ; 2) the classifiers which isolate a particular value and which works as extractors : (a) serial units extractors (-nde, -ndu, -ndi); continuous units extractors (-ngo, -ngal, ngol, -ngu, -nge); (c) mass units extractors (-ko, -ki, -ka, -kal)
APA, Harvard, Vancouver, ISO, and other styles
39

Laporte, Eric. "Méthodes algorithmiques et lexicales de phonétisation de textes : applications au français." Paris 7, 1988. http://www.theses.fr/1988PA077095.

Full text
Abstract:
Les méthodes de phonétisation automatique sont exposées. Certaines de ces méthodes sont fondées sur des algorithmes et des systèmes de règles, les autres sur des dictionnaires phonétiques. Un dictionnaire phonémique électronique a été réalise, ainsi que les algorithmes nécessaires a sa gestion et a son utilisation. Sont exposées les solutions qui ont permis de satisfaire deux exigences fondamentales: 1) incorporer dans le dictionnaire un ensemble de mots représentatif du français (64000 entrées); 2) élaborer le contenu phonétique du dictionnaire avec la précision et la cohérence requises pour l'exploitation informatique.
APA, Harvard, Vancouver, ISO, and other styles
40

Léger, Laure. "La discrimination visuelle et sémantique des mots dans les affordances lexicales." Paris 8, 2004. http://www.theses.fr/2004PA082322.

Full text
Abstract:
Les facteurs qui favorisent la reconnaissance et l'identification immédiate de catégories désignées par des mots sont étudiés par l'intermédiaire d'une tâche de recherche visuelle. Notre hypothèse générale est que cette affordance lexicale est déterminée par la discrimination des propriétés visuelles et/ou sémantiques du mot dans son contexte. Les facteurs étudiés sont la structure de présentation, le nombre de mots qui présentent les mêmes propriétés visuelles que la cible, le type de propriétés (couleur ou mise en italique), la fréquence lexicale, la distance sémantique entre la cible et les mots qui l'entourent et la typicalité de cette cible. Les résultats des cinq expérimentations menées précisent quelles sont les propriétés perceptives et sémantiques qui permettent l'émergence d'un mot de son contexte, en fonction de groupement et de différenciation des propriétés relationnelles. Ces résultats sont discutés au regard des différents modèles de détection de cible (Treisman, 1988; Duncan & Humphreys, 1989, Wolfe, 1994), en termes d'apport à l'étude des affordances lexicales et d'ergonomie cognitive des interfaces de types web
Factors which facilitate the immediat recognition and identification of categories indicated by words are studied using a visual search task. Our main assumption is that word affordance is determined by word visual and/or semantic properties discriminability. The study factors are the visual structure, the number of words which share the same visual properties as the target, the properties type (color or italic font), the lexical frequency, the semantic distance between the target and the words which constitued its context and the target typciality. The results of the five experiments conducted specify which are the perceptual and semantic properties which facilitate the word discriminability from its context, according to the grouping and the differentiation of the relational proprerties. These results are discussed with different visual search models (Treisman, 1988 ; Duncan & Humphreys, 1989 and Wolfe, 1994), in terms of the word affordance study contribution and web interface human factors contribution
APA, Harvard, Vancouver, ISO, and other styles
41

BAE, HEE-SOOK. "Structures lexicales, syntaxiques et phonetiques dans deux pieces de j. Tardieu." Strasbourg 2, 1997. http://www.theses.fr/1997STR20026.

Full text
Abstract:
Ce travail est une approche quantitative de l'etude du langage theatral de j. Tardieu. Cette these se compose de deux parties: la quantification des textes litteraires et l'etude statistique. Pour la premiere partie, il faut tout d'abord etablir une norme sur laquelle les donnees seront fondees. Cette norme rend les donnees fiables et utilisables. Pour la deuxieme partie, la structure lexicale, la structure phonique et la liaison entre ces deux structures ont constitue les differentes etapes de notre demarche. Dans l'etude lexicale, nous avons etudie la distribution des vocables et celle des categories grammaticales. La distribution des vocables a permis de voir comment les roles des personnages de chaque piece font ressortir les differents themes, et que le comportement des categories grammaticales refletent nettement a la fois des aspects generaux de la langue et des aspects stylistiques et/ou thematiques des discours. Dans l'etude phonique, nous avons constate que la distribution des frequences des phonemes repond a un critere stylistique, et qu'elle joue un role important dans la structure dramatique. L'etude de la liaison entre la frequence des mots grammaticaux et celle des phonemes nous affirme que l'etude de la distribution des phonemes est plus porteuse de sens si elle est envisagee parallelement avec l'examen des mots grammaticaux
This work adopts a quantitative approach to the study of the theatrical language of j. Tardieu. It procedes in two parts: first, a quantitative analysis of the literary texts followed by a statistical analysis. The first part requires the establishment of a norm as the basis of reliable and usable data. The second part consists of a study of lexical and phonic structures and the relationship between the two. The section on lexical analysis deals with the distribution of words and grammatical categories. The distribution of lexical items sheds light how the characters contribute to the realization of the themes; furthermore, the behaviour of grammatical categories clearly reflects general aspects of language as well as the stylistic and/or thematic aspects of discourses. The phonic study reveals that the frequency distribution of phonemes responds to stylistic criteria as welle as playing an important part in dramatic structure. The study of the relationship between the frequency distribution of grammatical words and phonemes also shows that the study of the distribution of phonemes is more relevant if it is done in conjunction with analysis of grammatical words
APA, Harvard, Vancouver, ISO, and other styles
42

Adolf, Paul. "Structures lexicales contrastives du parler a obernai et de l'anglais britannique." Université Marc Bloch (Strasbourg) (1971-2008), 1985. http://www.theses.fr/1985STR20002.

Full text
APA, Harvard, Vancouver, ISO, and other styles
43

Monteleone, Mario. "Lexicographie et dictionnaires électroniques : des usages linguistiques aux bases de données lexicales." Phd thesis, Université Paris-Est, 2003. http://tel.archives-ouvertes.fr/tel-00627599.

Full text
Abstract:
La thèse de M. Mario Monteleone est intitulée Lexicographie et dictionnaires électroniques. Des usages linguistiques aux bases de donnés lexicales et concerne les rapports (existants et potentiels) entre la lexicographie classique et la linguistique informatique. En particulier, M. Monteleone essaie à établir si certaines limites analytiques de la lexicographie peuvent être dépassées par l'application des méthodes de recherche de la linguistique informatique. Dans ce but, M. Monteleone effectue une analyse détaillée soit des deux disciplines, soit des leurs instruments classiques, i.e. les dictionnaires papier et les dictionnaires électroniques, du point de vue de leurs méthodes de constructions et de leurs domaines d'application. Il en résulte un vade-mecum pour les lexicographes classiques et informatiques, focalisé sur le repérage et le classement des données linguistiques pour la réalisations de dictionnaires papier et électroniques.
APA, Harvard, Vancouver, ISO, and other styles
44

Olsson, Lönn Eva M. "Thérèse Raquin d’Émile Zola : Répétitions lexicales, réseaux sémantiques et leurs traductions suédoises." Doctoral thesis, Stockholms universitet, Institutionen för franska, italienska och klassiska språk, 2013. http://urn.kb.se/resolve?urn=urn:nbn:se:su:diva-89130.

Full text
Abstract:
The subject of this thesis is Emile Zola’s novel Thérèse Raquin (1867). The principal aim is to examine lexical repetitions and their importance for semantic networks. The thesis studies the use of the noun cou and certain of its co-occurrences, as well as the use of colours and their derivatives. Employing the methods of Greimas and Rastier, the study is based upon two analyses, one narratological and the other thematic, an approach which allows us not only to study the importance of lexical repetitions, but also to study another aspect of the writing, Zola’s various sources of inspiration. This approach aids in showing the stylistic profile of the novel from a new perspective. Our second aim concerns the Swedish translations of the text. The degree of equivalence of lexical repetitions and their transmission has been studied in three versions (Wilson, 1884, Bjurman, 1911, and Bouleau, 1953). Our analysis draws on Berman’s and Heldner’s ideas about the critical evaluation of translated literary texts. The results of this thesis show that Zola, in Thérèse Raquin, uses lexical repetitions to create a stylistic effect that not only draws inspiration from literary and artistic sources, but that is also inspired by real events of the time. These stylistic properties, such as the system of colour leitmotivs, must be conveyed in a translation that is to be considered faithful to the original. The findings of this study suggest that there is a dependency between two of the examined versions and that it would be desirable to produce a new Swedish translation of the novel, equivalent to Zola’s text.
Le roman Thérèse Raquin (1867) d’Émile Zola est l’objet d’étude de la présente thèse. Le premier but est d’y examiner des répétitions lexicales et leur importance pour des réseaux sémantiques. Nous y étudions l’emploi du nom cou et certaines de ses co-occurrences, ainsi que des couleurs et leurs dérivés présents. Suivant des méthodes de Greimas et Rastier, l’étude s’effectue au moyen de deux analyses, l’une narratologique, l’autre thématique, ce qui nous permet non seulement d’examiner l’importance des répétitions lexicales, mais aussi d’étudier un aspect supplémentaire de l’écriture, les diverses sources d’inspiration de Zola. Cette approche contribue à montrer, dans une perspective nouvelle, le profil stylistique du roman. Notre deuxième but concerne des traductions suédoises du texte. Dans trois versions (Wilson, 1884, Bjurman, 1911, et Bouleau, 1953), est évalué le degré d’équivalence des répétitions lexicales et la transmission des répétitions lexicales examinées. Pour notre analyse, nous nous servons des idées de Berman et de Heldner, qui traitent le sujet d’évaluation critique de textes littéraires traduits.  Les résultats de la présente thèse montrent que Zola, dans Thérèse Raquin, utilise les répétitions lexicales pour créer un effet de style qui puise son inspiration non seulement dans des sources littéraires et artistiques, mais aussi dans des événements de la réalité de son époque. Ces propriétés stylistiques, comme la systématique des leitmotivs des couleurs, doivent être rendues dans une traduction censée être fidèle à l’original. Les analyses de notre étude évoquent qu’il y a une dépendance entre deux des versions examinées et qu’il est souhaitable de produire une nouvelle traduction suédoise du roman, équivalente au texte de Zola.
APA, Harvard, Vancouver, ISO, and other styles
45

El, moujahid Jamila. "Étude sémantique et lexicographique des unités lexicales : autrement, différemment et autrement dit." Sherbrooke : Université de Sherbrooke, 2004.

Find full text
APA, Harvard, Vancouver, ISO, and other styles
46

Kefalova, Ludmila. "Les unités lexicales complexes : productivité et opacité en français et en bulgare." Nancy 2, 1998. http://www.theses.fr/1998NAN21018.

Full text
Abstract:
Le français et le bulgare ont des traits communs dans leur développement historique, d'où l'intérêt de comparer leur fonctionnement au niveau de la morphologie dérivationnelle. Le traitement propose dans cette thèse se veut adéquat à la fois linguistiquement et psychologiquement. La dérivation productive des unités lexicales, examinée dans une perspective cognitive, a un poids relativement faible par rapport aux régularités partielles dans le lexique. D’autre part, les règles de formation des mots, comme tout phénomène linguistique, sont en évolution et il se peut qu'un même affixe entre en jeu dans de différents types de formations ou que deux affixes indépendants par ailleurs s'appliquent systématiquement en bloc a un type de bases au point de constituer un seul formant dérivationnel. Trois types d'alternances morphologiques entrent en jeu dans le lexique : alternances flexionnelles (entre des bases représentant un même lexème), alternances dérivationnelles productives (qui fonctionnent dans la formation de néologismes) et alternances non productives (qui relient des bases lexicales sans être actives pour de nouvelles formations).
APA, Harvard, Vancouver, ISO, and other styles
47

LETELLIER, SABINE. "Eclair, un systeme d'analyse et de correction lexicales multi-experts et multilexiques." Paris 11, 1993. http://www.theses.fr/1993PA112431.

Full text
Abstract:
Les recherches en matiere d'analyse et de correction lexicales ont essentiellement porte sur la realisation d'outils specialises dans le traitement d'un probleme bien precis (un type de mot ou un type d'erreur) et seuls quelques problemes ont ete etudies. Les systemes concus pour pouvoir analyser et corriger un grand nombre de formes differentes sont extremement rares et leurs competences restent limitees. Partant de ces observations, nous avons concu un systeme multi-experts et multi-lexiques (dedies chacun a un domaine particulier afin de considerer les mots d'usage non courant). Ce systeme est dirige par un superviseur charge de determiner a tout moment les outils les plus prometteurs pour resoudre le probleme courant et de traiter les resultats. La selection s'effectue selon differentes strategies et repose sur des parametres comme le profil de l'utilisateur, le type d'application, les domaines traites, le type du mot, son entourage et des statistiques sur les formes deja rencontrees. Le traitement des resultats consiste a ordonner et filtrer les propositions de correction (ce qui est fait en collaboration avec un analyseur de phrases) et a analyser les resultats partiels. Enfin, nous avons etudie les possibilites de rattrapage des erreurs transformant un mot en un autre mot existant (et donc non detectables au niveau lexical) par collaboration avec un analyseur de phrases
APA, Harvard, Vancouver, ISO, and other styles
48

Macchi, Yves. "Structures lexicales et structures mentales : mécanismes de la néologie en espagnol contemporain." Paris 4, 1988. http://www.theses.fr/1988PA040081.

Full text
Abstract:
Partant d'une analyse critique de la conception saussurienne du signifie lexical, l'auteur démontre que subsiste à côté de la valeur en système, le concept pris dans sa positivité. Ce concept, susceptible d'une saisie analogique instantanée par le lecteur, est au centre de la créativité néologique sémantique, de même que la saisie analogique des signifiants est le support de la néologie sémiotique. Le concept, également nomme réfèrent conceptuel, pour le distinguer du signifie saussurien dépourvu de toute pertinence psychologique pour le lecteur, et le signifiant analogique, nomme analogène, constituent donc le fondement opératoire de la néologie. En un second temps, l'auteur replace la création analogique dans son contexte naturel, l'énoncé, là ou par des mécanismes conjoints de langue et de parole, le mot nouveau apparait. Tout le mécanisme de la nomination et de la figuration, et tout le problème de la liberté du lecteur face aux structures de langue sont, ainsi examines, à la lumière de la rhétorique et de la théorie de l'énonciation. En une troisième partie, sur ces bases théoriques, on analyse la néologie espagnole argotique contemporaine d'un point de vue structuraliste et mentaliste
In the first part of this work, starting from a critical analysis of saussurian conception of lexical "signifie", the author shows that beside the "valeur" in the system, subsists the concept, positively considered. This concept, susceptible of an instantaneous analogival appersoption by the speaker, is the central point of semantiv neological creativity. The concept, also called conceptual referent, to distinguish it from the saussurian signifie that has not any psychological pertinence for the speaker, and the analogical "signifiant", ealled "analogen", constitue se the operative base of neology. In a second time, the author replaces neological creation in its natural context, the "enonce", where, by joint language and speach mechanisms; the new word appears. The whole denomination and figuration mechanism, and the whole problem of speaker's freedom in front of language structures are so examinend, by the light of rhetorie and enunciation theery. In a third part, the theoretical bases which are the analogy and the genetic pattern of the figured "enonce" permit the analyse Spanish neology from a mentalist and structural point of view
APA, Harvard, Vancouver, ISO, and other styles
49

FAVIERE, JEAN MARIE. "Constance et evolution dans l'oeuvre de jacques brel. Etude de statistiques lexicales." Nice, 1999. http://www.theses.fr/1999NICE2012.

Full text
Abstract:
Ce travail permet de tester avec brel le degre d'evolution lexicale d'une oeuvre. Nous avons decoupe notre corpus de 175 chansons en 9 periodes, qui couvrent les annees de la production brelienne (1953 a 1977). Nous avons utilise un logiciel informatique {hyperbase, d'e. Brunet). Une evolution d'ensemble est perceptible, mais il n'y a pas de fracture nette. On le verifie rapidement en recourant au test de l'accroissement lexical : les periodes qui ressortent sont alors la derniere (1977) et, a un moindre degre, la periode 6 (1963-1964). La modestie de notre corpus (un peu plus de 45 000 occurrences, correspondant a un peu moins de 5000 formes) nous permet une etude du vocabulaire organise dans des categories thematiques ou grammaticales. Les evolutions sont plurielles, complexes, parfois contradictoires, mais ne permettent presque jamais d'evacuer les periodes du debut : brel developpe ce qui etait deja en germe dans sa production d'origine. Nous presentons ce qu'on pourrait appeler notre << radiographie >> des chansons de brel en deux volumes ; l'un considere la nature et les hommes, l'autre traite de la fuite du temps et de l'art. Selon la methode preconisee par ch. Muller, nous avons procede a des comparaisons internes (les tranches chronologiques servent a reperer les constances et les evolutions) et a des comparaisons externes (avec des auteurs comme verhaeren ou rimbaud, avec des groupes d'auteurs, et avec l'ensemble des productions poetiques du vingtieme siecle).
APA, Harvard, Vancouver, ISO, and other styles
50

El, moujahid Jamila. "Étude sémantique et lexicographique des unités lexicales autrement, différemment et autrement dit." Mémoire, Université de Sherbrooke, 2004. http://savoirs.usherbrooke.ca/handle/11143/2402.

Full text
Abstract:
Ce mémoire porte sur les unités lexicales autrement, différemment et autrement dit . Ces unités, qui n'ont fait l'objet d'aucune étude lexicographique à ce jour dans l'optique théorique adoptée, à savoir celle du Dictionnaire explicatif et combinatoire, jouent un rôle décisif dans l'organisation discursive. Elles permettent, entre autres, d'établir une comparaison entre la manière d'être ou d'agir de deux personnes ou deux objets (au sens large), de formuler une paraphrase ou encore d'introduire une conséquence. Nous montrerons que ces trois unités sont articulées, dans l'ensemble de leurs sens, autour d'une même notion, celle de la 'différence'.
APA, Harvard, Vancouver, ISO, and other styles
We offer discounts on all premium plans for authors whose works are included in thematic literature selections. Contact us to get a unique promo code!

To the bibliography