Acceder

Bibliografías temáticas / Classification interlinguistique des textes / Tesis

Siga este enlace para ver otros tipos de publicaciones sobre el tema: Classification interlinguistique des textes.

Tesis sobre el tema "Classification interlinguistique des textes"

Autor: Grafiati

Publicado: 2 de julio de 2021

Última modificación: 29 de julio de 2025

Crea una cita precisa en los estilos APA, MLA, Chicago, Harvard y otros

Elija tipo de fuente:

Consulte los 49 mejores tesis para su investigación sobre el tema "Classification interlinguistique des textes".

Junto a cada fuente en la lista de referencias hay un botón "Agregar a la bibliografía". Pulsa este botón, y generaremos automáticamente la referencia bibliográfica para la obra elegida en el estilo de cita que necesites: APA, MLA, Harvard, Vancouver, Chicago, etc.

También puede descargar el texto completo de la publicación académica en formato pdf y leer en línea su resumen siempre que esté disponible en los metadatos.

Explore tesis sobre una amplia variedad de disciplinas y organice su bibliografía correctamente.

1

Mozafari, Marzieh. "Hate speech and offensive language detection using transfer learning approaches." Electronic Thesis or Diss., Institut polytechnique de Paris, 2021. http://www.theses.fr/2021IPPAS007.

Texto completo

Resumen

Une des promesses des plateformes de réseaux sociaux (comme Twitter et Facebook) est de fournir un endroit sûr pour que les utilisateurs puissent partager leurs opinions et des informations. Cependant, l’augmentation des comportements abusifs, comme le harcèlement en ligne ou la présence de discours de haine, est bien réelle. Dans cette thèse, nous nous concentrons sur le discours de haine, l'un des phénomènes les plus préoccupants concernant les réseaux sociaux.Compte tenu de sa forte progression et de ses graves effets négatifs, les institutions, les plateformes de réseaux sociaux et les che

Los estilos APA, Harvard, Vancouver, ISO, etc.

2

Poirier, Damien. "Des textes communautaires à la recommandation." Phd thesis, Université d'Orléans, 2011. http://tel.archives-ouvertes.fr/tel-00597422.

Texto completo

Resumen

La thèse concerne la transformation de données textuelles non structurées en données structurées et exploitables par des systèmes de recommandation. Deux grandes catégories d'informations sont utilisées dans le domaine des moteurs de recommandation : les données descriptives de contenus comme les méta-données ou les tags (filtrage thématique), et les données d'usages qui peuvent être des notes ou encore des pages Web visitées par exemple (filtrage collaboratif). D'autres données sont présentes sur le Web et ne sont pas encore réellement exploitées. Avec l'émergence du Web 2.0, les internautes

Los estilos APA, Harvard, Vancouver, ISO, etc.

3

Bouillot, Flavien. "Classification de textes : de nouvelles pondérations adaptées aux petits volumes." Thesis, Montpellier, 2015. http://www.theses.fr/2015MONTS167.

Texto completo

Resumen

Au quotidien, le réflexe de classifier est omniprésent et inconscient. Par exemple dans le processus de prise de décision où face à un élément (un objet, un événement, une personne) nous allons instinctivement chercher à rapprocher cet élément d'autres similaires afin d'adapter nos choix et nos comportements. Ce rangement dans telle ou telle catégorie repose sur les expériences passées et les caractéristiques de l'élément. Plus les expériences seront nombreuses et les caractéristiques détaillées, plus fine et pertinente sera la décision. Il en est de même lorsqu'il nous faut catégoriser un doc

Los estilos APA, Harvard, Vancouver, ISO, etc.

4

LAVAUR, JEAN-MARC. "Traitement du texte et transfert interlinguistique. Approche psycho-cognitive de la comprehension et de la memorisation de textes en langue maternelle et en langue etrangere." Nice, 1994. http://www.theses.fr/1994NICE2019.

Texto completo

Resumen

Ce travail propose une approche psychologique de la comprehension et de la memorisation de textes lus en langue maternelle et en langue etrangere argumentee par 6 experiences realisees aupres d'etudiants bresiliens apprenant le francais. Dans une premiere serie d'experiences, les observables recueillis lord des activites d'entree (temps de lecture) et de sortie (informations rappelees et verifications d'enonces) mettent en evidence des effets lies au niveau de maitrise de la langue etrangere sur le traitement cognitif des textes. Une deuxieme serie d'experiences met en jeu, parallelement au de

Los estilos APA, Harvard, Vancouver, ISO, etc.

5

Vinot, Romain. "Classification automatique de textes dans des catégories non thématiques." Phd thesis, Télécom ParisTech, 2004. http://pastel.archives-ouvertes.fr/pastel-00000812.

Texto completo

Resumen

La classification automatique de textes était jusqu'à présent employée pour l'indexation documentaire. À travers quatre exemples, nous présentons quelques caractéristiques de nouveaux contextes applicatifs ainsi que leurs conséquences pour les algorithmes existants. Nous mettons en évidence le fait que Rocchio, d'ordinaire peu performant, est particulièrement adapté aux corpus bruités et à une utilisation semi-automatique mais très désavantagé avec des classes définies par plusieurs thèmes. Nous proposons une extension de Rocchio, Rocchio Multi-Prototypes, pour gérer les classes multi-thématiq

Los estilos APA, Harvard, Vancouver, ISO, etc.

6

Vinot, Romain. "Classification automatique de textes dans des catégories non thématiques /." Paris : École nationale supérieure des télécommunications, 2004. http://catalogue.bnf.fr/ark:/12148/cb39294964h.

Texto completo

Los estilos APA, Harvard, Vancouver, ISO, etc.

7

Paquet, Thierry. "Segmentation et classification de mots en reconnaissance optique de textes manuscrits." Rouen, 1992. http://www.theses.fr/1992ROUES007.

Texto completo

Resumen

Les travaux présentés dans ce mémoire abordent les différentes étapes nécessaires à la réalisation d'un logiciel de reconnaissance optique de texte manuscrit provenant d'un scripteur quelconque, dans le cadre d'une application à vocabulaire limité : la lecture automatique des montants littéraux présents sur des chèques bancaires ou postaux. La localisation des mots dans l'image binarisée, première étape du traitement, est réalisée par une méthode d'analyse descendante. De cette façon, il est possible de déterminer au cours du traitement des paramètres utiles pour les traitements suivants : hau

Los estilos APA, Harvard, Vancouver, ISO, etc.

8

Risch, Jean-Charles. "Enrichissement des Modèles de Classification de Textes Représentés par des Concepts." Thesis, Reims, 2017. http://www.theses.fr/2017REIMS012/document.

Texto completo

Resumen

La majorité des méthodes de classification de textes utilisent le paradigme du sac de mots pour représenter les textes. Pourtant cette technique pose différents problèmes sémantiques : certains mots sont polysémiques, d'autres peuvent être des synonymes et être malgré tout différenciés, d'autres encore sont liés sémantiquement sans que cela soit pris en compte et enfin, certains mots perdent leur sens s'ils sont extraits de leur groupe nominal. Pour pallier ces problèmes, certaines méthodes ne représentent plus les textes par des mots mais par des concepts extraits d'une ontologie de domaine,

Los estilos APA, Harvard, Vancouver, ISO, etc.

9

Moulinier, Isabelle. "Une approche de la categorisation de textes par l'apprentissage symbolique." Paris 6, 1996. http://www.theses.fr/1996PA066638.

Texto completo

Resumen

L'objectif principal des travaux presentes dans cette these est de determiner si la classification automatique, en particulier au moyen de l'apprentissage symbolique supervise, peut etre appliquee a la categorisation de documents, tache qui permet d'affecter des categories semantiques a des documents en fonction de leur contenu. Le memoire s'articule autour de deux axes complementaires. L'axe principal consiste a determiner si les techniques d'apprentissage apportent des solutions aux preoccupations de la recherche documentaire, en particulier le filtrage de documents. Dans cette optique, il e

Los estilos APA, Harvard, Vancouver, ISO, etc.

10

Lebboss, Georges. "Contribution à l’analyse sémantique des textes arabes." Thesis, Paris 8, 2016. http://www.theses.fr/2016PA080046/document.

Texto completo

Resumen

La langue arabe est pauvre en ressources sémantiques électroniques. Il y a bien la ressource Arabic WordNet, mais il est pauvre en mots et en relations. Cette thèse porte sur l’enrichissement d’Arabic WordNet par des synsets (un synset est un ensemble de mots synonymes) à partir d’un corpus général de grande taille. Ce type de corpus n’existe pas en arabe, il a donc fallu le construire, avant de lui faire subir un certain nombre de prétraitements.Nous avons élaboré, Gilles Bernard et moi-même, une méthode de vectorisation des mots, GraPaVec, qui puisse servir ici. J’ai donc construit un systèm

Los estilos APA, Harvard, Vancouver, ISO, etc.

11

Friburger, Nathalie. "Reconnaissance automatique des noms propres : application à la classification automatique de textes journalistiques." Tours, 2002. http://www.theses.fr/2002TOUR4011.

Texto completo

Resumen

Dans les textes journalistiques, les noms propres sont très importants pour une compréhension précise du sens des textes, mais ils sont très peu représentés dans les ressources lexicales disponibles. Le travail réalisé ici cherche à automatiser leur extraction et leur catégorisation. Nous avons implanté le système CasSys qui permet l'utilisation de cascade de transducteurs et peut ainsi réaliser de l'analyse syntaxique d'un texte ou de l'extraction d'information. Le système d'extraction de noms propres crée, extracNP, utilise casSys ; les phénomènes d'ambigui͏̈tés, de segmentation et de catégo

Los estilos APA, Harvard, Vancouver, ISO, etc.

12

Bohlman, Philip. "Verkörperung des musikalischen Textes - Zum Verständnis der Musik als Wallfahrt." Bärenreiter Verlag, 1998. https://slub.qucosa.de/id/qucosa%3A36828.

Texto completo

Los estilos APA, Harvard, Vancouver, ISO, etc.

13

Thuault, Simon. "La dissimilation graphique dans les textes égyptiens de l'Ancien Empire : essai de grammatologie cognitive." Thesis, Montpellier 3, 2017. http://www.theses.fr/2017MON30040.

Texto completo

Resumen

La « dissimilation graphique » est une particularité récurrente des écritures égyptiennes, en particulier à l’Ancien Empire (IIIe-VIe dynasties, env. 2700/2150 av. J. C.). À cette époque, la pluralité (aussi bien grammaticale que lexicale) était indiquée par le triplement des sémogrammes, signes investis d’une valeur sémantique et censés permettre la compréhension des lexèmes. De ce fait, si les idéogrammes et classificateurs étaient d’ordinaire répétés trois fois à l’identique, la « dissimilation » désigne les occurrences dans lesquelles ces trois signes sont distincts. Par exemple, si un mot

Los estilos APA, Harvard, Vancouver, ISO, etc.

14

Mercadier, Yves. "Classification automatique de textes par réseaux de neurones profonds : application au domaine de la santé." Thesis, Montpellier, 2020. http://www.theses.fr/2020MONTS068.

Texto completo

Resumen

Cette thèse porte sur l'analyse de données textuelles dans le domaine de la santé et en particulier sur la classification supervisée multi-classes de données issues de la littérature biomédicale et des médias sociaux.Une des difficultés majeures lors de l'exploration de telles données par des méthodes d'apprentissage supervisées est de posséder un jeu de données suffisant en nombre d'exemples pour l'entraînement des modèles. En effet, il est généralement nécessaire de catégoriser les données manuellement avant de réaliser l'étape d'apprentissage. La taille importante des jeux de données rend c

Los estilos APA, Harvard, Vancouver, ISO, etc.

15

Albitar, Shereen. "De l'usage de la sémantique dans la classification supervisée de textes : application au domaine médical." Thesis, Aix-Marseille, 2013. http://www.theses.fr/2013AIXM4343/document.

Texto completo

Resumen

Cette thèse porte sur l’impact de l’usage de la sémantique dans le processus de la classification supervisée de textes. Cet impact est évalué au travers d’une étude expérimentale sur des documents issus du domaine médical et en utilisant UMLS (Unified Medical Language System) en tant que ressource sémantique. Cette évaluation est faite selon quatre scénarii expérimentaux d’ajout de sémantique à plusieurs niveaux du processus de classification. Le premier scénario correspond à la conceptualisation où le texte est enrichi avant indexation par des concepts correspondant dans UMLS ; le deuxième et

Los estilos APA, Harvard, Vancouver, ISO, etc.

16

Nakamura-Delloye, Yayoi. "Alignement automatique de textes parallèles Français-Japonais." Phd thesis, Université Paris-Diderot - Paris VII, 2007. http://tel.archives-ouvertes.fr/tel-00266261.

Texto completo

Resumen

L'alignement automatique consiste à trouver une correspondance entre des unités de textes parallèles. Nous nous intéressons plus particulièrement à la réalisation d'un système qui procède à l'alignement au niveau des propositions, unités profitables dans beaucoup d'applications.<br />La présente thèse est constituée de deux types de travaux : les travaux introducteurs et ceux constituant le noyau central. Ce dernier s'articule autour de la notion de proposition syntaxique.<br />Les travaux introducteurs comprennent l'étude des généralités sur l'alignement ainsi que des travaux consacrés à l'al

Los estilos APA, Harvard, Vancouver, ISO, etc.

17

Dzogang, Fabon. "Représentation et apprentissage à partir de textes pour des informations émotionnelles et pour des informations dynamiques." Paris 6, 2013. http://www.theses.fr/2013PA066253.

Texto completo

Resumen

L'extraction de connaissances automatique à partir de textes consiste àmettre en correspondance une information bas niveau, extraite desdocuments au travers des mots et des groupes de mots, avec uneinformation de plus haut niveau. Les choix de représentation pourdécrire les documents sont alors essentiels et leurs particularitéscontraignent la définition de l'algorithme d'apprentissage mis enoeuvre. Les travaux de cette thèse considèrent ces deux problématiquesd'une part pour des informations émotionnelles, d'autre part pour desinformations dynamiques. Dans une première partie, nous considéron

Los estilos APA, Harvard, Vancouver, ISO, etc.

18

Réhel, Simon. "Catégorisation automatique de textes et cooccurrence de mots provenant de documents non étiquetés." Thesis, Université Laval, 2005. http://www.theses.ulaval.ca/2005/22376/22376.pdf.

Texto completo

Resumen

Ayant pour objectif de rendre un programme informatique capable d’assigner de façon autonome des documents textuels à leur classe d’appartenance, la catégorisation automatique de textes est rendue possible grâce à l’apprentissage supervisé. Un entraînement du programme est effectué sur un ensemble de documents auxquels des étiquettes de catégorie ont déjà été assignées par des humains. Or, la constitution de cet ensemble d’entraînement se révèle un processus long et coûteux. Ce mémoire propose une façon d’améliorer la capacité d’un classificateur à bien accomplir sa tâche dans des situations o

Los estilos APA, Harvard, Vancouver, ISO, etc.

19

Grupe, Gerd. "Zur (Re-)Konstruktion des «Textes». Tabulatur und Notation in der Verschriftlichung oraler Tradition." Bärenreiter Verlag, 1998. https://slub.qucosa.de/id/qucosa%3A37067.

Texto completo

Los estilos APA, Harvard, Vancouver, ISO, etc.

20

Béchet, Nicolas. "Extraction et regroupement de descripteurs morpho-syntaxiques pour des processus de Fouille de Textes." Phd thesis, Université Montpellier II - Sciences et Techniques du Languedoc, 2009. http://tel.archives-ouvertes.fr/tel-00462206.

Texto completo

Resumen

Les mots constituent l'un des fondements des langues naturelles de type indo-européenne. Des corpus rédigés avec ces langues sont alors naturellement décrits avec des mots. Cependant, l'information qu'ils véhiculent seuls est assez réduite d'un point de vue sémantique. Il est en effet primordial de prendre en compte la complexité de ces langues comme par exemple leurs propriétés syntaxiques, lexicales et sémantiques. Nous proposons dans cette thèse de prendre en considération ces propriétés en décrivant un corpus par le biais d'informations syntaxiques permettant de découvrir des connaissances

Los estilos APA, Harvard, Vancouver, ISO, etc.

21

Béchet, Nicolas. "Extraction et regroupement de descripteurs morpho-syntaxiques pour des processus de Fouille de Textes." Phd thesis, Montpellier 2, 2009. http://www.theses.fr/2009MON20222.

Texto completo

Resumen

Les mots constituent l'un des fondements des langues naturelles de type indo-européenne. Des corpus rédigés avec ces langues sont alors naturellement décrits avec des mots. Cependant, l'information qu'ils véhiculent seuls est assez réduite d'un point de vue sémantique. Il est en effet primordial de prendre en compte la complexité de ces langues comme par exemple leurs propriétés syntaxiques, lexicales et sémantiques. Nous proposons dans cette thèse de prendre en considération ces propriétés en décrivant un corpus par le biais d'informations syntaxiques permettant de découvrir des connaissances

Los estilos APA, Harvard, Vancouver, ISO, etc.

22

Turenne, Nicolas. "Apprentissage statistique pour l'extraction de concepts à partir de textes : application au filtrage d'informations textuelles." Phd thesis, Université Louis Pasteur - Strasbourg I, 2000. http://tel.archives-ouvertes.fr/tel-00006210.

Texto completo

Resumen

Cette thèse présente un modèle de construction automatique et approximatif de la représentation du sens d'un texte. On adapte des techniques de documentation automatique à des bases documentaires non indexées. Les techniques classiques reposent sur une indexation vectorielle. Chaque document est représenté par un descripteur, on définit une distance entre ces descripteurs. L'accès aux documents pertinents est basé sur des calculs de proximité entre ces descripteurs. Une structuration du domaine, couvert par des documents, est obtenue par une classification (en anglais « clustering ») faisant a

Los estilos APA, Harvard, Vancouver, ISO, etc.

23

Balikas, Georgios. "Explorer et apprendre à partir de collections de textes multilingues à l'aide des modèles probabilistes latents et des réseaux profonds." Thesis, Université Grenoble Alpes (ComUE), 2017. http://www.theses.fr/2017GREAM054/document.

Texto completo

Resumen

Le texte est l'une des sources d'informations les plus répandues et les plus persistantes. L'analyse de contenu du texte se réfère à des méthodes d'étude et de récupération d'informations à partir de documents. Aujourd'hui, avec une quantité de texte disponible en ligne toujours croissante l'analyse de contenu du texte revêt une grande importance parce qu' elle permet une variété d'applications. À cette fin, les méthodes d'apprentissage de la représentation sans supervision telles que les modèles thématiques et les word embeddings constituent des outils importants.L'objectif de cette dissertat

Los estilos APA, Harvard, Vancouver, ISO, etc.

24

Iltache, Samia. "Modélisation ontologique pour la recherche d'information : évaluation de la similarité sémantique de textes et application à la détection de plagiats." Thesis, Toulouse 2, 2018. http://www.theses.fr/2018TOU20121.

Texto completo

Resumen

L’expansion du web et le développement des technologies de l’information ont contribué à la prolifération des documents numériques en ligne. Cette disponibilité de l’information présente l’avantage de rendre la connaissance accessible à tous mais soulève de nombreux problèmes quant à l’accès à l’information pertinente, répondant à un besoin utilisateur. Un premier problème est lié à l’extraction de l’information utile parmi celle qui est disponible. Un second problème concerne l’appropriation de ces connaissances qui parfois, se traduit par du plagiat. L’objectif de cette thèse est le développ

Los estilos APA, Harvard, Vancouver, ISO, etc.

25

Daniel-Café, Ahmed. "La littérature comorienne de l'île d'Anjouan : Essai de classification et de traduction des genres littéraires oraux et écrits." Paris, INALCO, 2000. http://www.theses.fr/2000INAL0002.

Texto completo

Resumen

Cette étude porte sur la littérature comorienne de l'île d'Anjouan qui possède une variété de genres littéraires oraux (contes, devinettes, proverbes, dictons, slogans, cris de la ville, plaisanteries, "propos"), écrits (poésie, récits, discours, panégyriques, correspondances, généalogies, biographies,. . . ) et d'autres qui sont à la charnière de l'écrit et de l'oral. Les textes présentés ici sont exprimés en arabe, en français, en swahili et surtout en shindzuwani qui est le dialecte comorien de l'île d'Anjouan, traduits ensuite, classés parfois par thèmes, ces textes nous révèlent les diffé

Los estilos APA, Harvard, Vancouver, ISO, etc.

26

Pugeault, Florence. "Extraction dans les textes de connaissances structurées : une méthode fondée sur la sémantique lexicale linguistique." Toulouse 3, 1995. http://www.theses.fr/1995TOU30164.

Texto completo

Resumen

Cette these presente des travaux qui s'inscrivent dans le cadre de l'informatique linguistique et plus precisement dans le domaine de l'extraction de connaissances a partir de textes. Notre but est d'aller au-dela de l'indexation classique par mots-cles en representant l'information retenue comme pertinente sous une forme structuree. Ce projet a fait l'objet d'une collaboration avec la direction des etudes et des recherches d'edf. Pour representer le contenu semantique de textes rediges sans contrainte d'expression, nous avons distingue trois niveaux d'analyse: le niveau pragmatique, le niveau

Los estilos APA, Harvard, Vancouver, ISO, etc.

27

Stavroula, Voyatzi. "Description morphosyntaxique et sémantique des adverbes figés en vue d‟un système d‟analyse automatique des textes grecs." Phd thesis, Université Paris-Est, 2006. http://tel.archives-ouvertes.fr/tel-00626250.

Texto completo

Resumen

Cette recherche a pour objectif la description systématique et formelle des adverbes figés et semi-figés du grec moderne, abrégés ici en adverbes figés (i.e. κέζα ζηα άγξηα κεζάλπρηα/à l‟aube, ην κήλα πνπ δελ έρεη ΢άββαην/la semaine des quatre jeudis). Notre intention est d‟aboutir à une description aussi exhaustive et explicite que possible en vue de l‟analyse automatique de la langue grecque. La méthodologie du lexique-grammaire (M. Gross 1975, 1990a), s‟appuyant sur les principes de la grammaire transformationnelle harisienne, nous a fourni un modèle de description de la langue naturelle ad

Los estilos APA, Harvard, Vancouver, ISO, etc.

28

Mazyad, Ahmad. "Contribution to automatic text classification : metrics and evolutionary algorithms." Thesis, Littoral, 2018. http://www.theses.fr/2018DUNK0487/document.

Texto completo

Resumen

Cette thèse porte sur le traitement du langage naturel et l'exploration de texte, à l'intersection de l'apprentissage automatique et de la statistique. Nous nous intéressons plus particulièrement aux schémas de pondération des termes (SPT) dans le contexte de l'apprentissage supervisé et en particulier à la classification de texte. Dans la classification de texte, la tâche de classification multi-étiquettes a suscité beaucoup d'intérêt ces dernières années. La classification multi-étiquettes à partir de données textuelles peut être trouvée dans de nombreuses applications modernes telles que la

Los estilos APA, Harvard, Vancouver, ISO, etc.

29

Dalloux, Clément. "Fouille de texte et extraction d'informations dans les données cliniques." Thesis, Rennes 1, 2020. http://www.theses.fr/2020REN1S050.

Texto completo

Resumen

Avec la mise en place d'entrepôts de données cliniques, de plus en plus de données de santé sont disponibles pour la recherche. Si une partie importante de ces données existe sous forme structurée, une grande partie des informations contenues dans les dossiers patients informatisés est disponible sous la forme de texte libre qui peut être exploité pour de nombreuses tâches. Dans ce manuscrit, deux tâches sont explorées~: la classification multi-étiquette de textes cliniques et la détection de la négation et de l'incertitude. La première est étudiée en coopération avec le centre hospitalier uni

Los estilos APA, Harvard, Vancouver, ISO, etc.

30

Tagny, Ngompe Gildas. "Méthodes D'Analyse Sémantique De Corpus De Décisions Jurisprudentielles." Thesis, IMT Mines Alès, 2020. http://www.theses.fr/2020EMAL0002.

Texto completo

Resumen

Une jurisprudence est un corpus de décisions judiciaires représentant la manière dont sont interprétées les lois pour résoudre un contentieux. Elle est indispensable pour les juristes qui l'analysent pour comprendre et anticiper la prise de décision des juges. Son analyse exhaustive est difficile manuellement du fait de son immense volume et de la nature non-structurée des documents. L'estimation du risque judiciaire par des particuliers est ainsi impossible car ils sont en outre confrontés à la complexité du système et du langage judiciaire. L'automatisation de l'analyse des décisions permet

Los estilos APA, Harvard, Vancouver, ISO, etc.

31

Fidahoussen, Hassanaly Chaïna. "Entre postures, textes et contexte, pour une réflexion exhaustive sur la littérature orale malgache : pratiques discursives sur le concept d'oralité depuis platon, examen terminologique, génétique et taxinomique de la littérature orale malgache, étude du champ littéraire orale à Madagascare." Paris 13, 2008. http://www.theses.fr/2008PA131036.

Texto completo

Resumen

Cette étude sur la littérature orale malgache est une contribution originale qui cherche à combler un vide théorique, du moins en partie, sur divers aspects peu soulevés ou non, aussi bien par les malgachisants que d’autres chercheurs. Dans un double mouvement entre rappels théoriques et examen du cas malgache, nous embrassons une amplitude extrêmement vaste pour explorer des questions aussi bien universelles que proprement malgaches. À cet effet, nous remontons dans le temps aux époques présocratique et platonicienne, premiers à avoir rationalisé l’art et la littérature. Nous parcourons égale

Los estilos APA, Harvard, Vancouver, ISO, etc.

32

Warintarawej, Pattaraporn. "Automatic Analysis of Blend Words." Thesis, Montpellier 2, 2013. http://www.theses.fr/2013MON20020.

Texto completo

Resumen

Mélanger des parties de mots est une façon qui peut sembler étonnante pour produire de nouvelles formes linguistiques. Cela est devenu une manière très utilisée pour inventer des noms pour le quotidien, les noms de marque, les noms utilisés dans les codes informatiques des logiciels, par exemple avec alicament (aliment and médicament), aspivenin (aspirer and venin). Il existe plusieurs façon de mélanger des mots pour en former d'autres, ce qui rend difficile l'analyse des mots produits. Dans cette thèse, nous nous proposons une approche d'analyse automatique des évocations de mots produits à l

Los estilos APA, Harvard, Vancouver, ISO, etc.

33

Wei, Zhihua. "The research on chinese text multi-label classification." Thesis, Lyon 2, 2010. http://www.theses.fr/2010LYO20025/document.

Texto completo

Resumen

Text Classification (TC) which is an important field in information technology has many valuable applications. When facing the sea of information resources, the objects of TC are more complicated and diversity. The researches in pursuit of effective and practical TC technology are fairly challenging. More and more researchers regard that multi-label TC is more suited for many applications. This thesis analyses the difficulties and problems in multi-label TC and Chinese text representation based on a mass of algorithms for single-label TC and multi-label TC. Aiming at high dimensionality in fea

Los estilos APA, Harvard, Vancouver, ISO, etc.

34

Abdaoui, Amine. "Fouille des médias sociaux français : expertise et sentiment." Thesis, Montpellier, 2016. http://www.theses.fr/2016MONTT249/document.

Texto completo

Resumen

Les médias sociaux ont changé notre manière de communiquer entre individus, au sein des organisations et des communautés. La disponibilité de ces données sociales ouvre de nouvelles opportunités pour comprendre et influencer le comportement des utilisateurs. De ce fait, la fouille des médias sociaux connait un intérêt croissant dans divers milieux scientifiques et économiques. Dans cette thèse, nous nous intéressons spécifiquement aux utilisateurs de ces réseaux et cherchons à les caractériser selon deux axes : (i) leur expertise et leur réputation et (ii) les sentiments qu’ils expriment.De ma

Los estilos APA, Harvard, Vancouver, ISO, etc.

35

Salah, Aghiles. "Von Mises-Fisher based (co-)clustering for high-dimensional sparse data : application to text and collaborative filtering data." Electronic Thesis or Diss., Sorbonne Paris Cité, 2016. https://wo.app.u-paris.fr/cgi-bin/WebObjects/TheseWeb.woa/wa/show?t=1858&f=11557.

Texto completo

Resumen

La classification automatique, qui consiste à regrouper des objets similaires au sein de groupes, également appelés classes ou clusters, est sans aucun doute l’une des méthodes d’apprentissage non-supervisé les plus utiles dans le contexte du Big Data. En effet, avec l’expansion des volumes de données disponibles, notamment sur le web, la classification ne cesse de gagner en importance dans le domaine de la science des données pour la réalisation de différentes tâches, telles que le résumé automatique, la réduction de dimension, la visualisation, la détection d’anomalies, l’accélération des mo

Los estilos APA, Harvard, Vancouver, ISO, etc.

36

Salah, Aghiles. "Von Mises-Fisher based (co-)clustering for high-dimensional sparse data : application to text and collaborative filtering data." Thesis, Sorbonne Paris Cité, 2016. http://www.theses.fr/2016USPCB093/document.

Texto completo

Resumen

La classification automatique, qui consiste à regrouper des objets similaires au sein de groupes, également appelés classes ou clusters, est sans aucun doute l’une des méthodes d’apprentissage non-supervisé les plus utiles dans le contexte du Big Data. En effet, avec l’expansion des volumes de données disponibles, notamment sur le web, la classification ne cesse de gagner en importance dans le domaine de la science des données pour la réalisation de différentes tâches, telles que le résumé automatique, la réduction de dimension, la visualisation, la détection d’anomalies, l’accélération des mo

Los estilos APA, Harvard, Vancouver, ISO, etc.

37

Pilana, Liyanage Vijini. "Detection of automatically generated academic Content." Electronic Thesis or Diss., Paris 13, 2024. http://www.theses.fr/2024PA131014.

Texto completo

Resumen

Dans cette thèse, nous avons concentré notre intérêt sur l'identification de technologies/méthodologies de détection de contenus académiques générés artificiellement. Les principales contributions de cette thèse sont triples. Tout d'abord, nous avons construit plusieurs corpus composés de textes académiques générés automatiquement. Dans cette tâche, nous avons utilisé plusieurs derniers modèles NLG pour la tâche de génération. Ces corpus contiennent des contenus entièrement générés ainsi que des contenus composés de manière hybride (avec intervention humaine). Ensuite, nous avons utilisé plusi

Los estilos APA, Harvard, Vancouver, ISO, etc.

38

Morbieu, Stanislas. "Leveraging textual embeddings for unsupervised learning." Electronic Thesis or Diss., Université Paris Cité, 2020. http://www.theses.fr/2020UNIP5191.

Texto completo

Resumen

Les données textuelles constituent un vivier d'information exploitable pour de nombreuses entreprises. En particulier, le web fournit une source quasiment inépuisable de données textuelles qui peuvent être utilisées à profit pour des systèmes de recommandation, de veille, de recherche d'information, etc. Les récentes avancées en traitement du langage naturel ont permit de capturer le sens des mots dans leur contexte afin d'améliorer les systèmes de traduction, de résumés, ou encore le regroupement de documents suivant des catégories prédéfinies. La majorité de ces applications reposent cependa

Los estilos APA, Harvard, Vancouver, ISO, etc.

39

El, Jed Olfa. "WebSum : système de résumé automatique de réponses des moteurs de recherche." Toulouse 3, 2006. http://www.theses.fr/2006TOU30145.

Texto completo

Resumen

Cette thèse s’inscrit dans le cadre général de la recherche d’information et plus précisément, dans le cadre de la classification et l’organisation des documents Web. Notre objectif est de développer un système de résumé automatique des réponses d’un moteur de recherche dans un style encyclopédique (WebSum). Ce type de résumé vise à classer les réponses issues d’une recherche d’information à l’aide d’un moteur de recherche, selon les différents thèmes ou ce que nous appelons dans nos travaux, les facettes de la requête utilisateur. Pour réaliser cet objectif, nous proposons : Une méthode d’ide

Los estilos APA, Harvard, Vancouver, ISO, etc.

40

Ailem, Melissa. "Sparsity-sensitive diagonal co-clustering algorithms for the effective handling of text data." Thesis, Sorbonne Paris Cité, 2016. http://www.theses.fr/2016USPCB087.

Texto completo

Resumen

Dans le contexte actuel, il y a un besoin évident de techniques de fouille de textes pour analyser l'énorme quantité de documents textuelles non structurées disponibles sur Internet. Ces données textuelles sont souvent représentées par des matrices creuses (sparses) de grande dimension où les lignes et les colonnes représentent respectivement des documents et des termes. Ainsi, il serait intéressant de regrouper de façon simultanée ces termes et documents en classes homogènes, rendant ainsi cette quantité importante de données plus faciles à manipuler et à interpréter. Les techniques de classi

Los estilos APA, Harvard, Vancouver, ISO, etc.

41

Ailem, Melissa. "Sparsity-sensitive diagonal co-clustering algorithms for the effective handling of text data." Electronic Thesis or Diss., Sorbonne Paris Cité, 2016. http://www.theses.fr/2016USPCB087.

Texto completo

Resumen

Dans le contexte actuel, il y a un besoin évident de techniques de fouille de textes pour analyser l'énorme quantité de documents textuelles non structurées disponibles sur Internet. Ces données textuelles sont souvent représentées par des matrices creuses (sparses) de grande dimension où les lignes et les colonnes représentent respectivement des documents et des termes. Ainsi, il serait intéressant de regrouper de façon simultanée ces termes et documents en classes homogènes, rendant ainsi cette quantité importante de données plus faciles à manipuler et à interpréter. Les techniques de classi

Los estilos APA, Harvard, Vancouver, ISO, etc.

42

Ramiandrisoa, Iarivony. "Extraction et fouille de données textuelles : application à la détection de la dépression, de l'anorexie et de l'agressivité dans les réseaux sociaux." Thesis, Toulouse 3, 2020. http://www.theses.fr/2020TOU30191.

Texto completo

Resumen

Notre recherche porte essentiellement sur des tâches ayant une finalité applicative : détection de la dépression et de l'anorexie d'une part et détection de l'agressivité d'autre part ; cela à partir de messages postés par des utilisateurs de plates-formes de type réseaux sociaux. Nous avons également proposé une méthode non supervisée d'extraction de termes-clés. Notre première contribution porte sur l'extraction automatique de termes-clés dans des documents scientifiques ou articles de presse. Plus précisément, nous améliorons une méthode non supervisée à base de graphes. Nous avons évalué n

Los estilos APA, Harvard, Vancouver, ISO, etc.

43

Bossard, Aurélien. "Contribution au résumé automatique multi-documents." Phd thesis, Université Paris-Nord - Paris XIII, 2010. http://tel.archives-ouvertes.fr/tel-00573567.

Texto completo

Resumen

Que ce soit pour des professionnels qui doivent prendre connaissance du contenu de documents en un temps limité ou pour un particulier désireux de se renseigner sur un sujet donné sans disposer du temps nécessaire pour lire l'intégralité des textes qui en traitent, le résumé est une aide contextuelle importante. Avec l'augmentation de la masse documentaire disponible électroniquement, résumer des textes automatiquement est devenu un axe de recherche important dans le domaine du traitement automatique de la langue. La présente thèse propose une méthode de résumé automatique multi-documents fond

Los estilos APA, Harvard, Vancouver, ISO, etc.

44

Li, Haoyuan. "Extraction de séquences inattendues : des motifs séquentiels aux règles d'implication." Phd thesis, Université Montpellier II - Sciences et Techniques du Languedoc, 2009. http://tel.archives-ouvertes.fr/tel-00431117.

Texto completo

Resumen

Les motifs séquentiels peuvent être vus comme une extension de la notion d'itemsets fréquents intégrant diverses contraintes temporelles. La recherche de tels motifs consiste ainsi à extraire des enchaînements d'ensembles d'items, couramment associés sur une période de temps bien spécifiée. La construction de règles à partir de ces motifs séquentiels permet d'étendre la notion de règles d'association pour la pris en compte de la temporalité. En fait, cette recherche met en évidence des associations inter-transactions, contrairement à celle des règles d'association qui extrait des combinaisons

Los estilos APA, Harvard, Vancouver, ISO, etc.

45

Kayar, Abdul-Monim al. "1 SECTEUR BANCAIRE ESPAGNOL ET SECTEURS BANCAIRES DE LA C. E. E. 2 ANALYSE D'UN TABLEAU DECRIVANT 74 STATIONS THERMALES FRANCAISES. 3 Classification d'un ensemble varié de textes français d'après les occurences de mots pleins. 4 MESURE DU BORD ET MESURE DU VOLUME POUR UNE REUNION DE BOULES DE MEME RAYON. 5 REPRESENTATION D'UN ENSEMBLE I MUNI DE MASSES ET DISTANCES PAR LE NUAGE, N(I), ASSOCIE A UN TABLEAU DE CORRESPONDANCE." Paris 6, 1995. http://www.theses.fr/1995PA066242.

Texto completo

Resumen

Secteur bancaire espagnol et secteurs bancaires de la c. E. E. On considere successivement: les banques des divers pays de la cee, dont l'espagne, du point de vue de la productivite et de la penetration du marche ; les profils de profits et pertes de ces banques ; et, les bilans compares des banques et des caisses d'epargne d'espagne. Analyse d'un tableau decrivant 74 stations thermales francaises. Le tableau de base recense, en termes de presence-absence, d'une part, les indications therapeutiques de chaque station ; et, d'autre part, les constituants mineraux notables de l'eau ; a quoi s'ajo

Los estilos APA, Harvard, Vancouver, ISO, etc.

46

Langlois, Alexis. "Classification automatique de textes pour les revues de littérature mixtes en santé." Thèse, 2016. http://hdl.handle.net/1866/19109.

Texto completo

Resumen

Les revues de littérature sont couramment employées en sciences de la santé pour justifier et interpréter les résultats d’un ensemble d’études. Elles permettent également aux chercheurs, praticiens et décideurs de demeurer à jour sur les connaissances. Les revues dites systématiques mixtes produisent un bilan des meilleures études portant sur un même sujet tout en considérant l’ensemble des méthodes de recherche quantitatives et qualitatives. Leur production est ralentie par la prolifération des publications dans les bases de données bibliographiques et la présence accentuée de travaux non sci

Los estilos APA, Harvard, Vancouver, ISO, etc.

47

Schulze, Sandra. "Erstellung eines Textes für das Stadtführerprojekt von VERSO: Projektarbeit im Rahmen einer kombinierten Arbeit." 2021. https://tud.qucosa.de/id/qucosa%3A74047.

Texto completo

Resumen

Zielstellung der Teilnahme an dem Projekt ist es, einen Beitrag für einen leicht verständlichen Stadtführer zu erstellen. Dieser Stadtführer richtet sich an Mig-rant:innen, Menschen mit Lernschwierigkeiten sowie an ausländische Besucher:innen in Dresden. Bisher existieren weder ein einheitliches Layout noch weitläufige Einschränkungen bezüglich der Themenwahl. Zu beachten ist lediglich, dass Studierende im Rahmen eines vorangegangenen Seminars bereits einige zufriedenstellende Beiträge erstellt haben.:1. Vorstellung des Projektes und Zielsetzung 2 2. Textproduktion im Bereich der verständniso

Los estilos APA, Harvard, Vancouver, ISO, etc.

48

Lu, Zhibin. "VGCN-BERT : augmenting BERT with graph embedding for text classification : application to offensive language detection." Thesis, 2020. http://hdl.handle.net/1866/24325.

Texto completo

Resumen

Le discours haineux est un problème sérieux sur les média sociaux. Dans ce mémoire, nous étudions le problème de détection automatique du langage haineux sur réseaux sociaux. Nous traitons ce problème comme un problème de classification de textes. La classification de textes a fait un grand progrès ces dernières années grâce aux techniques d’apprentissage profond. En particulier, les modèles utilisant un mécanisme d’attention tel que BERT se sont révélés capables de capturer les informations contextuelles contenues dans une phrase ou un texte. Cependant, leur capacité à saisir l’informa

Los estilos APA, Harvard, Vancouver, ISO, etc.

49

Samson, Anne-Renée. "Extraction automatique et visualisation des thèmes abordés dans des résumés de mémoires et de thèses en anthropologie au Québec, de 1985 à 2009." Thèse, 2013. http://hdl.handle.net/1866/10440.

Texto completo

Resumen

S’insérant dans les domaines de la Lecture et de l’Analyse de Textes Assistées par Ordinateur (LATAO), de la Gestion Électronique des Documents (GÉD), de la visualisation de l’information et, en partie, de l’anthropologie, cette recherche exploratoire propose l’expérimentation d’une méthodologie descriptive en fouille de textes afin de cartographier thématiquement un corpus de textes anthropologiques. Plus précisément, nous souhaitons éprouver la méthode de classification hiérarchique ascendante (CHA) pour extraire et analyser les thèmes issus de résumés de mémoires et de thèses octroyés de 19

Los estilos APA, Harvard, Vancouver, ISO, etc.

Ofrecemos descuentos en todos los planes premium para autores cuyas obras están incluidas en selecciones literarias temáticas. ¡Contáctenos para obtener un código promocional único!