Дисертації з теми "Classification des motifs"

Щоб переглянути інші типи публікацій з цієї теми, перейдіть за посиланням: Classification des motifs.

Оформте джерело за APA, MLA, Chicago, Harvard та іншими стилями

Оберіть тип джерела:

Ознайомтеся з топ-50 дисертацій для дослідження на тему "Classification des motifs".

Біля кожної праці в переліку літератури доступна кнопка «Додати до бібліографії». Скористайтеся нею – і ми автоматично оформимо бібліографічне посилання на обрану працю в потрібному вам стилі цитування: APA, MLA, «Гарвард», «Чикаго», «Ванкувер» тощо.

Також ви можете завантажити повний текст наукової публікації у форматі «.pdf» та прочитати онлайн анотацію до роботи, якщо відповідні параметри наявні в метаданих.

Переглядайте дисертації для різних дисциплін та оформлюйте правильно вашу бібліографію.

1

Piipari, Matias. "Inference and classification of eukaryotic cis-regulatory motifs." Thesis, University of Cambridge, 2011. http://ethos.bl.uk/OrderDetails.do?uin=uk.bl.ethos.609801.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
2

Gay, Dominique. "Calcul de motifs sous contraintes pour la classification supervisée." Phd thesis, Université de Nouvelle Calédonie, 2009. http://tel.archives-ouvertes.fr/tel-00516706.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
Ces dernières années, l'extraction de motifs locaux (itemsets fréquents et règles d'association) a suscité beaucoup d'entrain pour la classification supervisée. Cette thèse traite du calcul et de l'usage de motifs sous contraintes pour la classification supervisée. Nous nous attaquons à deux problèmes difficiles en classification supervisée à base de motifs et proposons deux contributions méthodologiques : D'un côté, lorsque les attributs sont bruités, les performances des classifieurs peuvent être désastreuses. Les méthodes existantes consistent à corriger les valeurs d'attributs ou supprimer les objets bruités -- ce qui génère une perte d'information. Dans ce mémoire, nous proposons une méthode générique de construction de descripteurs robustes au bruit d'attributs -- sans modifier les valeurs d'attributs ni supprimer les objets bruités. Notre approche se déroule en deux étapes : premièrement nous extrayons l'ensemble des règles delta-fortes de caractérisation. Ces règles offrent des propriétés de corps minimal, de non-redondance et sont basées sur les itemsets delta-libres et leur delta-fermeture -- qui ont déjà fait leur preuve pour la caractérisation de groupements dans des contextes bruités. Deuxièmement, nous construisons un nouveau descripteur numérique robuste pour chaque règle extraite. Les expérimentations menées dans des données bruitées, montrent que des classifieurs classiques sont plus performants en terme de précision sur les données munies des nouveaux descripteurs que sur les données avec les attributs originaux. D'autre part, lorsque la distribution des classes est inégale, les approches existantes de classification à base de motifs ont tendance à être biaisées vers la classe majoritaire. La précision sur la (ou les) classe(s) majoritaire(s) est alors élevée au détriment de la précision sur la (ou les) classe(s) minoritaire(s). Nous montrons que ce problème est dû au fait que les approches existantes ne tiennent pas compte de la répartition des classes et/ou de la fréquence relative des motifs dans chacune des classes de la base. Pour pallier ce problème, nous proposons un nouveau cadre de travail dans lequel nous extrayons un nouveau type de motifs : les règles de caractérisation One-Versus-Each (OVE-règles). Ce nouveau cadre de travail nécessite le paramétrage d'un nombre conséquent de seuils de fréquence et d'infréquence. Pour ce faire, nous proposons un algorithme d'optimisation de paramètres, fitcare ainsi qu'un algorithme d'extraction d'OVE-règles. Les expérimentations menées sur des données UCI multi-classes disproportionnées et sur des données de diagnostic de méningite aigüe, montrent que notre approche fitcare est plus performante que les approches existantes en terme de précision sur les classes mineures. L'application de notre méthode de classification associative à l'analyse de données d'érosion des sols en Nouvelle-Calédonie a mis en évidence l'intérêt de notre proposition pour caractériser les phénomènes d'érosion.
3

Claudon, Nicolas. "Classification automatique des diatomées : une approche par les motifs des structures internes /." Thèse, Trois-Rivières : Université du Québec à Trois-Rivières, 2007. http://www.uqtr.ca/biblio/notice/resume/30024826R.pdf.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
4

Claudon, Nicolas. "Classification automatique des diatomées : une approche par les motifs des structures internes." Thèse, Université du Québec à Trois-Rivières, 2007. http://depot-e.uqtr.ca/1244/1/030024826.pdf.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
5

Pensa, Ruggero Gaetano Boulicaut Jean-François Robardet Céline. "Un Cadre générique pour la co-classification sous contraintes application à l'analyse du transcriptome /." Villeurbanne : Doc'INSA, 2007. http://docinsa.insa-lyon.fr/these/pont.php?id=pensa.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
6

Pensa, Ruggero Gaetano. "Un Cadre générique pour la co-classification sous contraintes : application à l'analyse du transcriptome." Lyon, INSA, 2006. http://theses.insa-lyon.fr/publication/2006ISAL0078/these.pdf.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
La recherche de groupements intéressants dans les données booléennes (ensembles d'objets décrits par un ensemble de propriétés) a motivé la conception de méthodes d'extractions de motifs globaux (partitions) et de motifs locaux (ensembles fréquents, règles d'association et concepts formels). Cette thèse concerne la co-classification c'est-à-dire le calcul de bi-partitions (couplage de partitions sur les deux dimensions). Les algorithmes de co-classification disponibles ne permettent aux analystes d'exploiter leur connaissance du domaine qu'à travers un nombre réduit de paramètres. D'autre part, les techniques d'extraction de motifs locaux produisent d'énormes collections qui sont difficilement exploitables et interprétables. Nous avons développé une nouvelle méthode de co-classification qui calcule des bi-partitions à partir de motifs capturant des associations localement fortes (e. G. , des concepts formels, une forme de motif tolérant aux exceptions appelé delta-bi-ensemble). Le principe consiste à exploiter l'information contenue dans la collection des motifs locaux en la propageant au niveau global pour faciliter l'optimisation de la fonction objectif. Il devient alors possible de propager un certain nombre de contraintes depuis l'extraction des motifs locaux jusqu'à la construction de la bi-partition (e. G. , pour imposer des formes particulières aux groupes calculés). Il s'agit donc d'une contribution au domaine très récent de la classification sous contraintes. Une approche duale consiste à utiliser des motifs locaux pour faciliter l'interprétation de bi-partitions déjà calculées. Pour ce faire, nous proposons une méthode de caractérisation des bi-clusters au moyen de motifs locaux auxquels sont associés des mesures d'intérêt. L'application de nos méthodes à l'analyse de données d'expression de gènes a montré la pertinence de nos propositions pour expliciter des hypothèses biologiques plausibles
The search for interesting groups in boolean data (sets of objects described by sets of properties) has motivated the design of methods for computing global patterns (e. G. . , partitions), and extracting local patterns s(e. G. , frequent itemsets, association rules, formal concepts. This thesis concerns co-clustering, i. E. , computing bi-partitions (coupled partitions on both dimensions). When using available co-clustering algorithms, the user can hardly exploit his/her domain knowledge since he/she has limited possibilities for setting just a few parameters. On the other hand, classical local pattern mining techniques usually provide huge collections of patterns that are hard to evaluate and interpret. We have designed a new co-clustering framework which computes a bi-partition by starting from collections of patterns that capture locally strong associations (e. G. , formal concepts, delta-bi-set that are a form of fault-tolerant patterns). The idea is that the available information about the local patterns can be exploited to build a relevant global pattern. It becomes possible to consider the declarative specification of constraints on the bi-partitions (e. G. , user-defined requirements about the shape of clusters) and to use such constraints at the local pattern mining step and then during the co-clustering phase. As such, our proposal is a contribution to the recent domain of constraint-based clustering. A dual approach consists in using local patterns to interpret bi-partitions. We propose a method for bi-cluster characterization by means of local patterns and their associated interestingness measures. The application of our methods to a gene expression data analysis scenario has illustrated the added-value of our proposal to give rise to plausible biological hypothesis
7

Gosselin, Stéphane. "Recherche de motifs fréquents dans une base de cartes combinatoires." Phd thesis, Université Claude Bernard - Lyon I, 2011. http://tel.archives-ouvertes.fr/tel-00838571.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
Une carte combinatoire est un modèle topologique qui permet de représenter les subdivisions de l'espace en cellules et les relations d'adjacences et d'incidences entre ces cellules en n dimensions. Cette structure de données est de plus en plus utilisée en traitement d'images, mais elle manque encore d'outils pour les analyser. Notre but est de définir de nouveaux outils pour les cartes combinatoires nD. Nous nous intéressons plus particulièrement à l'extraction de sous-cartes fréquentes dans une base de cartes. Nous proposons deux signatures qui sont également des formes canoniques de cartes combinatoires. Ces signatures ont chacune leurs avantages et leurs inconvénients. La première permet de décider de l'isomorphisme entre deux cartes en temps linéaire, en contrepartie le coût de stockage en mémoire est quadratique en la taille de la carte. La seconde signature a un coût de stockage en mémoire linéaire en la taille de la carte, cependant le temps de calcul de l'isomorphisme est quadratique. Elles sont utilisables à la fois pour des cartes connexes, non connexes, valuées ou non valuées. Ces signatures permettent de représenter une base de cartes combinatoires et de rechercher un élément de manière efficace. De plus, le temps de recherche ne dépend pas du nombre de cartes présent dans la base. Ensuite, nous formalisons le problème de recherche de sous-cartes fréquentes dans une base de cartes combinatoires nD. Nous implémentons deux algorithmes pour résoudre ce problème. Le premier algorithme extrait les sous-cartes fréquentes par une approche en largeur tandis que le second utilise une approche en profondeur. Nous comparons les performances de ces deux algorithmes sur des bases de cartes synthétiques. Enfin, nous proposons d'utiliser les motifs fréquents dans une application de classification d'images. Chaque image est décrite par une carte qui est transformée en un vecteur représentant le nombre d'occurrences des motifs fréquents. À partir de ces vecteurs, nous utilisons des techniques classiques de classification définies sur les espaces vectoriels. Nous proposons des expérimentations en classification supervisée et non supervisée sur deux bases d'images.
8

Grunert, Steffen. "Strukturelles und funktionelles Verständnis von Membranproteinen im Kontext sequenzmotivbasierter Methoden." Doctoral thesis, Saechsische Landesbibliothek- Staats- und Universitaetsbibliothek Dresden, 2017. http://nbn-resolving.de/urn:nbn:de:bsz:14-qucosa-229383.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
Die vorliegende Arbeit wurde im Rahmen einer kooperativen Promotion zwischen der TU Dresden und der Hochschule Mittweida angefertigt. In dieser werden neuartige, computerorientierte Ansätze für die Analyse von Membranproteinen vorgestellt. Membranproteine sind von essentieller Bedeutung für eine Vielzahl biologischer Prozesse innerhalb eines Organismus und stellen wichtige Zielmoleküle für eine breite Palette von Pharmazeutika dar. Ihre Sequenzen liefern wertvolle und teilweise noch nicht entschlüsselte Informationen über die dreidimensionale Struktur und funktionale Eigenschaften. Innerhalb der Proteomik und Genomik stellen Analysen an Membranproteinstrukturen einen wichtigen Teil für das Verständnis komplexer biologischer Prozesse dar. Im Zuge von Untersuchungen an Membranproteinen konnte eine Vielzahl kurzer wiederkehrender Muster, sogenannte Motive, in den Sequenzen von Membranproteinen beobachtet werden. Diese Motive unterstützen das Verständnis, wie sich Membranproteine in der Zellmembran falten. Im Fokus dieser Arbeit stehen derartige Sequenzmotive. Innerhalb von drei Projekten bilden ausschließlich sequenzmotivbasierte Ansätze die Grundlage für nähere Untersuchungen an Membranproteinstrukturen. Letztendlich liefern die in dieser Arbeit postulierten Methoden wertvolle Erkenntnisse über die strukturelle und funktionelle Rolle von Sequenzmotiven, auf deren Grundlage dazu beigetragen wird, den komplexen Aufbau von Membranproteinen besser verstehen zu können. Generell wird die Zusammenführung proteomischer und mutagener Informationen intensiviert. Nicht zuletzt wird dazu beigetragen, die in dieser Arbeit zusammengetragenen Ergebnisse, für die Planung von in vitro Experimenten sowie weiterführenden Arbeiten auf dem Gebiet der Membranproteinanalyse, der Wissenschaft zur Verfügung zu stellen
The present work was written as part of a cooperative doctorate between the TU Dresden and the University of Applied Sciences Mittweida. In the doctoral thesis, novel, computer-oriented approaches for the analysis of membrane proteins are presented. Membrane proteins are essential for many cellular processes and are important targets for a wide range of pharmaceuticals. Their sequences provide valuable and partly not yet decoded information about their three-dimensional structure and functional characteristics. The analysis of membrane proteins is an important part for the understanding of complex biological processes in the context of proteomics and genomics. Research of membrane proteins revealed a large number of short, distinct sequence motifs. The motifs found so far support the understanding of the folded protein in the Membrane environment. In this dissertation, in three different approaches it is shown how the output of sequence motif-based methods can support the understanding of structural and functional properties of membrane proteins. In general, the junction of proteomic and mutagenic information is intensified. Last but not least, the results of this work are made available for the planning of in vitro experiments as well as for further works in the field of membrane Protein analysis
9

Salah, Saber. "Parallel itemset mining in massively distributed environments." Thesis, Montpellier, 2016. http://www.theses.fr/2016MONTT297/document.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
Le volume des données ne cesse de croître. À tel point qu'on parle aujourd'hui de "Big Data". La principale raison se trouve dans les progrès des outils informatique qui ont offert une grande flexibilité pour produire, mais aussi pour stocker des quantités toujours plus grandes. Les méthodes d'analyse de données ont toujours été confrontées à des quantités qui mettent en difficulté les capacités de traitement, ou qui les dépassent. Pour franchir les verrous technologiques associés à ces questions d'analyse, la communauté peut se tourner vers les techniques de calcul distribué. En particulier, l'extraction de motifs, qui est un des problèmes les plus abordés en fouille de données, présente encore souvent de grandes difficultés dans le contexte de la distribution massive et du parallélisme. Dans cette thèse, nous abordons deux sujets majeurs liés à l'extraction de motifs : les motifs fréquents, et les motifs informatifs (i.e., de forte entropie)
Le volume des données ne cesse de croître. À tel point qu'on parle aujourd'hui de "Big Data". La principale raison se trouve dans les progrès des outils informatique qui ont offert une grande flexibilité pour produire, mais aussi pour stocker des quantités toujours plus grandes.à l'extraction de motifs : les motifs fréquents, et les motifs informatifs (i.e., de forte entropie)
10

De, Clercq Charles. "Vers une classification des décompositions motiviques d'espaces homogènes." Phd thesis, Université Pierre et Marie Curie - Paris VI, 2011. http://tel.archives-ouvertes.fr/tel-00653272.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
Cette thèse porte sur les motifs de Chow des variétés projectives homogènes, et leurs liens avec des invariants classiques et certaines questions de géométrie rationnelle. Le motif (à coefficients finis) d'un espace homogène sous l'action d'un groupe algébrique semisimple et affine G se décompose de manière essentiellement unique en une somme directe de motifs indécomposables. Ce travail prend part au programme de classification de ces motifs, notre principal outil étant la théorie des motifs supérieurs. Nous montrons que cette classification est réduite à celle à coefficients dans F_p si G est de type intérieur, et trouvons un analogue si G est de type extérieur. Nous classifions ensuite complètement les motifs indécomposables des espaces homogènes sous l'action d'un groupe projectif linéaire et en déduisons la dichotomie motivique de PGL_1. Nous proposons ensuite un outil de décomposition motivique utilisé par Garibaldi, Semenov et Petrov pour déterminer toutes les décompositions d'espaces homogènes si G est de type E_6. Enfin nous montrons que la décomposition des variétés de Severi-Brauer généralisées SB(p, A) à coefficients dans F_p ne dépend que de la valuation p-adique de l'indice de A.
11

Voravuthikunchai, Winn. "Représentation des images au moyen de motifs fréquents et émergents pour la classification et la recherche d'images." Caen, 2013. http://www.theses.fr/2013CAEN2084.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
Cette thèse a pour but d'améliorer les performances sur différentes tâches de vision par ordinateur en se focalisant sur l'étape de représentation des images. Notre idée clé est d'intégrer des relations entre les descripteurs de l'image à sa représentation originelle, ces relations apportant une information additionnelle par exemple pour discriminer des images. La recherche de telles relations n'est pas simple compte-tenu de la grande combinatoire entre descripteurs. Nous proposons d'employer des techniques de fouille de données fondées sur la recherche de motifs pour mettre en évidence des relations pertinentes entre les descripteurs d'images. En effet, le fouille de données est appropriée pour l'analyse de grandes quantités de données et la découverte des motifs intéressants traduisant des dépendances, le regroupement de données, la détection d'anomalies. Un premier obstacle à l'emploi de techniques de fouille de données en vision par ordinateur porte sur le recordage des descripteurs des images. Ces dernières possèdent usuellement des valeurs réelles alors que les méthodes d'extraction de motifs sont appropriées aux données discrètes. Pour traiter ce problème, nous proposons des techniques fondées sur des seuillages locaux. Le nombre de motifs extraits étant élevés, ceux-ci ne peuvent pas être directement utilisés dans une tâche comme la classification supervisée. Aussi, nous présentons une méthode d'agrégation des motifs permettant d' obtenir une représentation compacte évitant le sur-apprentissage. Les résultats expérimentaux sur de nombreuses bases d'images montrent que notre approche est largement au niveau de l'état de l'art. Nous montrons que les caractéristiques de la fouille de données sont aussi propices à d'autres tâches de vision par ordinateur. Ainsi, nous avons conçu une méthode de détection de doublons reposant sur l'utilisation de motifs fermés dans de grandes bases d'images. Nous avons testé notre méthode sur une base de 1 million d'images obtenues avec Google image : les doublons sont découverts en moins de 3 minutes. Enfin, nous avons développé une méthode de re-classer d'images fondée sur le nombre de motifs fréquents que chaque image supporte, cette méthode permet d'améliorer le classement initial
In this thesis, our aim is to achieve better results in several tasks in computer vision by focusing on the image representation part. Our idea is to integrate feature dependencies to the original feature representation. Although feature dependencies can give additional useful information to discriminate images, it is a nontrivial task to select a subset of feature combinations from the power set of the features which has an excessively large cardinality. We employ pattern mining techniques to efficiently produce a tractable set of effective combinations. Pattern mining is a process that can analyze large quantities of data and extract interesting patterns such as groups of data records (cluster analysis), unusual records (anomaly detection) and dependencies (association rule mining). The first encountered problem is how to encode image features which are typically real valued as binary transaction items suitable for pattern mining algorithms. We propose some solutions based on local thresholding. The number of extracted patterns is still very high and to use them directly as new features for inferring a supervised classification models leads to overfitting. A solution by aggregating the patterns and have a compact representation which does not overfit to the training data is presented. We have achieved state-of-the-art results on several image classification benchmarks. Along the path of exploration, we realize pattern mining algorithms are suitable especially for large scale tasks as they are very efficient and scale gracefully to the number of images. We have found two suitable applications. The first one is to detect groups of duplicates in very large dataset. In order to run our experiment, we created a database of one million images. The images are randomly downloaded from Google. We have discovered the duplicate groups in less than three minutes. Another application that we found suitable for applying pattern mining techniques is image re-ranking. Our method can improves the original ranking score by a large margin and compare favorably to existing approaches
12

Desrosiers, Sophie. "Structures et décors des tissus andins préhispaniques : essai de classification." Paris, EHESS, 1987. http://www.theses.fr/1987EHES0310.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
Un changement de perspective dans la classification des structures des tissus andins prehispaniques revele la logique du systeme forme par celles-ci. Il conduit egalement a formuler des hypotheses a propos de la signification sociale ou symbolique des etoffes sans envers, sur la repartition geographique particuliere des structures permettant de creer un decor soit par la chaine soit par la trame, enfin sur la qualite de marqueur ethnique de certaines structures fondees sur des serges. Cette classification sert de support pour analyser l'influence des structures sur les decors qu'elles permettent de creer. Dans un cas particulier, les decors sont a tel point "marques" par des contraintes techniques propres au domaine textile qu'il est possible de les reconnaitre sur d'autres materiaux, meme quand un changement d'echelle en rend la lecture difficile
A change of perspective in the classification of andean textile structures reveals the logic of the system they embody. It also leads to hypotheses as to the social or symbolic meaning of reversible textiles, to the specific geographical distribution of warp-patterned and weft-patterned structures; and to the possible ethnic significance of some twill-derived structures. This classification sustains an analysis of the influence of structures on the designs they make possible. In one particular case, the designs are so "marked" by the technical constraints proper to textile construction that it is possible to recognize them expressed in other media, even when changes in scale make their decoding difficult
13

Samuel, Emilie. "Recherche de motifs dans des images : apport des graphes plans." Phd thesis, Université Jean Monnet - Saint-Etienne, 2011. http://tel.archives-ouvertes.fr/tel-00719187.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
La reconnaissance de formes s'intéresse à la détection automatique de motifs dans des données d'entrée, afin de pouvoir, par exemple, les classer en catégories. La matière première de ces techniques est bien souvent l'image numérique. Cette dernière, dans sa forme la plus courante, est codée sous la forme d'une matrice de pixels. Néanmoins, la question du développement de représentations plus riches se pose. Ainsi, la structuration de l'information contenue dans l'image devrait permettre la mise en évidence des différents objets représentés, et des liens les unissant. C'est pourquoi nous proposons de modéliser les images numériques sous forme de graphes, pour leur richesse et expressivité d'une part, et pour exploiter les résultats de la théorie des graphes en reconnaissance de formes d'autre part. Nous développons pour cela une méthode d'extraction de graphes plans à partir d'images, basée sur le respect de la sémantique. Nous montrons que nous pouvons, étant donné un graphe, reconstruire avec perte limitée l'image d'origine. Par la suite, nous introduisons les graphes plans à trous, graphes dont les faces peuvent être visibles ou invisibles. Leur justification trouve sa place dans la recherche de motifs notamment, pour laquelle les éléments constituant l'arrière-plan d'une image ne doivent pas être retrouvés. En dirigeant notre attention sur la planarité de ces graphes, nous proposons des algorithmes polynomiaux d'isomorphisme de graphes plans et de motifs ; nous traitons également leur équivalence, qui se trouve être un isomorphisme aux faces invisibles près
14

Benammar, Riyadh. "Détection non-supervisée de motifs dans les partitions musicales manuscrites." Thesis, Lyon, 2019. http://www.theses.fr/2019LYSEI112.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
Cette thèse s'inscrit dans le contexte de la fouille de données appliquées aux partitions musicales manuscrites anciennes et vise une recherche de motifs mélodiques ou rythmiques fréquents définis comme des séquences de notes répétitives aux propriétés caractéristiques. On rencontre un grand nombre de déclinaisons possibles de motifs : les transpositions, les inversions et les motifs dits « miroirs ». Ces motifs permettent aux musicologues d'avoir un niveau d'analyse approfondi sur les œuvres d'un compositeur ou d'un style musical. Dans un contexte d'exploration de corpus de grande taille où les partitions sont juste numérisées et non transcrites, une recherche automatisée de motifs vérifiant des contraintes ciblées devient un outil indispensable à leur étude. Pour la réalisation de l'objectif de détection de motifs fréquents sans connaissance a priori, nous sommes partis d'images de partitions numérisées. Après des étapes de prétraitements sur l'image, nous avons exploité et adapté un modèle de détection et de reconnaissance de primitives musicales (tête de notes, hampes...) de la famille de réseaux de neurones à convolutions de type Region-Proposal CNN (RPN). Nous avons ensuite développé une méthode d'encodage de primitives pour générer une séquence de notes en évitant la tâche complexe de transcription complète de l'œuvre manuscrite. Cette séquence a ensuite été analysée à travers l'approche CSMA (Contraint String Mining Algorithm) que nous avons conçue pour détecter les motifs fréquents présents dans une ou plusieurs séquences avec une prise en compte de contraintes sur leur fréquence et leur taille, ainsi que la taille et le nombre de sauts autorisés (gaps) à l'intérieur des motifs. La prise en compte du gap a ensuite été étudiée pour contourner les erreurs de reconnaissance produites par le réseau RPN évitant ainsi la mise en place d'un système de post-correction des erreurs de transcription des partitions. Le travail a été finalement validé par l'étude des motifs musicaux pour des applications d'identification et de classification de compositeurs
This thesis is part of the data mining applied to ancient handwritten music scores and aims at a search for frequent melodic or rhythmic motifs defined as repetitive note sequences with characteristic properties. There are a large number of possible variations of motifs: transpositions, inversions and so-called "mirror" motifs. These motifs allow musicologists to have a level of in-depth analysis on the works of a composer or a musical style. In a context of exploring large corpora where scores are just digitized and not transcribed, an automated search for motifs that verify targeted constraints becomes an essential tool for their study. To achieve the objective of detecting frequent motifs without prior knowledge, we started from images of digitized scores. After pre-processing steps on the image, we exploited and adapted a model for detecting and recognizing musical primitives (note-heads, stems...) from the family of Region-Proposal CNN (RPN) convolution neural networks. We then developed a primitive encoding method to generate a sequence of notes without the complex task of transcribing the entire manuscript work. This sequence was then analyzed using the CSMA (Constraint String Mining Algorithm) approach designed to detect the frequent motifs present in one or more sequences, taking into account constraints on their frequency and length, as well as the size and number of gaps allowed within the motifs. The gap was then studied to avoid recognition errors produced by the RPN network, thus avoiding the implementation of a post-correction system for transcription errors. The work was finally validated by the study of musical motifs for composers identification and classification
15

Kane, Mouhamadou bamba. "Extraction et sélection de motifs émergents minimaux : application à la chémoinformatique." Thesis, Normandie, 2017. http://www.theses.fr/2017NORMC223/document.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
La découverte de motifs est une tâche importante en fouille de données. Cemémoire traite de l’extraction des motifs émergents minimaux. Nous proposons une nouvelleméthode efficace qui permet d’extraire les motifs émergents minimaux sans ou avec contraintede support ; contrairement aux méthodes existantes qui extraient généralement les motifs émergentsminimaux les plus supportés, au risque de passer à côté de motifs très intéressants maispeu supportés par les données. De plus, notre méthode prend en compte l’absence d’attributqui apporte une nouvelle connaissance intéressante.En considérant les règles associées aux motifs émergents avec un support élevé comme desrègles prototypes, on a montré expérimentalement que cet ensemble de règles possède unebonne confiance sur les objets couverts mais malheureusement ne couvre pas une bonne partiedes objets ; ce qui constitue un frein pour leur usage en classification. Nous proposons uneméthode de sélection à base de prototypes qui améliore la couverture de l’ensemble des règlesprototypes sans pour autant dégrader leur confiance. Au vu des résultats encourageants obtenus,nous appliquons cette méthode de sélection sur un jeu de données chimique ayant rapport àl’environnement aquatique : Aquatox. Cela permet ainsi aux chimistes, dans un contexte declassification, de mieux expliquer la classification des molécules, qui sans cette méthode desélection serait prédites par l’usage d’une règle par défaut
Pattern discovery is an important field of Knowledge Discovery in Databases.This work deals with the extraction of minimal emerging patterns. We propose a new efficientmethod which allows to extract the minimal emerging patterns with or without constraint ofsupport ; unlike existing methods that typically extract the most supported minimal emergentpatterns, at the risk of missing interesting but less supported patterns. Moreover, our methodtakes into account the absence of attribute that brings a new interesting knowledge.Considering the rules associated with emerging patterns highly supported as prototype rules,we have experimentally shown that this set of rules has good confidence on the covered objectsbut unfortunately does not cover a significant part of the objects ; which is a disavadntagefor their use in classification. We propose a prototype-based selection method that improvesthe coverage of the set of the prototype rules without a significative loss on their confidence.We apply our prototype-based selection method to a chemical data relating to the aquaticenvironment : Aquatox. In a classification context, it allows chemists to better explain theclassification of molecules, which, without this method of selection, would be predicted by theuse of a default rule
16

Schroeder, Michael, Annalisa Marsico, Andreas Henschel, Christof Winter, Anne Tuukkanen, Boris Vassilev та Kerstin Scheubert. "Structural fragment clustering reveals novel structural and functional motifs in α-helical transmembrane proteins". BioMed Central, 2010. https://tud.qucosa.de/id/qucosa%3A28887.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
Background A large proportion of an organism's genome encodes for membrane proteins. Membrane proteins are important for many cellular processes, and several diseases can be linked to mutations in them. With the tremendous growth of sequence data, there is an increasing need to reliably identify membrane proteins from sequence, to functionally annotate them, and to correctly predict their topology. Results We introduce a technique called structural fragment clustering, which learns sequential motifs from 3D structural fragments. From over 500,000 fragments, we obtain 213 statistically significant, non-redundant, and novel motifs that are highly specific to α-helical transmembrane proteins. From these 213 motifs, 58 of them were assigned to function and checked in the scientific literature for a biological assessment. Seventy percent of the motifs are found in co-factor, ligand, and ion binding sites, 30% at protein interaction interfaces, and 12% bind specific lipids such as glycerol or cardiolipins. The vast majority of motifs (94%) appear across evolutionarily unrelated families, highlighting the modularity of functional design in membrane proteins. We describe three novel motifs in detail: (1) a dimer interface motif found in voltage-gated chloride channels, (2) a proton transfer motif found in heme-copper oxidases, and (3) a convergently evolved interface helix motif found in an aspartate symporter, a serine protease, and cytochrome b. Conclusions Our findings suggest that functional modules exist in membrane proteins, and that they occur in completely different evolutionary contexts and cover different binding sites. Structural fragment clustering allows us to link sequence motifs to function through clusters of structural fragments. The sequence motifs can be applied to identify and characterize membrane proteins in novel genomes.
17

Carrasco, William J. "Sémiotique et folklore : propositions pour une typologie et une classification de motifs ethnolittéraires : l'exemple de la légende de La Llorona." Toulouse 2, 1999. http://www.theses.fr/1999TOU20045.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
Afin de rendre la notion de motif folklorique plus opératoire, cette thèse reprend la problématique de l'indexation de motifs ethnolittéraires en "folkloristique" - à partir du Motifindex de Stith Thompson - pour établir une typologie et une classification de motifs du point de vue sémiotique. La première partie propose un bilan des théories du motif existantes. A partir de la distinction entre motifs narratifs et motifs sémantiques mise en avant par Joseph Courtes nous proposons quelques critères pour définir ces motifs indépendamment et en relation avec d'autres stéréotypes ethnolittéraires relevant de niveaux discursifs et de degrés de complexité différents. Dans un cadre plus restreint, nous opposons les motifs iconiques aux motifs abstraits selon leur degré de figurativité. Ensuite, nous proposons une extension de la recherche vers les stéréotypes de l'énonciation - particulièrement celui du genre - dans le but de tracer un code pratico-mythique sous-jacent à la vie d'une culture. La deuxième partie décrit des motifs narratifs, des motifs sémantiques et d'autres stéréotypes dans un corpus californien de 180 versions de la légende de La Llorona. Pour confirmer les hypothèses de la première partie nous orientons l'analyse vers le plan de renonciation et vers le plan socio-culturel pour ouvrir des pistes de recherche avec des exemples concrets. Enfin, la troisième partie est consacrée a la mise en place d'une classification des motifs dont nous proposons quelques modèles. L'index de motifs initié ici représente la construction d'un code figuratif qui "reflète" une organisation de valeurs socio-culturelles. Notre projet réunit ainsi les domaines de la "folkloristique" et de la sémiotique qui partagent tous deux un intérêt dans l'articulation du sens commun en système et en procès. Cette réflexion sur les motifs ethnolittéraires représente donc une contribution importante à la sémiotique des cultures.
18

Busin, Laurent Macaire Ludovic Vandenbroucke Nicolas. "Sélection automatique d'espaces couleur pour la segmentation d'images application au contrôle qualité de motifs de verres sérigraphiés /." Villeneuve d'Ascq : Université des sciences et technologies de Lille, 2007. https://iris.univ-lille1.fr/dspace/handle/1908/1028.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
Reproduction de : Thèse de doctorat : Automatique et informatique industrielle : Lille 1 : 2006.
N° d'ordre (Lille 1) : 3908. Résumé en français et en anglais. Titre provenant de la page de titre du document numérisé. Bibliogr. p. [181]-188.
19

Samuel, Émilie. "Recherche de motifs dans des images : apport des graphes plans." Phd thesis, Université Jean Monnet - Saint-Etienne, 2011. http://tel.archives-ouvertes.fr/tel-00630439.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
La reconnaissance de formes s'intéresse à la détection automatique de motifs dans des données d'entrée, afin de pouvoir, par exemple, les classer en catégories. La matière première de ces techniques est bien souvent l'image numérique. Cette dernière, dans sa forme la plus courante, est codée sous la forme d'une matrice de pixels. Néanmoins, la question du développement de représentations plus riches se pose. Ainsi, la structuration de l'information contenue dans l'image devrait permettre la mise en évidence des différents objets représentés, et des liens les unissant. C'est pourquoi nous proposons de modéliser les images numériques sous forme de graphes, pour leur richesse et expressivité d'une part, et pour exploiter les résultats de la théorie des graphes en reconnaissance de formes d'autre part. Nous développons pour cela une méthode d'extraction de graphes plans à partir d'images, basée sur le respect de la sémantique. Nous montrons que nous pouvons, étant donné un graphe, reconstruire avec perte limitée l'image d'origine. Par la suite, nous introduisons les graphes plans à trous, graphes dont les faces peuvent être visibles ou invisibles. Leur justification trouve sa place dans la recherche de motifs notamment, pour laquelle les éléments constituant l'arrière plan d'une image ne doivent pas être retrouvés. En dirigeant notre attention sur la planarité de ces graphes, nous proposons des algorithmes polynomiaux d'isomorphisme de graphes plans et de motifs ; nous traitons également leur équivalence, qui se trouve être un isomorphisme aux faces invisibles près.
20

Bouton, Laurence. "Les deux frères, les avatars d'un conte dans le cinéma américain des années 50." Paris 7, 2004. http://www.theses.fr/2004PA070074.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
La rivalité fraternelle, thème récurrent des contes, constitue une intrigue de choix dans de nombreux films américains. En concentrant notre recherche sur la littérature, la religion, les mythes et la civilisation américaine, nous examinons la genèse et les manifestations de la rivalité fraternelle au cinéma. L'étude des origines mythiques de ces deux personnages, de la symbolique religieuse à laquelle ils sont rattachés, ainsi que leur évolution au sein de la littérature, permet de mieux appréhender les enjeux qui entrent en compte, lorsque deux frères antagonistes sont évoqués. Plusieurs films utilisent la richesse de la rivalité fraternelle pour illustrer des conflits historiques, culturels et sociaux. Quatre films caractéristiques de cette approche particulière du septième art confirment la résurgence d'archétypes ancestraux dans un contexte contemporain : "Duel au soleil" de King Vidor, "Sabrina" de Billy Wilder, "A l'est d'Eden" d'Elia Kazan et "Celui par qui le scandale arrive" de Vincente Minnelli
Brotherly rivalry (a common theme in tales) represents a good plot in many American films. To examine the genesis and expression of brotherly rivalry in the cinema, we concentrate our research on literature, religion, myths and American civilization. The study of the mythical origins of these two characters, of the religious symbolism they are associated with, and their evolution within literature helps us to understand the issues which are at stake when two opposing brothers are mentioned. Several films use the wealth of the brotherly rivalry in order to illustrate historical, cultural and social conflicts. Four characteristical films of this particular approach to the seventh art confirm this resurgence of ancestral archetypes in a contemporary context: “Duel in the sun” by King Vidor, “Sabrina” by Billy Wilder, “East of Eden” by Elia Kazan, “Home from the hill” by Vincente Minnelli
21

Debroutelle, Teddy. "Détection et classification de décors gravés sur des céramiques anciennes par analyse d’images." Thesis, Orléans, 2018. http://www.theses.fr/2018ORLE2015/document.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
Le projet ARCADIA vise à développer une méthode automatique d’analyse des décors sur des tessons de céramique réalisés à la molette pour faciliter l’interprétation de ce patrimoine archéologique. Cette automatisation doit remplacer la procédure manuelle effectuée par l’archéologue, devenue trop fastidieuse avec l’augmentation du corpus (38000 tessons). L’objectif in fine est de réussir à associer automatiquement les décors à la molette du potier qui les a créés. Dans ce contexte, nous avons développé une chaine complète depuis la numérisation des tessons jusqu’à la classification automatique des décors selon leur style de motifs(carré, losange, chevrons, oves, etc). Les travaux présentés proposent plusieurs contributions mettant en oeuvre des méthodes d’analyse d’images et d’apprentissage automatique. A partir du nuage de points 3D, une carte des profondeurs est obtenue. Une méthode originale de détection automatique de la région saillante focalisée sur le décor est proposée. Ensuite les décors sont caractérisés pour effectuer leur classification. Un nouveau descripteur, appelé Blob-SIFT, est proposé pour collecter les signatures seulement dans les zones pertinentes du décor. Cette approche adaptée à chaque décor, permet à la fois de réduire considérablement la masse de données et d’améliorer les performances de classification. Nous proposons également une approche apprentissage profond, puis, une approche hybride combinant les vecteurs de caractéristiques locales extraites par Blob-SIFT et la caractérisation globale du décor fournie par l’apprentissage profond qui améliore encore les performances de classification
The ARCADIA project aims to develop an automatic method for analyzing engraved decorations on ceramic sherds to facilitate the interpretation of this archaeological heritage. It is to replace the manual and tedious procedure carried out by the archaeologist since the corpus increased to more 38000 sherds. The ultimate goal is to grouping all the decorations created with the same wheel by a poter. We developped a complete chain from the 3Dscanning of the sherd to the automatic classification of the decorations according to their style (diamonds, square, chevrons, oves, etc). In this context, several contributions are proposed implementing methods of image analysis and machine learning. From the 3Dpoint cloud, a depth map is extracted and an original method is applied to automatically detect the salient region centered onto the decoration. Then, a new descriptor, called Blob-SIFT, is proposed to collect signatures only in the relevant areas and characterize the decoration to perform the classification. This approach adapted to each sherd, allows both to reduce significantly the mass of data and improve classification rates. We also use deep learning, and propose an hybrid approach combining local features extracted by Blob-SIFT with global features provided by deep learning to increase the classification performance
22

Al-Najdi, Atheer. "Une approche basée sur les motifs fermés pour résoudre le problème de clustering par consensus." Thesis, Université Côte d'Azur (ComUE), 2016. http://www.theses.fr/2016AZUR4111/document.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
Le clustering est le processus de partitionnement d’un ensemble de données en groupes, de sorte que les instances du même groupe sont plus semblables les unes aux autres qu’avec celles de tout autre groupe. De nombreux algorithmes de clustering ont été proposés, mais aucun d’entre eux ne s’avère fournir une partitiondes données pertinente dans toutes les situations. Le clustering par consensus vise à améliorer le processus de regroupement en combinant différentes partitions obtenues à partir de divers algorithmes afin d’obtenir une solution de consensus de meilleure qualité. Dans ce travail, une nouvelle méthode de clustering par consensus, appelée MultiCons, est proposée. Cette méthode utilise la technique d’extraction des itemsets fréquents fermés dans le but de découvrir les similitudes entre les différentes solutions de clustering dits de base. Les similitudes identifiées sont représentées sous une forme de motifs de clustering, chacun définissant un accord entre un ensemble de clusters de bases sur le regroupement d’un ensemble d’instances. En traitant ces motifs par groupes, en fonction du nombre de clusters de base qui définissent le motif, la méthode MultiCons génère une solution de consensus pour chaque groupe, générant par conséquence plusieurs consensus candidats. Ces différentes solutions sont ensuite représentées dans une structure arborescente appelée arbre de consensus, ouConsTree. Cette représentation graphique facilite la compréhension du processus de construction des multiples consensus, ainsi que les relations entre les instances et les structures d’instances dans l’espace de données
Clustering is the process of partitioning a dataset into groups, so that the instances in the same group are more similar to each other than to instances in any other group. Many clustering algorithms were proposed, but none of them proved to provide good quality partition in all situations. Consensus clustering aims to enhance the clustering process by combining different partitions obtained from different algorithms to yield a better quality consensus solution. In this work, a new consensus clustering method, called MultiCons, is proposed. It uses the frequent closed itemset mining technique in order to discover the similarities between the different base clustering solutions. The identified similarities are presented in a form of clustering patterns, that each defines the agreement between a set of base clusters in grouping a set of instances. By dividing these patterns into groups based on the number of base clusters that define the pattern, MultiCons generates a consensussolution from each group, resulting in having multiple consensus candidates. These different solutions are presented in a tree-like structure, called ConsTree, that facilitates understanding the process of building the multiple consensuses, and also the relationships between the data instances and their structuring in the data space. Five consensus functions are proposed in this work in order to build a consensus solution from the clustering patterns. Approach 1 is to just merge any intersecting clustering patterns. Approach 2 can either merge or split intersecting patterns based on a proposed measure, called intersection ratio
23

Henschel, Andreas. "A structural classification of protein-protein interactions for detection of convergently evolved motifs and for prediction of protein binding sites on sequence level." Doctoral thesis, Technische Universität Dresden, 2008. https://tud.qucosa.de/id/qucosa%3A23908.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
BACKGROUND: A long-standing challenge in the post-genomic era of Bioinformatics is the prediction of protein-protein interactions, and ultimately the prediction of protein functions. The problem is intrinsically harder, when only amino acid sequences are available, but a solution is more universally applicable. So far, the problem of uncovering protein-protein interactions has been addressed in a variety of ways, both experimentally and computationally. MOTIVATION: The central problem is: How can protein complexes with solved threedimensional structure be utilized to identify and classify protein binding sites and how can knowledge be inferred from this classification such that protein interactions can be predicted for proteins without solved structure? The underlying hypothesis is that protein binding sites are often restricted to a small number of residues, which additionally often are well-conserved in order to maintain an interaction. Therefore, the signal-to-noise ratio in binding sites is expected to be higher than in other parts of the surface. This enables binding site detection in unknown proteins, when homology based annotation transfer fails. APPROACH: The problem is addressed by first investigating how geometrical aspects of domain-domain associations can lead to a rigorous structural classification of the multitude of protein interface types. The interface types are explored with respect to two aspects: First, how do interface types with one-sided homology reveal convergently evolved motifs? Second, how can sequential descriptors for local structural features be derived from the interface type classification? Then, the use of sequential representations for binding sites in order to predict protein interactions is investigated. The underlying algorithms are based on machine learning techniques, in particular Hidden Markov Models. RESULTS: This work includes a novel approach to a comprehensive geometrical classification of domain interfaces. Alternative structural domain associations are found for 40% of all family-family interactions. Evaluation of the classification algorithm on a hand-curated set of interfaces yielded a precision of 83% and a recall of 95%. For the first time, a systematic screen of convergently evolved motifs in 102.000 protein-protein interactions with structural information is derived. With respect to this dataset, all cases related to viral mimicry of human interface bindings are identified. Finally, a library of 740 motif descriptors for binding site recognition - encoded as Hidden Markov Models - is generated and cross-validated. Tests for the significance of motifs are provided. The usefulness of descriptors for protein-ligand binding sites is demonstrated for the case of "ATP-binding", where a precision of 89% is achieved, thus outperforming comparable motifs from PROSITE. In particular, a novel descriptor for a P-loop variant has been used to identify ATP-binding sites in 60 protein sequences that have not been annotated before by existing motif databases.
24

Busin, Laurent. "Sélection automatique d'espaces couleur pour la segmentation d'images : application au contrôle qualité de motifs de verres sérigraphiés." Lille 1, 2006. https://pepite-depot.univ-lille.fr/LIBRE/Th_Num/2006/50376-2006-Busin.pdf.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
Les travaux de recherche présentés dans le cadre de cette thèse portent principalement sur la détermination d'espaces couleur adaptés à la segmentation d'images numériques couleur. Les méthodes de segmentation d'images couleur peuvent être divisées en deux familles suivant qu'elles analysent la distribution des couleurs associées aux pixels dans le plan image ou dans un espace couleur. Les méthodes analysant la distribution des couleurs dans un espace couleur supposent que les pixels appartenant à chaque rêgion de l'image donnent naissance à un nuage de points dans un espace couleur. La segmentation consiste à identifier chaque nuage de points afin de construire des classes de pixels par des méthodes classiques d'analyse de données multidimensionnelles. La couleur d"un pixel peut-être représentée dans différents espaces couleur qui respectent des propriétés physiques, physiologiques et psychologiques spécifiques à la perception des couleurs. La problématique que nous abordons est la sélection d'espaces couleur les mieux adaptés pour construire les classes de pixels en présence dans l'image. Nous proposons de nous placer dans un contexte non supervisé pour comparer le pouvoir de discrimination des différents espaces couleur afin d'en sélectionner le mieux adapté à la construction de chaque classe de pixels. La méthodologIe proposée s'appuie sur une procédure originale d'analyse itérative des histogrammes monodimensionnels des composantes couleur associées aux espaces comparés. Cette analyse tient compte simultanément de la distribution des couleurs dans l'espace couleur sélectionné et de leur répartition spatiale dans l'image. Ainsi, à chaque itération, une classe de pixels est extraite de l'image à segmenter par multi-seuillage des histogrammes monodimensionnels dans l'espace couleur sélectionné. Notre méthodologie a montré des résultats très encourageants dans le cadre d'une application industrielle cherchant à détecter des défauts d'aspect apparaissant à la surface de verres ornés de motifs colorés provoqués par des dysfonctionnements du processus d'impression par sérigraphIe. En raison de la forme cylindnque des verres, les images des surfaces des verres sont acquises par une caméra linéaire couleur. Un soin particulier a donc été apporté au développement du poste d'acquisition des images afin de mettre en évidence les défauts dans les images acquises
25

Henschel, Andreas. "A structural classification of protein-protein interactions for detection of convergently evolved motifs and for prediction of protein binding sites on sequence level." Doctoral thesis, Saechsische Landesbibliothek- Staats- und Universitaetsbibliothek Dresden, 2009. http://nbn-resolving.de/urn:nbn:de:bsz:14-ds-1227802741245-32655.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
BACKGROUND: A long-standing challenge in the post-genomic era of Bioinformatics is the prediction of protein-protein interactions, and ultimately the prediction of protein functions. The problem is intrinsically harder, when only amino acid sequences are available, but a solution is more universally applicable. So far, the problem of uncovering protein-protein interactions has been addressed in a variety of ways, both experimentally and computationally. MOTIVATION: The central problem is: How can protein complexes with solved threedimensional structure be utilized to identify and classify protein binding sites and how can knowledge be inferred from this classification such that protein interactions can be predicted for proteins without solved structure? The underlying hypothesis is that protein binding sites are often restricted to a small number of residues, which additionally often are well-conserved in order to maintain an interaction. Therefore, the signal-to-noise ratio in binding sites is expected to be higher than in other parts of the surface. This enables binding site detection in unknown proteins, when homology based annotation transfer fails. APPROACH: The problem is addressed by first investigating how geometrical aspects of domain-domain associations can lead to a rigorous structural classification of the multitude of protein interface types. The interface types are explored with respect to two aspects: First, how do interface types with one-sided homology reveal convergently evolved motifs? Second, how can sequential descriptors for local structural features be derived from the interface type classification? Then, the use of sequential representations for binding sites in order to predict protein interactions is investigated. The underlying algorithms are based on machine learning techniques, in particular Hidden Markov Models. RESULTS: This work includes a novel approach to a comprehensive geometrical classification of domain interfaces. Alternative structural domain associations are found for 40% of all family-family interactions. Evaluation of the classification algorithm on a hand-curated set of interfaces yielded a precision of 83% and a recall of 95%. For the first time, a systematic screen of convergently evolved motifs in 102.000 protein-protein interactions with structural information is derived. With respect to this dataset, all cases related to viral mimicry of human interface bindings are identified. Finally, a library of 740 motif descriptors for binding site recognition - encoded as Hidden Markov Models - is generated and cross-validated. Tests for the significance of motifs are provided. The usefulness of descriptors for protein-ligand binding sites is demonstrated for the case of "ATP-binding", where a precision of 89% is achieved, thus outperforming comparable motifs from PROSITE. In particular, a novel descriptor for a P-loop variant has been used to identify ATP-binding sites in 60 protein sequences that have not been annotated before by existing motif databases.
26

Li, Haoyuan. "Extraction de séquences inattendues : des motifs séquentiels aux règles d'implication." Phd thesis, Université Montpellier II - Sciences et Techniques du Languedoc, 2009. http://tel.archives-ouvertes.fr/tel-00431117.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
Les motifs séquentiels peuvent être vus comme une extension de la notion d'itemsets fréquents intégrant diverses contraintes temporelles. La recherche de tels motifs consiste ainsi à extraire des enchaînements d'ensembles d'items, couramment associés sur une période de temps bien spécifiée. La construction de règles à partir de ces motifs séquentiels permet d'étendre la notion de règles d'association pour la pris en compte de la temporalité. En fait, cette recherche met en évidence des associations inter-transactions, contrairement à celle des règles d'association qui extrait des combinaisons intra-transactions. Ce problème, posé à l'origine dans un contexte de marketing, intéresse à présent des domaines aussi variés que les télécommunications, la finance, ou encore la médecine et la bioinformatique. Même s'il existe aujourd'hui de très nombreuses approches efficaces pour extraire des motifs, ces derniers ne sont pas forcément adaptés aux besoins des applications réelles. En fait, les résultats obtenus sont basés sur une mesure statistique et ne tiennent pas compte de la connaissance du domaine. De plus, ces approches sont principalement axées sur la recherche de tendances et ne permettent pas d'extraire des connaissances sur les éléments atypiques ou inattendus. Dans le cadre de cette thèse, nous nous intéressons donc à la problématique de l'extraction de motifs séquentiels et règles inattendus en intégrant la connaissance du domaine. Le travail présenté dans cette thèse comporte la mise en œuvre d'un cadre MUSE pour l'extraction de séquences inattendues par rapport à un système de croyances, des extensions avec la théorie de logique floue, l'intégration des données hiérarchisées, la définition des motifs séquentiels et règles inattendus et, enfin, l'extraction de phrases inattendues dans des documents textes. Des expérimentations menées sur des données synthétiques et sur des données réelles sont rapportées et montrent l'intérêt de nos propositions.
27

Deville, Romain. "Spatio-temporal grid mining applied to image classification and cellular automata analysis." Thesis, Lyon, 2018. http://www.theses.fr/2018LYSEI046/document.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
Durant cette thèse, nous abordons le problème de la fouille exhaustive de motifs pour un cas particulier de graphes : les grilles. Ces grilles peuvent être utilisées pour modéliser des objets ayant une structure régulière. Ces structures sont naturellement présentes dans de nombreux jeux de plateaux (les dames, les échecs ou le go par exemple) ou encore dans les modélisations d’écosystèmes utilisant des automates cellulaires. On les retrouve également à un plus bas niveau dans les images, qui sont des grilles 2D de pixels ou encore les vidéos, qui sont des grilles spatio-temporelles 2D+t de pixels. Au cours de cette thèse, nous avons proposé un nouvel algorithme de fouille de motifs fréquents dédié aux grilles spatio-temporelles, GriMA. L’usage des grilles régulières permet à notre algorithme de réduire la complexité des tests d’isomorphismes. Ces tests sont souvent utilisés par les algorithmes génériques de fouilles de graphes mais ayant une complexité importante, cela limite leur usage sur des données réelles. Deux applications ont été proposées pour évaluer notre algorithme : la classification d’images pour la fouille de grilles 2D et la prédiction d’automates cellulaires pour la fouille de grilles 2D+t
During this thesis, we consider the exhaustive graph mining problem for a special kind of graphs : the grids. Theses grids can be used to model objects that present a regular structure. These structures are naturally present in multiple board games (checkers, chess or go for instance) or in ecosystems models using cellular automata. It is also possible to find this structure in a lower level in images, which are 2D grids of pixels, or even in videos, which are 2D+t spatio-temporal grids of pixels. In this thesis, we proposed a new algorithm to find frequent patterns dedicated to spatio-temporal grids, GriMA. Use of regular grids allow our algorithm to reduce the complexity of the isomorphisms test. These tests are often use by generic graph mining algorithm but because of their complexity, they are rarely used on real data. Two applications were proposed to evaluate our algorithm: image classification for 2D grids mining and prediction of cellular automata for 2D+t grids mining
28

Varin, Thibault. "Développement, évaluation et utilisation de méthodes de fouille de données (classifications, pharmacophores, motifs émergents et modéles par homologie de séquence) pour le screening virtuel : application aux ligands 5-HT." Caen, 2009. http://www.theses.fr/2009CAEN4056.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
Notre laboratoire a développé depuis de nombreuses années une chimiothèque sérotoninergique (programme ATBI). Celle-ci contient plus de 1500 composés testés vis-à-vis des récepteurs découverts le plus récemment : 5-HT4R, 5-HT5R, 5-HT6R and 5-HT7R. Nous rapportons ici plusieurs travaux réalisés dans le contexte de l’analyse des échantillons ATBI. Après une brève introduction, nous développons les aspects les plus importants du système sérotoninergique et plus spécialement des récepteurs 5-HT6R (chapitre II). Dans le chapitre III, nous traitons de l’évaluation et la détermination de protocoles de classification (clustering) optimaux. Nous n’avons pas réussi à obtenir une classification correcte pour deux de nos échantillons (5-HT6 et 5-HT7). Afin d’en comprendre la raison, nous avons développé une nouvelle méthode d’extraction de pharmacophore topologique 2D en utilisant les motifs émergents (chapitre IV) et nous avons construit des modèles par homologie de séquence afin d’étudier les modes de liaison des ligands 5-HT6 et 5-HT7 (chapitre V). Enfin, nous montrons comment un acide aminé (F7. 38) peut expliquer la sélectivité interespèces (humain/rat) de ligands 5-HT7Rs en se basant sur la modélisation par homologie de séquence et une étude de mutagénèse dirigée (chapitre V)
Our laboratory has developed from many years a serotoninergic chemolibrary (ATBI program). This chemolibrary contains more than 1500 compounds tested toward the most recently discovered receptors: 5-HT4R, 5-HT5R, 5-HT6R and 5-HT7R. We report here several works carried out in the context of ATBI datasets analysis. After a brief introduction we develop the most important biological aspect of serotoninergic system (chapter II). In chapter III, we deal with evaluation and determination of optimal clustering protocols in relation with our internal chemolibrary. Because a good clustering classification for two of our ATBI datasets is really an issue (5-HT6 and 5-HT7) and in order to understand the reasons, we have developed a new method to extract 2D topological pharmacophores using emerging patterns (chapter IV) and built homology models to study binding mode of 5-HT6 ligands (chapter V). Finally we show how a single amino acid (F7. 38) can explain interspecies (human/rat) selectivity ligands of 5-HT7Rs using homology modelling and site-directed mutagenesis (chapter V)
29

Bertoncini-Zubkova, Elena. "Marx`s shorts and ancestors` caves:: Tracing critical motifs in Kezilahabi`s play and poems." Swahili Forum; 3 (1996), S. 139-148, 1996. https://ul.qucosa.de/id/qucosa%3A11637.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
The only play by Kezilahabi, Marx`s shorts, is a political satire, so pungent that it has not yet been published, although its photocopied manuscript has been in circulation for almost twenty years (it is dated 1978). Probably it was written soon after Julius Nyerere`s pamphlet Azzmio la Arusha baada ya Miaka Kumi (1977), where he overtly admitted for the first time the failure of his policy, clearing the way for critical literary works.
30

Carpentier, Mathilde. "Méthodes de détection des similarités structurales : caractérisation des motifs conservés dans les familles de structures pour l' annotation des génomes." Paris 6, 2005. http://www.theses.fr/2005PA066571.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
31

Wamitila, Kyallo Wadi. "A philosophical labyrinth: tracing two critical motifs in Kezilahabi´s prose works." Universitätsbibliothek Leipzig, 2012. http://nbn-resolving.de/urn:nbn:de:bsz:15-qucosa-93522.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
This study aims at studying one of the most important contemporary Kiswahili writers: Euphrase Kezilahabi. In a way this paper can be seen as a continuation of my earlier articles on the same writer. It is definitely different from the other ones though a certain thread links them: the interest in Kezilahabi`s philosophy. In this paper my interest is with two main motifs namely contemptus mundi and carpe diem. Contemptus mundi is a Latin expression for contemptible world, world as a bad place and one that is perceived contemptuously. I intend to explore the said motifs in Kezilahabi\'s prose works: Rosa Mistika, Kichwamaji, Gamba la Nyoka, Dunia Uwanja wa Fujo, Nagana and Mzingile. The latter two works are slightly short, lacking the novel length of the other four works. I do not, however, want to entangle myself in the polemics of genre as to what a novel or novella is. I will, however, regard the two as novellas at least by the virtue of their length.
32

Fleury, Anthony. "Détection de motifs temporels dans les environnements multi-perceptifs. Application à la classification automatique des Activités de la Vie Quotidienne d'une personne suivie à domicile par télémédecine." Phd thesis, Université Joseph Fourier (Grenoble), 2008. http://tel.archives-ouvertes.fr/tel-00336400.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
À l'horizon 2050, environ un tiers de notre population sera âgée de soixante-cinq ans et plus. Les travaux de l'équipe AFIRM du TIMC-IMAG visent à surveiller les personnes âgées à domicile pour détecter une perte d'autonomie le plus précocement possible. Pour ce faire, les travaux de cette thèse tentent d'objectiver les critères ADL ou les grilles de type AGGIR, en classifiant de manière automatique les différentes activités de la vie quotidienne d'une personne par l'intégration de capteurs, créant un Habitat Intelligent pour la Santé (HIS).
L'appartement HIS possède des détecteurs de présence infrarouges (localisation), des contacteurs de porte (utilisation de certaines commodités), un capteur de température et d'hygrométrie dans la salle de bains et des microphones (classification des sons/ reconnaissance de la parole avec l'équipe GETALP du LIG). Un capteur cinématique embarqué détecte les transferts posturaux (reconnaissance de formes avec la transformée en ondelettes) et les périodes de marche (analyse fréquentielle).
La première partie de ce manuscrit présente la réalisation du capteur cinématique et les algorithmes associés puis une première validation sur des sujets jeunes suivi de la mise en place et de la validation des autres capteurs de l'appartement HIS et enfin l'algorithme de classification des sept activités de la vie quotidienne reconnues (hygiène, élimination, préparation et prise de repas, repos, habillage/déshabillage, détente et communication), par l'intermédiaire des séparateurs à vaste marge. La seconde partie décrit le protocole expérimental pour valider cette classification et discute de la généralisation des premiers résultats présentés.
33

Goudjil, Abdelhak. "De l'identification des systèmes (hybrides et à sortie binaire) à l'extraction de motifs." Thesis, Normandie, 2017. http://www.theses.fr/2017NORMC240/document.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
Les travaux de cette thèse portent sur l'identification des systèmes et l'extraction de motifs à partir de données. Dans le cadre de l'identification des systèmes, nous nous intéressons plus précisément à l'identification des systèmes dynamiques hybrides et l'identification des systèmes dynamiques linéaires ayant une sortie binaire. Deux classes très populaires des systèmes hybrides sont les systèmes linéaires à commutations et les systèmes affines par morceaux. Nous faisons tout d'abord un état de l'art sur les méthodes d'identification de ces deux classes. Nous proposons ensuite un algorithme basé sur une méthode d'identification de type OBE "Outer Bounding Ellipsoid" pour l'identification en temps réel des systèmes à commutations soumis à un bruit borné. Nous présentons ensuite plusieurs extensions de l'algorithme soit pour l'identification des systèmes affines par morceaux, l'identification des systèmes à commutations décrits par un modèle du type erreur de sortie et l'identification des systèmes MIMO à commutations. Nous abordons ensuite le problème d'identification des systèmes linéaires ayant une sortie binaire en introduisant un point de vue original consiste à formuler le problème d'identification comme un problème de classification. Ceci permet de proposer deux algorithmes d'identification basés sur l'utilisation des SVMs. Le premier algorithme est dédié à l'identification des systèmes à temps discret et le deuxième algorithme est dédié à l'identification des systèmes à temps continu. Dans le cadre de l'extraction de motifs, nous présentons dans un premier temps un état de l'art sur les algorithmes d'extraction de motifs et sur les techniques de la classification non supervisée. Ensuite, nous proposons un algorithme d'extraction de motifs à partir des données basé sur des techniques de classification non supervisée
In this thesis, we deal with the identification of systems and the extraction of patterns from data. In the context of system identification, we focus precisely on the identification of hybrid systems and the identification of linear systems using binary sensors. Two very popular classes of hybrid systems are switched linear systems and piecewise affine systems. First, we give an overview of the different approaches available in the literature for the identification of these two classes. Then, we propose a new real-time identification algorithm for switched linear systems, it's based on an Outer Bounding Ellipsoid (OBE) type algorithm suitable for system identification with bounded noise. We then present several extensions of the algorithm either for the identification of piecewise affine systems, the identification of switched linear systems described by an output error model and the identification of MIMO switched linear systems. After this, we address the problem of the identification of linear systems using binary sensors by introducing an original point of view. We formulate the identification problem as a classification problem. This formulation allows the use of supervised learning algorithms such as Support Vector Machines (SVMs) for the identification of discrete time systems and the identification of continuous-time systems using binary sensors. In the context of pattern extraction, we first present an overview of the different pattern extraction algorithms and clustering techniques available in the literature. Next, we propose an algorithm for extracting patterns from data based on clustering techniques
34

Houam, Lotfi. "Contribution à l'analyse de textures de radiographies osseuses pour le diagnostic précoce de l'ostéoporose." Phd thesis, Université d'Orléans, 2013. http://tel.archives-ouvertes.fr/tel-01022935.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
L'ostéoporose est une maladie osseuse caractérisée par une perte importante de la masse osseuse et des altérations de la microarchitecture du tissu osseux. Aujourd'hui, en routine clinique, le diagnostic de l'ostéoporose est basé principalement sur une mesure de la densité minérale osseuse qui n'est pas suffisante, car elle doit être accompagnée par une analyse de la qualité de la microarchitecture osseuse. Les travaux présentés dans cette thèse concernent la caractérisation des images de radiographies osseuses pour le diagnostic précoce de l'ostéoporose. Pour ce faire, afin de mieux caractériser la texture osseuse sur radiographie, nous avons introduit une nouvelle technique de prétraitement des données pour réduire les redondances et éliminer le bruit issu des capteurs d'acquisition. Pour la caractérisation, nous avons proposé une nouvelle technique d'analyse inspirée des motifs binaires locaux (Local Binary Patterns, LBP). Le nouveau descripteur, appelé 1DLBP (One Dimensional Local Binary Patterns) s'applique de manière unidimensionnelle. Pour tester l'efficacité de notre approche, nous avons réalisé deux études cliniques où le nouveau descripteur LBP1D est comparé à la méthode classique, LBP afin de classifier des patients ostéoporotiques et des sujets sains. Les pourcentages de classification obtenus ont été améliorés de 72% avec la méthode classique LBP à 91% avec le nouveau descripteur 1DLBP.
35

Onoda, Fuko. "Circular motifs and structure in Euphrase Kezilahabi’s Nagona and Mzingile and an ongoing Buddhistic study." Universitätsbibliothek Leipzig, 2017. http://nbn-resolving.de/urn:nbn:de:bsz:15-qucosa-220441.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
Nagona na Mzingile, riwaya za mwandishi wa Kiswahili Euphrase Kezilahabi, zinasemekana kuwa na mtindo wa kipekee wa usimuliaji, na simulizi changamano ambalo si rahisi kueleweka. Makala haya yamezichukulia riwaya hizo mbili kama hadithi moja, na kuchunguza muundo wa fumbo unaosababisha upekee wa riwaya hizo. Muundo huo utafunuliwa kuwa ni duara inayorudia uhai na ufu. Nitajaribu kuelewa muundo huo wa duara kutumia fikra ya mwanafalsafa wa dini, Mircea Eliade, na dini ya Ubudha
Nagona and Mzingile, written by a Swahili author Euphrase Kezilahabi, have been considered to have the unique narrative style and complex storyline, which make the novels difficult to understand. This article regards these two novels as a single inner-connected story to reveal a hidden structure, which makes the novels unique. This structure turns out to be a cycle which regularly repeats birth and death. I will try to analyse this circular structure by using thoughts of a theologian Mircea Eliade and Buddhism
36

Mirande, Sylvie Corinne. "Les contes populaires de la grande-lande (f. Arnaudin) : realites regionales et conte populaire." Toulouse 2, 1988. http://www.theses.fr/1988TOU20083.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
Miroir, produit et vecteur d'une conscience communautaire, la culture orale de l'ancienne lande a ete immortalisee par un ethnographe de premier plan : felix arnaudin. Sous l'empire d'une vision et d'une ecriture, l'ere mythique jouxte le passe chronologique et le fait coutumier, sous-tendant ainsi la chatoyante bigarrure des genres et l'unite d'un recueil ou le merveilleux. L'esoterisme et l'histoire s'imbriquent etroitement. L'etude des interferences liant recit et contexte sollicite deux proprietes essentielles du contage : l'integration et le pouvoir normatif. Deux mouvements notamment illustres par l'acculturation locale d'un patrimoine litteraire national : la bibliotheque bleue de troyes! au travers de ce constant effort d'auto-definition, l'oralite et la sauvegarde d'un systeme social d'ancien regime apparaissent ainsi consubstantielles. . . . L'analyse des constituants holographiques et homeostatiques de l'univers narratif (concepts empruntes a la cybernetique) considere alors au premier chef les effets speculaires et la genese discursive d'un delire. . . Tres controle!
A mirror, product and vector of a community consciouness, the oral culture of ancienne lande has been immortalized by an outstanding ethnographer : felix arnaudin. Under the influence of a vision and a literary style, the mythical era touches the chronological past and the customary fact, thus underlying the rich diversity og genres and the unity of an anthology in which the supernaturel, esoterism and history are closely interwoven. The study of the interactions between the narrative and the context reveals two essential characteristics of the tales : the integration and the power of social control. These two movements are illustrated, among other things, by the local assimilation of a national literary heritage ("bibliotheque bleue de troyes"). Through this constant struggle for self-assertion, the oral tradition and the protection of a social system of ancien regime appear to be consubstantial. The analysis of the "holographic" and "homeostatic" constituants of the narrative (both concepts being borrowed from cybernetics) then mainly centres on the mirror effects and the evolution process of a very controlled. . . Frenzy
37

Bezek, Perit. "A Clustering Method For The Problem Of Protein Subcellular Localization." Master's thesis, METU, 2006. http://etd.lib.metu.edu.tr/upload/12607981/index.pdf.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
In this study, the focus is on predicting the subcellular localization of a protein, since subcellular localization is helpful in understanding a protein&rsquo
s functions. Function of a protein may be estimated from its sequence. Motifs or conserved subsequences are strong indicators of function. In a given sample set of protein sequences known to perform the same function, a certain subsequence or group of subsequences should be common
that is, occurrence (frequency) of common subsequences should be high. Our idea is to find the common subsequences through clustering and use these common groups (implicit motifs) to classify proteins. To calculate the distance between two subsequences, traditional string edit distance is modified so that only replacement is allowed and the cost of replacement is related to an amino acid substitution matrix. Based on the modified string edit distance, spectral clustering embeds the subsequences into some transformed space for which the clustering problem is expected to become easier to solve. For a given protein sequence, distribution of its subsequences over the clusters is the feature vector which is subsequently fed to a classifier. The most important aspect if this approach is the use of spectral clustering based on modified string edit distance.
38

Sclippa, Jean-Claude. "L'évolution du sens esthétique et l'interrogation sur le beau dans les Avant-gardes de 1905 à 1935." Brest, 1997. http://www.theses.fr/1997BRES1005.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
L'évolution du sens esthétique est un mouvement généré par une succession constante d'innovations de 1905 à 1935. Du cubisme au surréalisme, les créations et les productions littéraires ou poétiques ont été observées, appréciées, contemplées et soumises à une activité critique, faisant apparaître de nouvelles techniques, de nouveaux moyens ou procédés, une nouvelle sensibilité, qui non seulement s'éloignent de l'esthétique classique, mais encore rompent définitivement avec elle. Des caractères communs, des théories nouvelles, une modernité sans cesse dépassée relient les mouvements d'avant-garde et sont mis en evidence dans un enchaînement ininterrompu de trois décennies. Trois grandes étapes (1905-1914, 1915-1924, 1925-1935) sont définies qui prouvent cette inéluctable évolution dans le cadre des mouvements d'avant-garde, le dernier englobant les avancées de ses prédécesseurs, de telle sorte que les fondements d'une nouvelle esthétique ne peuvent exister que dans un ordre événementiel, dans un véritable développement organique. L'intention esthétique de chaque poète ou écrivain est confirmée par la singularité de son oeuvre qui s'inscrit dans cette évolution continue des mouvements avant-gardistes et devient discernable dans une typologie de l'esthétique du XXeme siècle. La beauté s'y révèle sous des formes surprenantes, puisque le jugement esthétique n'est plus basé sur le goût, mais il investit pleinement le champ de l'appréciation cognitive
The evolution of the aesthetic sense is a movement that has been engendered by a constant succession of innovations from 1905 to 1935. From cubism to surrealism, literary or poetical creations and productions have been observed, appreciated, contemplated and submitted to critical activity, revealing new techniques, news ways or devices, a new sensibility, which not only move away from classical aesthetics but actually break away from it. Common traits, new theories, a modernity which keeps being outdated, connect the avant-garde movements and are outlined in the uninterrupted sequence of three decades. Three main stages (1905-1914,1915-1924, 1925-1935) are defined which testity to this ineluctable evolution within the sphere of the avant-garde movements, the latest taking over the innovations of its predecessors, so that the base of the new aesthetics cannot exist but in a factual order, in an actual organic development. The aesthetic intention of each poet or writer is confirmed by the singularity of the work which fits into the continuous evolution of the avant-garde movements and stands out in a typology of the xxth century's aesthetics. Beauty reveals itself in surprising shapes since the aesthetic jugement is no longer based on taste but fully takes up the field of cognitive appreciation
39

Bu, Daher Julie. "Sequential Pattern Generalization for Mining Multi-source Data." Thesis, Université de Lorraine, 2020. http://www.theses.fr/2020LORR0204.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
La digitalisation de notre monde est souvent associée à une production de grandes quantités de données. Ainsi, des outils de collecte et de stockage de données ont dû être développés, à des fins d’exploitation en recherche ou dans l’industrie. Les données collectées peuvent provenir de plusieurs sources, formant ainsi de gros corpus de données hétérogènes. Ces corpus peuvent être analysés pour extraire de l’information. C’est l’objet de la fouille de données, qui fait l’objet d’un intérêt grandissant depuis de nombreuses années. Différentes approches de fouille de données ont été proposées, parmi lesquelles la très populaire fouille de motifs. La fouille de motifs, qui inclut la fouille de motifs séquentiels, vise à extraire des motifs ordonnés fréquents dans les données.Dans le cadre de sources de données multiples, les données peuvent représenter des points de vue différents sur le phénomène représenté. Par ailleurs, la présence de similarité entre certains éléments de données est une caractéristique classique, qui mène à la perte d’information lors du processus de fouille. L’objectif de cette thèse est de concevoir un algorithme de fouille des motifs dans des données multi-source dans le but d’extraire une information pertinente tout en compensant la perte de motifs due à la similarité entre éléments et en limitant la redondance entre motifs. Plusieurs approches ont été proposées dans la littérature. Certaines fusionnent l’ensemble des sources dans un seul ensemble de données et exploitent un algorithme classique de fouille de motifs, ce qui mène à un algorithme complexe qui extrait un grand nombre de motifs redondants. D’autres fouillent les sources séparément ce qui peut mener à une perte potentielle de motifs. Nous proposons G_SPM, un algorithme de fouille de motifs séquentiels qui tire avantage des multiples sources de données à disposition dans le but de pallier le problème de la similarité entre éléments, en formant des motifs généraux. G_SPM adopte une stratégie de fouille sélective de sources, ce qui lui permet d’avoir une complexité limitée. Par ailleurs, G_SPM fouille dans un premier temps une unique source de données, celle qui lui permet d’avoir des motifs séquentiels les plus précis possibles. Les expérimentations menées confirment que G_SPM identifie des motifs généraux avec un temps d’exécution limité, il permet donc de gérer la similarité entre les éléments en compensant l’éclatement des occurrences sur plusieurs motifs
Huge amounts of digital data have been created across years due to the increasing digitization in our everyday life. As a consequence, fast data collection and storage tools have been developed and data can be collected in huge volumes for various research and business purposes. The collected data can come from multiple data sources and can be of heterogeneous kinds thus forming heterogeneous multi-source datasets, and they can be analyzed to extract valuable information. Data mining is an important task in discovering interesting information from datasets. Different approaches in this domain have been proposed, among which pattern mining is the most important one. Pattern mining, including sequential pattern mining, discovers statistically relevant patterns (or sequential patterns) among data. The challenges of this domain include discovering important patterns with a limited complexity and by avoiding redundancy among the resulting patterns. Multi-source data could represent descriptive and sequential data, making the mining process complex. There could be problems of data similarity on one source level which leads to a limited number of extracted patterns. The aim of the thesis is to mine multi-source data to obtain valuable information and compensate the loss of patterns due to the problem of similarity with a limited complexity and by avoiding pattern redundancy. Many approaches have been proposed to mine multi-source data. These approaches either integrate multi-source data and perform a single mining process which increases the complexity and generates a redundant set of sequential patterns, or they mine sources separately and integrate the results which could lead to a loss of patterns. We propose G_SPM, a general sequential pattern mining algorithm that takes advantage of multi-source data to mine general patterns which compensates the loss of patterns caused by the problem of data similarity. These rich patterns contain various kinds of information and have higher data coverage than traditional patterns. G_SPM adopts a selective mining strategy of data sources where a main source is first mined, and other sources are mined only when similarity among patterns is detected, which limits the complexity and avoids pattern redundancy. The experimental results confirm that G_SPM succeeds in mining general patterns with a limited complexity. In addition, it outperforms traditional approaches in terms of runtime and pattern redundancy
40

Egho, Elias. "Extraction de motifs séquentiels dans des données séquentielles multidimensionnelles et hétérogènes : une application à l'analyse de trajectoires de patients." Thesis, Université de Lorraine, 2014. http://www.theses.fr/2014LORR0066/document.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
Tous les domaines de la science et de la technologie produisent de gros volume de données hétérogènes. L'exploration de tels volumes de données reste toujours un défi. Peu de travaux ciblent l'exploration et l'analyse de données séquentielles multidimensionnelles et hétérogènes. Dans ce travail, nous proposons une contribution à la découverte de connaissances dans les données séquentielles hétérogènes. Nous étudions trois axes de recherche différents: (i) l'extraction de motifs séquentiels, (ii) la classification et (iii) le clustering des données séquentielles. Tout d'abord, nous généralisons la notion de séquence multidimensionnelle en considérant la structure complexe et hétérogène. Nous présentons une nouvelle approche MMISP pour extraire des motifs séquentiels à partir de données séquentielles multidimensionnelles et hétérogènes. MMISP génère un grand nombre de motifs séquentiels comme cela est généralement le cas pour toues les algorithmes d'énumération des motifs. Pour surmonter ce problème, nous proposons une nouvelle façon de considérer les séquences multidimensionnelles hétérogènes en les associant à des structures de patrons. Nous développons une méthode pour énumérer seulement les motifs qui respectent certaines contraintes. La deuxième direction de recherche est la classification de séquences multidimensionnelles et hétérogènes. Nous utilisons l'analyse formelle de concept (AFC) comme une méthode de classification. Nous montrons l'intérêt des treillis de concepts et de l'indice de stabilité pour classer les séquences et pour choisir quelques groupes intéressants de séquences. La troisième direction de recherche dans cette thèse est préoccupé par le regroupement des données séquentielles multidimensionnelles et hétérogènes. Nous nous basons sur la notion de sous-séquences communes pour définir une mesure de similarité permettant d'évaluer la proximité entre deux séquences formées d'une liste d'ensemble d'items. Nous utilisons cette mesure de similarité pour construire une matrice de similarité entre les séquences et pour les segmenter en plusieurs groupes. Dans ce travail, nous présentons les résultats théoriques et un algorithme de programmation dynamique permettant de compter efficacement toutes les sous-séquences communes à deux séquences sans énumérer toutes les séquences. Le système résultant de cette recherches a été appliqué pour analyser et extraire les trajectoires de soins de santé des patients en cancérologie. Les données sont issues d' une base de données médico-administrative incluant des informations sur des patients hospitalisent en France. Le système permet d'identifier et de caractériser des épisodes de soins pour des ensembles spécifiques de patients. Les résultats ont été discutés et interprétés avec les experts du domaine
All domains of science and technology produce large and heterogeneous data. Although a lot of work was done in this area, mining such data is still a challenge. No previous research work targets the mining of heterogeneous multidimensional sequential data. This thesis proposes a contribution to knowledge discovery in heterogeneous sequential data. We study three different research directions: (i) Extraction of sequential patterns, (ii) Classification and (iii) Clustering of sequential data. Firstly we generalize the notion of a multidimensional sequence by considering complex and heterogeneous sequential structure. We present a new approach called MMISP to extract sequential patterns from heterogeneous sequential data. MMISP generates a large number of sequential patterns as this is usually the case for pattern enumeration algorithms. To overcome this problem, we propose a novel way of considering heterogeneous multidimensional sequences by mapping them into pattern structures. We develop a framework for enumerating only patterns satisfying given constraints. The second research direction is in concern with the classification of heterogeneous multidimensional sequences. We use Formal Concept Analysis (FCA) as a classification method. We show interesting properties of concept lattices and of stability index to classify sequences into a concept lattice and to select some interesting groups of sequences. The third research direction in this thesis is in concern with the clustering of heterogeneous multidimensional sequential data. We focus on the notion of common subsequences to define similarity between a pair of sequences composed of a list of itemsets. We use this similarity measure to build a similarity matrix between sequences and to separate them in different groups. In this work, we present theoretical results and an efficient dynamic programming algorithm to count the number of common subsequences between two sequences without enumerating all subsequences. The system resulting from this research work was applied to analyze and mine patient healthcare trajectories in oncology. Data are taken from a medico-administrative database including all information about the hospitalizations of patients in Lorraine Region (France). The system allows to identify and characterize episodes of care for specific sets of patients. Results were discussed and validated with domain experts
41

Moisan, Monique. "Les représentations végétales dans la céramique apulienne." Master's thesis, Université Laval, 1988. http://hdl.handle.net/20.500.11794/29324.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
42

Graff, Gwenola. "Approche de l'iconographie nagadienne : les peintures sur vases Nagada I - Nagada II : problèmes de lecture et essais d'interprétation." Paris 4, 2002. http://www.theses.fr/2002PA040021.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
Ce travail porte sur un ensemble de 470 objets réunis d'après les publications et des visites de collections. Il s'agit de vases de la culture préhistorique égyptienne appelée Nagada, dans ses première et deuxième phase. Elles datent de 3900 à 3300 av. J. -C. Le décor de ces vases, complexe, a été découpé en ses différents éléments constituants, figuratifs et géométriques. Ils sont plus d'une centaine. Ils ont été identifiés et dénombrés. On a ensuite observé comment ils s'agençaient, grâce en particulier à l'analyse factorielle des comparaisons. Ceci a permis de dégager des relations d'affinité et de rejet entre certains signes et de mettre en évidence une stricte hiérarchie parmi eux. Les groupements sont analysés et expliqués lorsque cela est possible afin de comprendre à la fois la signification de ces scènes et leur fonctionnement interne. Cette étude sémiologique s'inscrit dans un contexte historique d'une période préparatoire à l'émergence de l'écriture et de la civilisation pharaonique
This work concerns a corpus of 470 objects gathered from publications and collections display. The objects are vases of Egyptian prehistoric culture named Naqada, from the first and second phases. They are dated from 3900 to 3300 B. C. .
43

Pennerath, Frédéric. "Méthodes d'extraction de connaissances à partir de données modélisables par des graphes : Application à des problèmes de synthèse organique." Phd thesis, Université Henri Poincaré - Nancy I, 2009. http://tel.archives-ouvertes.fr/tel-00436568.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
Des millions de réactions chimiques sont décrites dans des bases de données sous la forme de transformations de graphes moléculaires. Cette thèse propose différentes méthodes de fouille de donnés pour extraire des motifs pertinents contenus dans ces graphes et ainsi aider les chimistes à améliorer leurs connaissances des réactions chimiques et des molécules. Ainsi on commence par montrer comment le problème central de la recherche des schémas de réactions fréquents peut se résoudre à l'aide de méthodes existantes de recherche de sous-graphes fréquents. L'introduction du modèle général des motifs les plus informatifs permet ensuite de restreindre l'analyse de ces motifs fréquents à un nombre réduit de motifs peu redondants et représentatifs des données. Si l'application du modèle aux bases de réactions permet d'identifier de grandes familles de réactions, le modèle est inadapté pour extraire les schémas caractéristiques de méthodes de synthèse (schémas CMS) dont la fréquence est trop faible. Afin de surmonter cet obstacle, est ensuite introduite une méthode de recherche heuristique fondée sur une contrainte d'intervalle entre graphes et adaptée à l'extraction de motifs de très faible fréquence. Cette méthode permet ainsi de déterminer à partir d'exemples de réactions et sous certaines conditions le schéma CMS sous-jacent à une réaction donnée. La même approche est ensuite utilisée pour traiter le problème de la classification supervisée de sommets ou d'arêtes fondée sur leurs environnements puis exploitée pour évaluer la formabilité des liaisons d'une molécule. Les résultats produits ont pu être analysés par des experts de la synthèse organique et sont très encourageants.
44

Clément-Royer, Myriam. "Contes d'arbres, d'herbes et d'épée : approches du végétal dans le roman arthurien des XIIe et XIIIe siècles." Rennes 2, 2008. http://www.theses.fr/2008REN20004.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
La participation au conte arthurien de la figure des arbres et des herbes témoigne d'un parti pris esthétique et répond à une démarche d'intégration diégétique qui égrène, à partir des traditions livresques, et des suggestions de la réalité, une série de motifs typiques. Le roman revendique ainsi au fil des textes un "écosystème" végétal qui lui est propre. La fiction aura fait le succès d'une dynamique de rendez-vous armé à l'arbre qui conserve des liens avec l'histoire des faits de guerre et de diplomatie médiévaux. L'identification de l'"arbre de chevalerie" n'est pas laissée au hasard. L'éviction du chêne et la sélection du pin renvoie à une distribution romanesque des noms d'arbre, dont l'on examinera ici les principes fondateurs. Les herbes arthuriennes sont essentiellement des herbes de medecine. Les gestes du praticien seront différents selon les applications vulnéraires, alexitères ou para-pharmaceutiques du motif. Le réalisme reste cependant limité à cette spécialisation du geste. Car le conteur reste indifférent, mis à part le cas des épices, aux suggestions des nomenclatures du temps. Et le roman cultive essentiellement le mot générique erbe. Les problématiques soulevées par ce laconisme caractéristique, le soupçon de "magie" notamment, sont appréhendées. La mise en scène de la dynamique de vie du végétal, les heurs et malheurs de la végétation sont également ici observés. La thématique du gaste, qui s'offre à l'horizon de tous les romans du Graal élargit la problématique de la "reverdie" au delà des suggestions du topos du renouveau saisonnier hérité de la lyrique. La Queste deI Saint Graal remonte le fil de l'histoire de la multiplication végétative. Avec Gauvain et Galaad, l'imaginaire généalogique se greffe à la question du devenir des sèves
The use in the legend of King Arthur of particuliar trees and herbs reflect a deliberat estetik choice, and shows a volonty of diegetic insertion which creates, from litterary's traditions and reality's suggestions, some typicals developpements. The fiction makes necessary a dynamic of fight at the tree which keeps links with the history ofmedieval acts ofwar and diplomacy. The identification ofthe "chivalry tree" is not left toéhance. The eviction of the oak tree and the selection of the pille tree narrative refers to a ï6manesc distribution of the tree's names. The arthurian's herbs are essentially mecine herbs. The gestures of the practitioner will be different whether the design is used to cure injuries, as an antidote or for para-pharmaceutical reasons. But the realism is limited to this specialisation of the gesture. Because the storyteller remains indifferent, except for the spices case, to the suggestions of time nomenclatures. The tale cultives principally the generic term erbes. The integration of the plant's life is also the subject of these works. The thematic of the gaste, which opens new horizons to all the Grail romances broadens the problematic of the "reverdie" beyond the suggestions of the topos of the seasonal revival inherited from the lyrical. The Queste deI Saint Graal goes back the threads of the story of the vegetative multiplication. With Gauvain and Galaad, the genealogical imagination adds itself to the question of the becoming of the saps
45

Wiedmer, Stefanie, Alexander Erdbeer, Beate Volke, Stephanie Randel, Franz Kapplusch, Sacha Hanig, and Michael Kurth. "Identification and analysis of Eimeria nieschulzi gametocyte genes reveal splicing events of gam genes and conserved motifs in the wall-forming proteins within the genus Eimeria (Coccidia, Apicomplexa)." EDP Sciences, 2017. https://tud.qucosa.de/id/qucosa%3A30707.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
The genus Eimeria (Apicomplexa, Coccidia) provides a wide range of different species with different hosts to study common and variable features within the genus and its species. A common characteristic of all known Eimeria species is the oocyst, the infectious stage where its life cycle starts and ends. In our study, we utilized Eimeria nieschulzi as a model organism. This rat-specific parasite has complex oocyst morphology and can be transfected and even cultivated in vitro up to the oocyst stage. We wanted to elucidate how the known oocyst wall-forming proteins are preserved in this rodent Eimeria species compared to other Eimeria. In newly obtained genomics data, we were able to identify different gametocyte genes that are orthologous to already known gam genes involved in the oocyst wall formation of avian Eimeria species. These genes appeared putatively as single exon genes, but cDNA analysis showed alternative splicing events in the transcripts. The analysis of the translated sequence revealed different conserved motifs but also dissimilar regions in GAM proteins, as well as polymorphic regions. The occurrence of an underrepresented gam56 gene version suggests the existence of a second distinct E. nieschulzi genotype within the E. nieschulzi Landers isolate that we maintain.
46

Pham, Quang-Khai. "Time Sequence Summarization: Theory and Applications." Phd thesis, Université de Nantes, 2010. http://tel.archives-ouvertes.fr/tel-00538512.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
Les domaines de la médecine, du web, du commerce ou de la nance génèrent et stockent de grandes masses d'information sous la forme de séquences d'événements. Ces archives représentent des sources d'information très riches pour des analystes avides d'y découvrir des perles de connaissance. Par exemple, les biologistes cherchent à découvrir les facteurs de risque d'une maladie en analysant l'historique des patients, les producteurs de contenu web et les bureaux de marketing examinent les habitudes de consommation des clients et les opérateurs boursiers suivent les évolutions du marché pour mieux l'anticiper. Cependant, ces applications requièrent l'exploration de séquences d'événements très volumineuses, par exemple, la nance génère quotidiennement des millions d'événements, où les événements peuvent être décrits par des termes extraits de riches contenus textuels. La variabilité des descripteurs peut alors être très grande. De ce fait, découvrir des connaissances non triviales à l'aide d'approches classiques de fouille de données dans ces sources d'information prolixes est un problème dicile. Une étude récente montre que les approches classiques de fouille de données peuvent tirer prot de formes condensées de ces données, telles que des résultats d'agrégation ou encore des résumés. La connaissance ainsi extraite est qualiée de connaissance d'ordre supérieur. À partir de ce constat, nous présentons dans ces travaux le concept de résumé de séquence d'événements dont le but est d'amener les applications dépendantes du temps à gagner un facteur d'échelle sur de grandes masses de données. Un résumé s'obtient en transformant une séquence d'événements où les événements sont ordonnés chronologiquement. Chaque événement est précisément décrit par un ensemble ni de descripteurs symboliques. Le résumé produit est alors une séquence d'événements, plus concise que la séquence initiale, et pouvant s'y substituer dans les applications. Nous proposons une première méthode de construction guidée par l'utilisateur, appelée TSaR. Il s'agit d'un processus en trois phases : i) une généralisation, ii) un regroupement et iii) une formation de concepts. TSaR utilise des connaissances de domaine exprimées sous forme de taxonomies pour généraliser les descripteurs d'événements. Une fenêtre temporelle est donnée pour contrôler le processus de regroupement selon la proximité temporelle des événements. Dans un second temps, pour rendre le processus de résumé autonome, c'est- à-dire sans paramétrage, nous proposons une redénition du problème de résumé en un nouveau problème de classication. L'originalité de ce problème de classication tient au fait que la fonction objective à optimiser dépend simultanément du contenu des événements et de leur proximité dans le temps. Nous proposons deux algorithmes gloutons appelés G-BUSS et GRASS pour répondre à ce problème. Enn, nous explorons et analysons l'aptitude des résumés de séquences d'événements à contribuer à l'extraction de motifs séquentiels d'ordre supérieur. Nous analysons les caractéristiques des motifs fréquents extraits des résumés et proposons une méthodologie qui s'appuie sur ces motifs pour en découvrir d'autres, à granularité plus ne. Nous évaluons et validons nos approches de résumé et notre méthodologie par un ensemble d'expériences sur un jeu de données réelles extraites des archives d'actualités nancières produites par Reuters.
47

Yahaya, Alassan Mahaman Sanoussi. "Amélioration du système de recueils d'information de l'entreprise Semantic Group Company grâce à la constitution de ressources sémantiques." Thesis, Paris 10, 2017. http://www.theses.fr/2017PA100086/document.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
Prendre en compte l'aspect sémantique des données textuelles lors de la tâche de classification s'est imposé comme un réel défi ces dix dernières années. Cette difficulté vient s'ajouter au fait que la plupart des données disponibles sur les réseaux sociaux sont des textes courts, ce qui a notamment pour conséquence de rendre les méthodes basées sur la représentation "bag of words" peu efficientes. L'approche proposée dans ce projet de recherche est différente des approches proposées dans les travaux antérieurs sur l'enrichissement des messages courts et ce pour trois raisons. Tout d'abord, nous n'utilisons pas des bases de connaissances externes comme Wikipedia parce que généralement les messages courts qui sont traités par l'entreprise proveniennent des domaines spécifiques. Deuxièment, les données à traiter ne sont pas utilisées pour la constitution de ressources à cause du fonctionnement de l'outil. Troisièment, à notre connaissance il n'existe pas des travaux d'une part qui exploitent des données structurées comme celles de l'entreprise pour constituer des ressources sémantiques, et d'autre part qui mesurent l'impact de l'enrichissement sur un système interactif de regroupement de flux de textes. Dans cette thèse, nous proposons la création de ressources permettant d'enrichir les messages courts afin d'améliorer la performance de l'outil du regroupement sémantique de l'entreprise Succeed Together. Ce dernier implémente des méthodes de classification supervisée et non supervisée. Pour constituer ces ressources, nous utilisons des techniques de fouille de données séquentielles
Taking into account the semantic aspect of the textual data during the classification task has become a real challenge in the last ten years. This difficulty is in addition to the fact that most of the data available on social networks are short texts, which in particular results in making methods based on the "bag of words" representation inefficient. The approach proposed in this research project is different from the approaches proposed in previous work on the enrichment of short messages for three reasons. First, we do not use external knowledge like Wikipedia because typically short messages that are processed by the company come from specific domains. Secondly, the data to be processed are not used for the creation of resources because of the operation of the tool. Thirdly, to our knowledge there is no work on the one hand, which uses structured data such as the company's data to constitute semantic resources, and on the other hand, which measure the impact of enrichment on a system Interactive grouping of text flows. In this thesis, we propose the creation of resources enabling to enrich the short messages in order to improve the performance of the tool of the semantic grouping of the company Succeed Together. The tool implements supervised and unsupervised classification methods. To build these resources, we use sequential data mining techniques
48

Saidi, Rabie. "Motif extraction from complex data : case of protein classification." Thesis, Clermont-Ferrand 2, 2012. http://www.theses.fr/2012CLF22272/document.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
La classification est l’un des défis important en bioinformatique, aussi bien pour les données protéiques que nucléiques. La présence de ces données en grandes masses, leur ambiguïté et en particulier les coûts élevés de l’analyse in vitro en termes de temps et d’argent, rend l’utilisation de la fouille de données plutôt une nécessité qu’un choix rationnel. Cependant, les techniques fouille de données, qui traitent souvent des données sous le format relationnel, sont confrontés avec le format inapproprié des données biologiques. Par conséquent, une étape inévitable de prétraitement doit être établie. Cette thèse traite du prétraitement de données protéiques comme une étape de préparation avant leur classification. Nous présentons l’extraction de motifs comme un moyen fiable pour répondre à cette tâche. Les motifs extraits sont utilisés comme descripteurs, en vue de coder les protéines en vecteurs d’attributs. Cela permet l’utilisation des classifieurs connus. Cependant, la conception d’un espace appropié d’attributs, n’est pas une tâche triviale. Nous traitons deux types de données protéiques à savoir les séquences et les structures 3D. Dans le premier axe, i:e:; celui des séquences, nous proposons un nouveau procédé de codage qui utilise les matrices de substitution d’acides aminés pour définir la similarité entre les motifs lors de l’étape d’extraction. En utilisant certains classifieurs, nous montrons l’efficacité de notre approche en la comparant avec plusieurs autres méthodes de codage. Nous proposons également de nouvelles métriques pour étudier la robustesse de certaines de ces méthodes lors de la perturbation des données d’entrée. Ces métriques permettent de mesurer la capacité d’une méthode de révéler tout changement survenant dans les données d’entrée et également sa capacité à cibler les motifs intéressants. Le second axe est consacré aux structures protéiques 3D, qui ont été récemment considérées comme graphes d’acides aminés selon différentes représentations. Nous faisons un bref survol sur les représentations les plus utilisées et nous proposons une méthode naïve pour aider à la construction de graphes d’acides aminés. Nous montrons que certaines méthodes répandues présentent des faiblesses remarquables et ne reflètent pas vraiment la conformation réelle des protéines. Par ailleurs, nous nous intéressons à la découverte, des sous-structures récurrentes qui pourraient donner des indications fonctionnelles et structurelles. Nous proposons un nouvel algorithme pour trouver des motifs spatiaux dans les protéines. Ces motifs obéissent à un format défini sur la base d’une argumentation biologique. Nous comparons avec des motifs séquentiels et spatiaux de certains travaux reliés. Pour toutes nos contributions, les résultats expérimentaux confirment l’efficacité de nos méthodes pour représenter les séquences et les structures protéiques, dans des tâches de classification. Les programmes développés sont disponibles sur ma page web http://fc.isima.fr/~saidi
The classification of biological data is one of the significant challenges inbioinformatics, as well for protein as for nucleic data. The presence of these data in hugemasses, their ambiguity and especially the high costs of the in vitro analysis in terms oftime and resources, make the use of data mining rather a necessity than a rational choice.However, the data mining techniques, which often process data under the relational format,are confronted with the inappropriate format of the biological data. Hence, an inevitablestep of pre-processing must be established.This thesis deals with the protein data preprocessing as a preparation step before theirclassification. We present motif extraction as a reliable way to address that task. The extractedmotifs are used as descriptors to encode proteins into feature vectors. This enablesthe use of known data mining classifiers which require this format. However, designing asuitable feature space, for a set of proteins, is not a trivial task.We deal with two kinds of protein data i:e:, sequences and tri-dimensional structures. In thefirst axis i:e:, protein sequences, we propose a novel encoding method that uses amino-acidsubstitution matrices to define similarity between motifs during the extraction step. Wedemonstrate the efficiency of such approach by comparing it with several encoding methods,using some classifiers. We also propose new metrics to study the robustness of some ofthese methods when perturbing the input data. These metrics allow to measure the abilityof the method to reveal any change occurring in the input data and also its ability to targetthe interesting motifs. The second axis is dedicated to 3D protein structures which are recentlyseen as graphs of amino acids. We make a brief survey on the most used graph-basedrepresentations and we propose a naïve method to help with the protein graph making. Weshow that some existing and widespread methods present remarkable weaknesses and do notreally reflect the real protein conformation. Besides, we are interested in discovering recurrentsub-structures in proteins which can give important functional and structural insights.We propose a novel algorithm to find spatial motifs from proteins. The extracted motifsmatch a well-defined shape which is proposed based on a biological basis. We compare withsequential motifs and spatial motifs of recent related works. For all our contributions, theoutcomes of the experiments confirm the efficiency of our proposed methods to representboth protein sequences and protein 3D structures in classification tasks.Software programs developed during this research work are available on my home page http://fc.isima.fr/~saidi
49

Chiu, Chia-Ping. ""Un singulier mariage" : le cycle du fiancé animal dans les versions orales chinoises et françaises de deux grands contes de tradition orale (ATU 425, ATU 433)." Paris 7, 2010. http://www.theses.fr/2010PA070065.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.
Анотація:
Les contes La Belle et la Bête et Le Prince-serpent, largement diffusés en Europe et en Asie, abordent le thème du « cycle du fiancé animal » qui est le sujet central de cette recherche. L'objectif de cette recherche est, d'une part, d'étudier ce thème du « fiancé animal » à travers les variantes des pays de cultures aussi différentes que la France et la Chine, d'autre part, d'analyser ce conte et la symbolique qui le sous-tend. Les protagonistes, tous célibataires, cherchent l'âme sœur dans leur parcours initiatique. Cependant un «beau mariage» rêvé par tous, est influencé, voire imposé, par les institutions sociales et les coutumes de chaque culture. C'est un désir venant de soi mais également un devoir obligé par la communauté qui nous entoure. Comment rendre compte de la condition du héros qui cherche à s'humaniser, et du parcours de l'héroïne - curieuse, courageuse, compassionnelle mais soumise à son destin - qui doit endurer une série de pénitences avant de devenir une « vraie épouse » ? Le héros et l'héroïne ont chacun leur devoir, leur fonction et des obstacles à franchir sur le chemin de l'initiation. Chacun d'eux se réalise dans une union conjugale qui commande une trajectoire en même temps qu'un statut social Cette recherche est d'essayer de comprendre plus clairement ce beau récit de tradition orale, d'en présenter les formes multiples, la diffusion dans l'espace et le temps, le contenu symbolique et sociologique
The tales "Beauty and Beast" and "The snake-prince" broadly circulated both in Europe and Asia take up the topic of the "animal fiancé cycle" which constitutes the main subject of this research. On one hand, the object of our research aims to study the theme of the "animal fiancé" through variant forms in the cultures of countries as different as France and China and on the other hand, to analyses the underlying symbolic structure. The protagonists, all single, seek the congenial soul in their initiatory quest. However, the common dream of a "fine marriage" is not only influenced but also imposed by the social institutions and traditions of each culture. This fantasy emerges as a personal desire but also as a bounder duty set by a community. How can we account for the condition of the hero who strives to become fully human or the heroine's plight? She proves curious, courageous, sympathetic, but doomed to endure a sting of hardships and punishments before becoming a "true wife". The hero and heroine face separate duties, functions and obstacles to overcome in their progress to initiation. Each achieves self-fulfilment in matrimony which entails destiny as well as social status. This study tries to understand more clearly this beautiful narrative belonging to oral tradition record, show its multiple forms, its transmission in time and space, and bring out its symbolic and sociological content
50

Manser, Sarina. "Wall motion classification of stress echocardiography." Thesis, University of Oxford, 2009. http://ethos.bl.uk/OrderDetails.do?uin=uk.bl.ethos.526081.

Повний текст джерела
Стилі APA, Harvard, Vancouver, ISO та ін.

До бібліографії