Dissertations / Theses: 'Réseau documentaire'

1

Bannour, Ines. "Recherche d’information s´emantique : Graphe sémantico-documentaire et propagation d’activation." Thesis, Sorbonne Paris Cité, 2017. http://www.theses.fr/2017USPCD024/document.

Full text

Abstract:

La recherche d’information sémantique (RIS), cherche à proposer des modèles qui permettent de s’appuyer, au delà des calculs statistiques, sur la signiﬁcation et la sémantique des mots du vocabulaire, aﬁn de mieux caractériser les documents pertinents au regard du besoin de l’utilisateur et de les retrouver. Le but est ainsi de dépasser les approches classiques purement statistiques (de « sac de mots »), fondées sur des appariements de chaînes de caractères sur la base des fréquences des mots et de l’analyse de leurs distributions dans le texte. Pour ce faire, les approches existantes de RIS, à travers l’exploitation de ressources sémantiques externes (thésaurus ou ontologies), procèdent en injectant des connaissances dans les modèles classiques de RI de manière à désambiguïser le vocabulaire ou à enrichir la représentation des documents et des requêtes. Il s’agit le plus souvent d’adaptations de ces modèles, on passe alors à une approche « sac de concepts » qui permet de prendre en compte la sémantique notamment la synonymie. Les ressources sémantiques, ainsi exploitées, sont « aplaties », les calculs se cantonnent, généralement, à des calculs de similarité sémantique. Aﬁn de permettre une meilleure exploitation de la sémantique en RI, nous mettons en place un nouveau modèle, qui permet d’uniﬁer de manière cohérente et homogène les informations numériques (distributionnelles) et symboliques (sémantiques) sans sacriﬁer la puissance des analyses. Le réseau sémantico-documentaire ainsi modélisé est traduit en graphe pondéré. Le mécanisme d’appariement est assuré par une propagation d’activation dans le graphe. Ce nouveau modèle permet à la fois de répondre à des requêtes exprimées sous forme de mots clés, de concepts oumême de documents exemples. L’algorithme de propagation a le mérite de préserver les caractéristiques largement éprouvéesdes modèles classiques de recherche d’information tout en permettant une meilleure prise en compte des modèles sémantiques et de leurs richesse. Selon que l’on introduit ou pas de la sémantique dans ce graphe, ce modèle permet de reproduire une RI classique ou d’assurer en sus certaines fonctionnalités sémantiques. La co-occurrence dans le graphe permet alors de révélerune sémantique implicite qui améliore la précision en résolvant certaines ambiguïtés sémantiques.L’exploitation explicite des concepts ainsi que des liens du graphe, permettent la résolution des problèmes de synonymie, de term mismatch et de couverture sémantique. Ces fonctionnalités sémantiques, ainsi que le passage à l’échelle du modèle présenté, sont validés expérimentalement sur un corpus dans le domaine médical
Semantic information retrieval (SIR) aims to propose models that allow us to rely, beyond statistical calculations, on the meaning and semantics of the words of the vocabulary, in order to better represent relevant documents with respect to user’s needs, and better retrieve them.The aim is therefore to overcome the classical purely statistical (« bag of wordsé») approaches, based on strings’ matching and the analysis of the frequencies of the words and their distributions in the text.To do this, existing SIR approaches, through the exploitation of external semantic resources (thesauri, ontologies, etc.), proceed by injecting knowledge into the classical IR models (such as the vector space model) in order to disambiguate the vocabulary or to enrich the representation of documents and queries.These are usually adaptations of the classical IR models. We go so to a « bag of concepts » approach which allows us to take account of synonymy. The semantic resources thus exploited are « ﬂattened », the calculations are generally conﬁned to calculations of semantic similarities.In order to better exploit the semantics in RI, we propose a new model, which allows to unify in a coherent and homogeneous way the numerical (distributional) and symbolic (semantic) information without sacriﬁcing the power of the analyzes of the one for the other. The semantic-documentary network thus modeled is translated into a weighted graph. The matching mechanism is provided by a Spreading activation mechanism in the graph. This new model allows to respond to queries expressed in the form of key words, concepts or even examples of documents. The propagation algorithm has the merit of preserving the well-tested characteristics of classical information retrieval models while allowing a better consideration of semantic models and their richness.Depending on whether semantics is introduced in the graph or not, this model makes it possible to reproduce a classical IR or provides, in addition, some semantic functionalities. The co-occurrence in the graph then makes it possible to reveal an implicit semantics which improves the precision by solving some semantic ambiguities. The explicit exploitation of the concepts as well as the links of the graph allow the resolution of the problems of synonymy, term mismatch, semantic coverage, etc. These semantic features, as well as the scaling up of the model presented, are validated experimentally on a corpus in the medical ﬁeld

APA, Harvard, Vancouver, ISO, and other styles

2

Rouissi, Jalel. "L'évaluation des effets de réseau en bibliothèques : pour une meilleure prise en compte des coûts et avantages qualitatifs de la coopération." Lyon 2, 2001. http://theses.univ-lyon2.fr/documents/lyon2/2001/rouissi_j.

Full text

Abstract:

Cette thèse propose une méthode d'évaluation des effets qualitatifs des réseaux inter-bibliothèques. Ces dernières ont l'habitude de ne voir dans le réseau que des avantages et négligent les contraintes qui accompagnent leur entrée dans le réseau. Parfois, les effets négatifs peuvent être plus importants que les avantages et mettent en cause le bien fondé de la coopération. Une évaluation ex-ante des coûts et avantages du réseau se révèle nécessaire. Les spécificités des bibliothèques font que leurs réseaux se caractérisent par la présence d'effets qualitatifs difficiles, voire même impossibles à mesurer. Deux outils théoriques et une enquête de terrain ont constitué le cadre conceptuel et méthodologique du travail. Le premier outil est le modèle du réseau en tant que machine relationnelle à trois composantes infrastructurelle, organisationnelle et culturelle. Le deuxième outil consiste en l'identification de trois facettes de la bibliothèque au niveau desquelles se manifestent les effets qualitatifs, à savoir les rapports avec l'environnement externe, l'offre de services et l'environnement interne. L'enquête a été menée auprès du réseau des pôles associés de la BnF. La méthode d'évalutation porposée est basée sur la construction d'une série d'indicateurs d'effets à partir d'une liste de questions dégagées par l'enquête. Les données fournies par les indicateurs seront confrontées à des critères d'appréciation pour être évaluées. Pour pouvoir comparer l'ensemble des effets constatés et dont les ordres de grandeur ne sont pas homogènes, on propose de les pondérer sur une échelle de quatre degrés : très avantageux (++), avantageux (+), désavantageux (-), très désavantageux (--). L'évaluateur établira la pondération en fonction du résultat de la confrontation entre l'indicateur et ses critères de jugement. Un système de bonification est proposé pour tenir compte de la différence du poids des composantes dans la formation des effets. L'ensemble des étapes débouche sur la construction d'une matrice d'évaluation ex-ante qui répartit les effets qualitatifs sur un repère dont les abscisses sont les composantes réseau et les ordonnées sont les niveaux de repérage.

APA, Harvard, Vancouver, ISO, and other styles

3

Enguehard, Chantal. "Acquisition naturelle automatique d'un réseau sémantique." Compiègne, 1992. http://www.theses.fr/1992COMPD527.

Full text

Abstract:

Cette recherche se situe dans le domaine des systèmes de documentation. Nous présentons un état de l'art des méthodes d'indexation automatique dont nous détaillons la partie concernant la sélection de thésaurus. Ensuite, nous exposons nos hypothèses et le système ANA (Apprentissage Naturel Automatique) que nous avons développé. Le système ANA effectue automatiquement l'extraction de la terminologie d'un domaine et structure cet ensemble de concepts en un réseau sémantique. Cette acquisition de connaissances est fondée sur l'étude de textes libres. Le système n'utilise ni grammaire ni dictionnaire mais s'appuie sur des procédures statistiques, ce qui le rend indépendant de la langue utilisée dans les textes. Dans un premier module le système se familiarise avec la langue (il apprend quelques éléments de syntaxe ainsi qu'une liste de mots fonctionnels), et avec le domaine (il sélectionne quelques éléments de terminologie qui constituent le noyau initiateur des connaissances). Le second module rassemble les trois procédures d'acquisition de nouveaux concepts. Celles-ci utilisent la connaissance acquise précédemment, tant sur le langage que sur le domaine. Le résultat est un réseau sémantique rassemblant les éléments de terminologie présents dans les textes analysés. Le système a été testé et évalué sur de gros corpus. Ces résultats ont conduit à sa prochaine industrialisation. De nombreux développements sont maintenant envisagés tels l'établissement automatique de taxonomie, ou l'analyse automatique des réseaux sémantiques afin d'en extraire la connaissance implicite.

APA, Harvard, Vancouver, ISO, and other styles

4

Mimouni, Nada. "Interrogation d'un réseau sémantique de documents : l'intertextualité dans l'accès à l'information juridique." Thesis, Sorbonne Paris Cité, 2015. http://www.theses.fr/2015USPCD084/document.

Full text

Abstract:

Une collection documentaire est généralement représentée comme un ensemble de documents mais cette modélisation ne permet pas de rendre compte des relations intertextuelles et du contexte d’interprétation d’un document. Le modèle documentaire classique trouve ses limites dans les domaines spécialisés où les besoins d’accès à l’information correspondent à des usages spécifiques et où les documents sont liés par de nombreux types de relations. Ce travail de thèse propose deux modèles permettant de prendre en compte cette complexité des collections documentaire dans les outils d’accès à l’information. Le premier modèle est basée sur l’analyse formelle et relationnelle de concepts, le deuxième est basée sur les technologies du web sémantique. Appliquées sur des objets documentaires ces modèles permettent de représenter et d’interroger de manière unifiée les descripteurs de contenu des documents et les relations intertextuelles qu’ils entretiennent
A collection of documents is generally represented as a set of documents but this simple representation does not take into account cross references between documents, which often defines their context of interpretation. This standard document model is less adapted for specific professional uses in specialized domains in which documents are related by many various references and the access tools need to consider this complexity. We propose two models based onformal and relational concept analysis and on semantic web techniques. Applied on documentary objects, these two models represent and query in a unified way documents content descriptors and documents relations

APA, Harvard, Vancouver, ISO, and other styles

5

Gueret, Christophe. "Navigateurs internet intelligents : algorithmes de fourmis artificielles pour la diffusion d'informations dans un réseau P2P." Tours, 2006. http://www.theses.fr/2006TOUR4020.

Full text

Abstract:

Dans ce travail de thèse, nous proposons l'architecture PIAF (Personnal Intelligent Agent Framework) dont l'objectif est de fournir aux utilisateurs un environnement d'échange d'informations non intrusif, autonome et polyvalent. Les problématiques de diffusion de l'information entre utilisateurs et d'optimisation de la topologie du réseau sont abordés avec un algorithme utilisant des fourmis artificielles. L'utilisation de phéromones artificielles déposées sur les connexions entre pairs lors des transferts autorise la constitution d'une mémoire globale des échanges et la détection de centres d'intérêts partagés. Comparativement aux solutions existantes, l'avantage de notre algorithme est d'affranchir l'utilisateur de la définition de profils. Ce dernier n'a besoin ni de s'abonner à un quelconque canal de diffusion ni de paramétrer ses centres d'intérêts pour pouvoir échanger de l'information
In this thesis, we propose the architecture PIAF (Personnal Intelligent Framework Agent) whose objective is to provide users with an environment of nonintrusive, autonomous and general-purpose exchange of information. The problems of diffusion of information between users and optimization of the network's topology are approached with an algorithm using artificial ants. The use of artificial pheromones deposited on connections between peers at the time of the transfers authorizes the constitution of a global memory of the exchanges and the detection of centers of shared centers of interests. Comparatively with the existing solutions, the advantage of our algorithm is to free the user from the definition of profiles. This last needs neither to subscribe with diffusion channel nor to define its centers of interests to be able to exchange information

APA, Harvard, Vancouver, ISO, and other styles

6

Bascans, Jérémy. "Modèles de mémoires d'entreprise avec intégration automatique d'informations." Thesis, Toulouse 3, 2017. http://www.theses.fr/2017TOU30144.

Full text

Abstract:

Aujourd'hui, les entreprises manipulent de gros volumes d'information qui ne cessent d'augmenter, toujours plus complexes et hétérogènes, autant dans leurs contenus que dans leurs structures. Ces informations, vitales pour le fonctionnement de ces entreprises, représentent aussi un capital de connaissances qui est souvent peu exploité. De ce fait, une attention particulière est portée aux systèmes de Mémoire d'Entreprise (ME). Ces mémoires ont pour objectif de capitaliser les informations produites et échangées par tous les acteurs internes et externes (Système d'Information (SI), employés, clients, fournisseurs, etc...) de l'entreprise dans le but de les représenter, de les partager et d'aider à la prise de décision collaborative. Les informations organisées, partagées et réutilisées, deviennent ainsi des connaissances organisationnelles. L'implantation d'une telle mémoire demande une forte implication de tous les acteurs en impactant directement leurs tâches et en nécessitant des modifications de leur SI. Dans ce contexte, l'objectif de cette thèse est de permettre la capitalisation automatique des informations en organisant, représentant et contextualisant automatiquement au mieux les informations, afin qu'elles puissent être partagées puis exploitées tout en limitant au maximum l'effort des acteurs. En plus d'impliquer les acteurs, les recherches actuelles se limitent souvent à des solutions spécifiques aux types d'entreprises et de mémoires. Afin de contribuer à lever ces limitations, nous proposons une approche de " Mémoire d'Entreprise Adaptative avec Intégration Automatique des Informations ", basée sur un réseau hétérogène étendu. Un premier niveau de cette approche propose un méta-modèle de ME corrélé à un processus d'intégration automatique des informations indépendant du type d'entreprise, du métier et ses acteurs. Afin d'aider tout type d'entreprise à construire sa ME à partir du méta- modèle, nous proposons, à un second niveau, un modèle générique et extensible lié à un algorithme d'intégration automatique des informations, nommé MEIAI pour Mémoire d'Entreprise avec Intégration Automatique des Informations. Ce modèle MEIAI a été implémenté et validé dans sa capacité à intégrer automatiquement de nouvelles informations d'une manière pertinente. Parce que Wikipédia est un important vecteur de connaissance basé sur la création collaborative véhiculant des valeurs de partage très fortes, nous avons choisi d'évaluer la capacité de notre prototype à organiser l'information de la même manière que lui. L'évaluation concerne le processus d'appariement automatique d'informations dont l'objectif est d'associer de manière intelligible, dans un cadre général non déterministe, les informations entre elles dans la mémoire. Pour ce faire, nous avons dans un premier temps évalué et comparé notre approche en liant des documents à des sujets d'intérêts de manière similaire à Wikipédia pour comparer les similarités et dissimilarités entre eux. Dans un second temps, nous avons procédé à une étude détaillée des dissimilarités au travers d'une évaluation par l'homme de l'organisation de l'information au sein de notre ME et de son intégration automatique
Today, companies manipulate large volumes of information that are constantly increasing, always more complex and heterogeneous, in their content and their structures. This information, necessary for these enterprises' operation, represents a knowledge capital often not exploited. As a result, special attention is given to Organizational Memory (OM) systems. The purpose of these memories is to capitalize the information produced and exchanged by the internal and external actors (Information System (IS), employees, customers, suppliers, etc.) of the company with the aim of representing and sharing them while helping collaborative decision-making. Thereby organized, shared and reused information becomes organizational knowledge. The implementation of this memory requires a strong involvement of all stakeholders by directly impacting their tasks and requiring changes to their IS. In this context, this thesis objective is to enable the automatic capitalization of information by automatically organizing, representing and contextualizing the information so that they can be shared and exploited while minimizing the stakeholders' effort. In addition to involving stakeholders, current research is often limited to solutions specific to the companies and memories types. To help overcome these limitations, we propose an " Adaptive Organizational Memory with Automatic Integration of Information process ", based on an extended heterogeneous network. A first level of this approach proposes a meta-model of OM correlated to a process of automatic integration of information independent of the company type, the job and its stakeholders. In order to help any type of company to build its OM from the meta-model, we propose, at a second level, a generic and extensible model linked to an algorithm of automatic integration of the information, named OMAII for Organizational Memory with Automatic Integration of Information process. This OMAII model has been implemented and validated in its ability to automatically integrate new information in a relevant way. Because Wikipedia is an important vector of knowledge based on the collaborative creation based on very strong values of sharing, we chose to evaluate the capacity of our prototype to organize the information in the same way. The evaluation concerns the automatic information matching process of which the purpose is to intelligibly associate the information with each other in the memory in a non-deterministic general framework. To do this, we first evaluated and compared our approach by linking documents to interest subjects in a similar way to Wikipedia to compare similarities and dissimilarities between them. In a second step, we conducted a detailed study of the dissimilarities through a human evaluation of the information organization within our OM and its automatic integration

APA, Harvard, Vancouver, ISO, and other styles

7

Dahmane, Madjid. "Contribution à l'étude des systèmes d'information scientifique et technique : Approche théorique et étude de cas de l'Algérie." Phd thesis, Université Michel de Montaigne - Bordeaux III, 1990. http://tel.archives-ouvertes.fr/tel-00597405.

Full text

Abstract:

La Thèse se propose d'étudier le concept de système national d'information scientifique et technique sous ses différentes facettes historique, terminologique, structurelle et fonctionnelle afin de dégager son substrat théorique, méthodologique et cognitif. Lequel substrat permet d'approcher le cas d'un tel système dans le contexte algérien. Dans ce cadre, le paradigme systémique a été particulièrement mis à contribution ainsi que les différentes catégories constitutive d'un système national d'IST type pour jouer le rôle de "grille d'analyse et d'approche" du cas algérien. Ce qui a permis de dégager les dysfonctionnements caractérisant le système national algérien d'IST en même que de dégager le système de causalité à l'origine de ces dysfonctionnements. C'est à ce titre là qu'une relation est établie entre le développement économique et le système d'IST.

APA, Harvard, Vancouver, ISO, and other styles

8

Gardiès, Cécile. "De la mouvance identitaire à l'ancrage scientifique des professionnels de l'information-documentation dans l'Enseignement Agricole." Phd thesis, Université Toulouse le Mirail - Toulouse II, 2006. http://tel.archives-ouvertes.fr/tel-00349759.

Full text

Abstract:

L'évolution rapide de la documentation dans l'enseignement secondaire a marqué et complexifié l'organisation des systèmes d'information et les pratiques professionnelles des documentalistes. Des questionnements autour de la professionnalisation du métier, de l'organisation en réseau des systèmes d'information ou encore du choix de la formation à l'information dans le cadre d'une discipline scolaire sont abordés sur le terrain spécifique de l'enseignement agricole par une approche méthodologique croisée.
Ces interrogations montrent la nécessité de repenser les liens entre les pratiques et leurs référents théoriques comme susceptibles de constituer un socle scientifique et professionnel commun et un cadre d'analyse constructif. Ainsi les Sciences de l'Information et de la Communication peuvent éclairer les problèmes soulevés au travers de la définition d'un réseau de concepts propres à l'information-documentation et d'une réflexion épistémologique. Cette centration sur les SIC n'exclut pas des apports complémentaires comme ceux de la sociologie du travail ou des Sciences de l'Education sur les questions de professionnalisation, de formation et d'enseignement. L'hypothèse d'une interaction productive entre recherche scientifique et évolution des pratiques professionnelles permet de repenser la place des savoirs et d'envisager une meilleure appréhension et compréhension des phénomènes informationnels en jeu dans l'enseignement secondaire en France.

APA, Harvard, Vancouver, ISO, and other styles

9

Parmentier, François. "Spécification d'une architecture émergente fondée sur le raisonnement par analogie : application aux références bibliographiques." Phd thesis, Université Henri Poincaré - Nancy I, 1998. http://tel.archives-ouvertes.fr/tel-00003024.

Full text

Abstract:

BAsCET est un système multi-agents à « blackboard », fondé sur l'émergence de concepts dans un modèle dynamique et inspiré de COPYCAT. Pour éviter un raisonnement déterministe unique limitant sa
créativité il adapte son comportement en fonction de la solution courante. Nous l'avons appliqué à la reconnaissance automatique de la structure logique (des champs) de références bibliographiques dans les articles scientifiques (en format uniquement physique, c'est-à-dire en PostScript). Le modèle, appelé Réseau de Concepts, s'apparentant à la fois aux réseaux sémantiques et aux réseaux de neurones, est construit automatiquement à partir d'une base de références BIBTeX. Le système utilise les co-occurrences entre les termes des références pour rapprocher dans le modèle ceux qui sont conceptuellement voisins. Le principe de l'analogie est utilisé sur les références de la base : quand le système rencontre une référence inconnue, il fait l'analogie avec la partie physique de la base et essaye de proposer une solution correspondante. Les résultats obtenus, bien que modérés (65,5% de reconnaissance), laissent augurer des résultats encore meilleurs, après optimisation du système.

APA, Harvard, Vancouver, ISO, and other styles

10

Blocquaux, Stéphane Yves. "Les réseaux documentaires éducatifs : de la médiatisation à l'industrialisation." Paris 13, 2004. http://www.theses.fr/2004PA131026.

Full text

Abstract:

Les établissements scolaires français utilisent majoritairement les produits et services documentaires édités par le CRDP de Charentes-Poitou. A travers l'analyse des discours de ses promoteurs et des stratégies institutionnelles en jeu dans leur expérimentation, notre recherche étudie les enjeux et les processus de généralisation de ce qui est devenu la plate-forme documentaire nationale de référence dans le champ éducatif. L'hypothèse au cœur de notre analyse est que la véritable innovation portée par cet outil réside dans le processus d'industrialisation de la documentation piloté par une ingénierie centralisée et conduisant à la mise en cohérence des différents éléments d'un système de reproduction et de massification des produits documentaires. Il apparaît que cette industrialisation tend à s'inscrire dans des dynamiques globales de structuration des sphères du savoir, impulsées par des logiques territoriales et sociétales qui ne sont pas toujours convergentes
French schools use for the most part the documents and services of the Regional Centre for Educational Documents in the region of Charentes-Poitou. By analysing the discourse of those who advocate this method and the institutional strategies at play in their experiment, our study examines the consequences and the process of dissemination of what has become a recognised national point of reference in the field of education. Our hypothesis is that the real change brought about by this tool consists in the process of industrialisation of documentation, that is to say its management by a centralised system, which results in the normalisation of the different parts of a system that ensures the reproduction and general dissemination of its documentary products. It would appear that this process of industrialisation is part of an overall movement bringing about the structuring of fields of knowledge, under the pressure of territorial and societal considerations which do not always converge

APA, Harvard, Vancouver, ISO, and other styles

11

Amghar, Youssef. "Base d'objets documentaires." Lyon, INSA, 1989. http://www.theses.fr/1989ISAL0070.

Full text

Abstract:

Les Modèles Orientés Objets (MOO) ont permis d'aborder autrement les problèmes de conception et d'analyse des applications telles que la documentation. Dans ces modèles, l'objet est le concept unique représentant une "entité" du monde réel. Dans le domaine de la documentation on parle souvent d'objet complexe multi media. Il est muni de connaissances et d'un comportement appelés souvent "propriétés" (attributs et méthodes). Les objets ayant en commun plusieurs propriétés forment une classe d'objets. Tout objet réel possédant ces propriétés est une instance de classe. Le MOO développé dans cette thèse permet grâce à l'introduction d'un nouveau concept "le Méta-G-Objet", de modéliserune collection non finie de modèles de documents codés selon la norme ODA. Le Méta-G-Objet est vu comme l'unification du concept de classe et du concept de méta-classe de Smalltalk considérés chacun comme insuffisant et mal adapté au domaine de la documentation. Le partage d'objets induit dans le graphe des modèles est formalisé. La manipulation des objets documentaires s'est faite à l'aide de Smalltalk dont les principes permettent l'implantation du modèle sans grande difficulté. L'absence de gestion des objets persistants dans Smalltalk, a conduit à l'élaboration d'un modèle de stockage. Trois bases ont été nécessaires : la base des attributs d'objets, la base des méthodes et la base des contenus. L'architecture retenue, à savoir un serveur de documents et des postes de travail pour chaque image Smalltalk a nécessité l'étude de la gestion des accès concurrents.

APA, Harvard, Vancouver, ISO, and other styles

12

Sellami, Maher. "Smard : un système multibase d'aide à la recherche documentaire." Montpellier 2, 1988. http://www.theses.fr/1988MON20151.

Full text

Abstract:

Presentation d'un systeme intermediaire pour la recherche documentaire. Il met a la disposition des utilisateurs un outil d'interrogation des bases de donnees documentaires reparties sur differents sites a l'aide d'un langage de commande unique et une communication homme-machine adaptee

APA, Harvard, Vancouver, ISO, and other styles

13

Brini, Asma Hedia. "Un modèle de recherche d'information basé sur les réseaux possibilistes." Toulouse 3, 2005. http://www.theses.fr/2005TOU30224.

Full text

Abstract:

Nous proposons une approche moins restrictive pour la modélisation de la pertinence dans le cadre de la Recherche d'Information (RI). Un réseau possibiliste décrit graphiquement le modèle : les documents, leurs termes d'indexation et la requête sont des variables binaires et les arcs sont quantifiés dans le cadre de la théorie des possibilités. Ce modèle répond à des propositions du type : il est plausible à un certain degré que le document constitue une bonne réponse à la requête; (ii) il est nécessaire, certain que le document répond à la requête. La première proposition vise à éliminer certains documents de la réponse ; la seconde se focalise sur les documents qui seraient pertinents. Nous avons aussi défini trois nouvelles mesures qui mesurent l'importance d'un terme dans la collection dans le but de pénaliser les documents ne contenant pas certains termes (importants) par exemple. Ces mesures sont adaptables à tous les modèles de RI. Les résultats obtenus sont encourageants
We propose an approach to Information Retrieval (IR) where relevance is flexible. The model is based on possibilistic networks where documents, index terms and query are binary variables and arcs are quantified in the theory of possibility framework. This model should provide proposition like : (i) it is plausible to a certain degree that the document is relevant ; (ii) it is necessary that the document is relevant given the query. The first kind of answer is meant to eliminate irrelevant documents (weak plausibility). The second answer focuses attention on what looks very relevant. Besides, we proposed three new discriminant factors that penalise documents not containing query important terms. These factors can be adaptable to any existing models. The results obtained show the effectiveness of our approach

APA, Harvard, Vancouver, ISO, and other styles

14

Deparis, Etienne. "Création de nouvelles connaissances décisionnelles pour une organisation via ses ressources sociales et documentaires." Phd thesis, Université de Technologie de Compiègne, 2013. http://tel.archives-ouvertes.fr/tel-01016788.

Full text

Abstract:

L'aide à la décision se fonde sur l'observation d'un environnement évolutif dont on scrute les évènements. Ces évènements peuvent être de différentes natures, dont les connexions qui peuvent se créer au sein d'un réseau d'acteurs. L'observation des bases documentaires ne semble plus suffisante pour nourrir l'aide à la décision. En effet, les nouveaux outils de communication et de collaboration, dont l'usage se répand rapidement au sein des organisations, sont sources de nouvelles formes d'informations peu ou mal utilisées par les systèmes actuels d'aide à la décision des organisations. L'objectif de la thèse est de concevoir une plate-forme (modélisation et développement) pour les organisations permettant à leurs membres de bénéficier de médias sociaux et à leurs décideurs de bénéficier d'outils d'aide à la décision prenant en compte tous les types de ressources circulant sur cette plate-forme.

APA, Harvard, Vancouver, ISO, and other styles

15

Le, Lan Gaël. "Analyse en locuteurs de collections de documents multimédia." Thesis, Le Mans, 2017. http://www.theses.fr/2017LEMA1020/document.

Full text

Abstract:

La segmentation et regroupement en locuteurs (SRL) de collection cherche à répondre à la question « qui parle quand ? » dans une collection de documents multimédia. C’est un prérequis indispensable à l’indexation des contenus audiovisuels. La tâche de SRL consiste d’abord à segmenter chaque document en locuteurs, avant de les regrouper à l'échelle de la collection. Le but est de positionner des labels anonymes identifiant les locuteurs, y compris ceux apparaissant dans plusieurs documents, sans connaître à l'avance ni leur identité ni leur nombre. La difficulté posée par le regroupement en locuteurs à l'échelle d'une collection est le problème de la variabilité intra-locuteur/inter-document : selon les documents, un locuteur peut parler dans des environnements acoustiques variés (en studio, dans la rue...). Cette thèse propose deux méthodes pour pallier le problème. D'une part, une nouvelle méthode de compensation neuronale de variabilité est proposée, utilisant le paradigme de triplet-loss pour son apprentissage. D’autre part, un procédé itératif d'adaptation non supervisée au domaine est présenté, exploitant l'information, même imparfaite, que le système acquiert en traitant des données, pour améliorer ses performances sur le domaine acoustique cible. De plus, de nouvelles méthodes d'analyse en locuteurs des résultats de SRL sont étudiées, pour comprendre le fonctionnement réel des systèmes, au-delà du classique taux d'erreur de SRL (Diarization Error Rate ou DER). Les systèmes et méthodes sont évalués sur deux émissions télévisées d'une quarantaine d'épisodes, pour les architectures de SRL globale ou incrémentale, à l'aide de la modélisation locuteur à l'état de l'art
The task of speaker diarization and linking aims at answering the question "who speaks and when?" in a collection of multimedia recordings. It is an essential step to index audiovisual contents. The task of speaker diarization and linking firstly consists in segmenting each recording in terms of speakers, before linking them across the collection. Aim is, to identify each speaker with a unique anonymous label, even for speakers appearing in multiple recordings, without any knowledge of their identity or number. The challenge of the cross-recording linking is the modeling of the within-speaker/across-recording variability: depending on the recording, a same speaker can appear in multiple acoustic conditions (in a studio, in the street...). The thesis proposes two methods to overcome this issue. Firstly, a novel neural variability compensation method is proposed, using the triplet-loss paradigm for training. Secondly, an iterative unsupervised domain adaptation process is presented, in which the system exploits the information (even inaccurate) about the data it processes, to enhance its performances on the target acoustic domain. Moreover, novel ways of analyzing the results in terms of speaker are explored, to understand the actual performance of a diarization and linking system, beyond the well-known Diarization Error Rate (DER). Systems and methods are evaluated on two TV shows of about 40 episodes, using either a global, or longitudinal linking architecture, and state of the art speaker modeling (i-vector)

APA, Harvard, Vancouver, ISO, and other styles

16

Reichling, Conny. "Le Dr. Ernest Schneider et les gravures sur Grès de Luxembourg: étude du fonds documentaire inédit." Doctoral thesis, Universite Libre de Bruxelles, 2013. http://hdl.handle.net/2013/ULB-DIPOT:oai:dipot.ulb.ac.be:2013/209398.

Full text

Abstract:

Les archives documentaires du dentiste luxembourgeois Dr. Ernest Schneider (1885-

1954) constituent la base du présent travail. Ce fonds a été abordé par les sciences historiques

et sociales dans la première et par la discipline de l'archéologie rupestre dans

la seconde partie. Ces archives sont uniques au Grand-Duché dans le sens qu'il s'agit du

seul fonds archéologique contenant des documents épistolaires et iconographiques au lieu

d'artéfacts provenant de prospections. Dans un premier temps, le fonds épistolaires a été

abordé par une analyse de réseaux. Cette approche a permis de déterminer qu'il s'agit

d'un registre de contacts constitué par Schneider plutôt que d'un réseau au sens propre.

Schneider ne montre en effet aucune volonté à soigner ses contacts établis. Les réseaux de

ses alteri forment finalement la source d'informations la plus importante de Schneider :

ses contacts entament des recherches par eux-mêmes et dans leurs cercles de connaissances

afin de trouver des réponses aux requêtes du dentiste.

La seconde partie est consacré au travail archéologique effectué par Schneider de 1927

à 1954. Plus précisément les résultats publiés par Schneider en 1939 dans la monographie

Material zu einer archäologischen Felskunde des Luxemburger Landes sont revus et mis

à jour. Dans cette partie, le contenu des archives épistolaires est utilisé afin de suivre le

raisonnement scientifique de Schneider et afin de déterminer quelles hypothèses de quels

contacts sont intégrées par Schneider dans la monographie. L'influence des correspondants,

surtout des préhistoriens, est clairement déterminée dans cette partie, car Schneider attribue

la totalité des gravures aux temps pré- et protohistoriques. Lui-même qualifie son

travail de synthèse de la Pré- et Protohistoire du Grand-Duché de Luxembourg. Cette

hypothèse de datation est réfutée dans le présent travail. En effet, tenant compte du support

et de la nature des tracés gravés, les gravures figuratives ne datent pas d'au-delà de

l'époque médiévale tardive. La majorité des gravures ont très probablement été réalisées

entre le 19e et le 21e siècle, surtout lors des deux guerres mondiales lorsque les soldats

ennemis et alliés étaient stationnés dans les contrées de la région du Grès de Luxembourg.
Doctorat en Histoire, art et archéologie
info:eu-repo/semantics/nonPublished

APA, Harvard, Vancouver, ISO, and other styles

17

Boukala, Mouloud. "D’une anthropologie partagée à une anthropologie partageable : documentaires halieutiques et pêche artisanale au lac Atitlán (Guatemala)." Thesis, Lyon 2, 2009. http://www.theses.fr/2009LYO20082.

Full text

Abstract:

La présente étude s’intéresse, dans une perspective anthropologique, à lier acteurs et chercheurs à la gestion halieutique d’une ressource dont la visibilité économique et sociale est en pleine expansion. L’observation et l’analyse de la pêche artisanale telle qu’elle est pratiquée par les Indiens Tzutuj’iil au lac Atitlán (Guatemala) constitue une activité clef où se donne à voir la configuration croisée des subjectivités et du collectif, un lieu privilégié où se tissent des filets de relations entre les pêcheurs, entre les pêcheurs et le lac, entre les pêcheurs et le chercheur. En vue d’apprécier ce qui est en train de se passer collectivement, des relations ont été élaborées entre les champs cinématographiques et anthropologiques. Cette recherche mène conjointement une approche sensible - le cinéma - et une approche sociale et culturelle en vue de rendre compte des liens empreints de contingence et non univoques entre les représentations collectives et les pratiques. À l’inverse d’une anthropologie partagée où prime le nom d’un réalisateur, ce travail suscite une anthropologie partageable au sein de laquelle le pluriel, ce mode grammatical de la relativité, s’avère propice à une science du divers. Ainsi, à partir d’une scène halieutique où se déploient des gestes traditionnels, cette recherche privilégie grâce aux nouvelles technologies les rapports sociaux sous un angle interactif. Elle s’inscrit dans le cadre d’une recherche participative et promeut une « ethnographie en réseau » où les maillages sont représentatifs de la manière dont les acteurs se rattachent les uns aux autres de manière horizontale
Summary: the present study is concerned, in an anthropological perspective, with connecting actors and researchers to the halieutic management of a resource of which the economic and social visibility is rapidly growing.The observation and the analysis of the small-scale fishing such as it is practised by the Indians Tzutuj' iil on the lake Atitlán (Guatemala) constitutes a key activity in which the crossed configuration of the subjectivity and the collective appears, a privileged environment where relations nets are woven between the fishermen, between the fishermen and the lake, between the fishermen and the researcher.To appreciate what is taking place collectively; links were set up between cinematographic and anthropological fields. This research leads jointly a sensitive approach - the cinema - and a social and cultural approach to report links stamped with contingency and not unequivocal between the collective representations and the practices. Contrary to a shared anthropology where the name of a director predominates, this work creates a shareable anthropology within which the plural, this grammatical mode of the relativity, turns out to be convenient for a science of the diversity. So, from a halieutic stage where traditional movements are unfold, this study favours, thanks to new technologies, the social connections under an interactive angle. It is part of the structure of a participative research and promotes “an ethnography in network” where meshing are representative of the way the actors are connected with one another in a horizontal way

APA, Harvard, Vancouver, ISO, and other styles

18

Mothe, Josiane. "Modèle connexionniste pour la recherche d'informations. Expansion dirigée de requêtes et apprentissage." Toulouse 3, 1994. http://www.theses.fr/1994TOU30080.

Full text

Abstract:

Les travaux presentes dans ce memoire s'inscrivent dans le cadre des systemes de recherche documentaire. Notre premiere contribution a permis la definition d'un modele de recherche d'informations textuelles, base sur la theorie connexionniste. Ce modele reutilise des elements interessants des modeles de recherche existants et introduit des aspects dynamiques via l'utilisation de reseaux de neurones formels. Les termes d'indexation et de recherche d'une part, les documents d'autre part sont representes par des neurones. Ces neurones sont interconnectes par des liens types et ponderes. A partir d'une requete exprimee par un utilisateur, la recherche d'informations peut alors etre realisee selon plusieurs mecanismes complementaires: sans modification de la requete, avec expansion dirigee de requetes ou par recherche des documents ressemblants a un document donne. L'ensemble de ces mecanismes est base sur une propagation d'activation issue de la theorie connexionniste. Nous avons defini differentes strategies d'adaptation du reseau. L'apprentissage a court terme permet une adaptation ponctuelle, pour chaque requete. Cet apprentissage est base sur le principe de reinjection dans la requete des jugements fournis par l'utilisateur sur la pertinence des informations restituees. Des apprentissages a long terme prennent en compte les interrogations d'un ensemble d'utilisateurs et leur satisfaction par rapport aux reponses du systeme. Nous resolvons les problemes induits par la mise a jour de la base d'informations par un apprentissage local, supervise par l'administrateur. Notre seconde contribution a ete la validation du modele que nous proposons. Cette validation est realisee au travers de deux prototypes. Le premier (sep) permet l'evaluation des performances du modele de recherche et nous a permis d'etudier differents parametres du modele. Le second (syrene) est un sri gerant des donnees bibliographiques

APA, Harvard, Vancouver, ISO, and other styles

19

Benkoussas, Chahinez. "Approches non supervisées pour la recommandation de lectures et la mise en relation automatique de contenus au sein d'une bibliothèque numérique." Thesis, Aix-Marseille, 2016. http://www.theses.fr/2016AIXM4379/document.

Full text

Abstract:

Cette thèse s’inscrit dans le domaine de la recherche d’information (RI) et la recommandation de lecture. Elle a pour objets :— La création de nouvelles approches de recherche de documents utilisant des techniques de combinaison de résultats, d’agrégation de données sociales et de reformulation de requêtes ;— La création d’une approche de recommandation utilisant des méthodes de RI et les graphes entre les documents. Deux collections de documents ont été utilisées. Une collection qui provient de l’évaluation CLEF (tâche Social Book Search - SBS) et la deuxième issue du domaine des sciences humaines et sociales (OpenEdition, principalement Revues.org). La modélisation des documents de chaque collection repose sur deux types de relations :— Dans la première collection (CLEF SBS), les documents sont reliés avec des similarités calculées par Amazon qui se basent sur plusieurs facteurs (achats des utilisateurs, commentaires, votes, produits achetés ensemble, etc.) ;— Dans la deuxième collection (OpenEdition), les documents sont reliés avec des relations de citations (à partir des références bibliographiques).Le manuscrit est structuré en deux parties. La première partie «état de l’art» regroupe une introduction générale, un état de l’art sur la RI et sur les systèmes de recommandation. La deuxième partie «contributions» regroupe un chapitre sur la détection de comptes rendus de lecture au sein de la collection OpenEdition (Revues.org), un chapitre sur les méthodes de RI utilisées sur des requêtes complexes et un dernier chapitre qui traite l’approche de recommandation proposée qui se base sur les graphes
This thesis deals with the field of information retrieval and the recommendation of reading. It has for objects:— The creation of new approach of document retrieval and recommendation using techniques of combination of results, aggregation of social data and reformulation of queries;— The creation of an approach of recommendation using methods of information retrieval and graph theories.Two collections of documents were used. First one is a collection which is provided by CLEF (Social Book Search - SBS) and the second from the platforms of electronic sources in Humanities and Social Sciences OpenEdition.org (Revues.org). The modelling of the documents of every collection is based on two types of relations:— For the first collection (SBS), documents are connected with similarity calculated by Amazon which is based on several factors (purchases of the users, the comments, the votes, products bought together, etc.);— For the second collection (OpenEdition), documents are connected with relations of citations, extracted from bibliographical references.We show that the proposed approaches bring in most of the cases gain in the performances of research and recommendation. The manuscript is structured in two parts. The first part "state of the art" includes a general introduction, a state of the art of informationretrieval and recommender systems. The second part "contributions" includes a chapter on the detection of reviews of books in Revues.org; a chapter on the methods of IR used on complex queries written in natural language and last chapter which handles the proposed approach of recommendation which is based on graph

APA, Harvard, Vancouver, ISO, and other styles

20

Meziane, Souad. "Analyse et conversion de documents : du pixel au langage HTML." Lyon, INSA, 1998. http://www.theses.fr/1998ISAL0128.

Full text

Abstract:

Mon travail de thèse s'inscrit dans la thématique de recherche " Analyse des documents " du laboratoire Reconnaissance de Forme et Vision. Pour réaliser un système capable d'analyser des documents et d'en restituer la structure, les méthodologies s'appuient sur plusieurs approches et particulièrement sur l'approche syntaxique et structurelle de la Reconnaissance de Formes. Le but recherché dans ce travail est d'arriver à convertir des documents papier vers des documents électroniques tels que les documents HTML car ce sont les documents les plus utilisés sur l'Internet. Le domaine d'application d'un tel système peut être général, cependant, nous nous concentrons en premier sur un type particulier de documents à typographie riche : les sommaires. Dans ce contexte, nous avons mis en œuvre un système s'appuyant d'une part sur les structures physique et logique du document et d'autre part sur l'inférence de Grammaire à Deux Niveaux. Elle est composée de deux grammaires : une métagrammaire et une hypergarmmaire. Dans notre système, le rôle de la métagrammaire est de décrire les structures physique et logique du document. L'hypergrammaire décrit les traitements à effectuer pour convertir le document en html. L'analyse d'un sommaire s'effectue en deux étapes. Lors de la première étape, le système construit une base d'apprentissage en utilisant l'inférence grammaticale. Cette base contient plusieurs modèles de sommaires à identifier. Un document inconnu, soumis au système est identifié par appariement avec les modèles de la base, en utilisant toutes les informations issues de l'étage d'analyse. La mise en page du document dans le format HTML est basée sur l'analyse grammaticale de l'hypergrammaire. Cette dernière est obtenue par traduction des étiquettes logiques et des paramètres typographiques en commandes HTML. Le résultats de l'analyse de l'hypergrammaire produit le document HTML équivalent au document étudié. Il est visualisé par un logiciel de navigation
This work is part of the thematic "Document Analysis" in the Laboratory Reconnaissance de Forme et Vision(RFV). To achieve an analysis system ables to, interpret documents and to restore its structure, the Methodologies we have chosen lean on several approaches and particularly on the syntactic and structural approach of the Pattern Recognition. The aim in this work is to convert some paper documents into HTML documents because these documents are more used on the Internet. The application domain of such systems could be general; however, we concentrate us on a particular type of documents with a rich typography: the summaries. In this context, we have realized a system that exploits on one hand the information about content of the document such as its physical and logical structures, and on the other hand on two level grammars. It is composed with two grammars: a meta-grammar and a hyper-grammar. In our system, the role of the meta-grammar is to describe the physical and logical structures of the document. The hyper-grammar is constituted with a set of calculus rules and describes the treatments to do in order to convert the document in HTML. The summary analysis is done in two steps: analysis and identification of the document, and then translation into HTML. During of the first step, the system constructs a learning base by using the grammatical inference. This base contains several patterns of synopses to identify. An unknown document, submitted to the system is identified by matching with the patterns of the base by using all the attributes obtained in the analysis step. The layout of HTML document construction is based on the grammatical analysis of the hyper-grammar. The last is obtained by translation of the logical labels and some typographic parameters into HTML commands. The result of the grammatical analysis of the hyper-grammar produces the structured HTML document corresponding to the studied document. This last will be visualized by software of navigation

APA, Harvard, Vancouver, ISO, and other styles

21

Akindele, Oluwatoyin Tunde. "Vers un système de construction automatique de modèles génériques de structures de documents." Nancy 1, 1995. http://www.theses.fr/1995NAN10002.

Full text

Abstract:

Cette thèse traite de l'apprentissage des modèles génériques de structures de documents. L’intérêt du système conçu et développé est double: il permet de simplifier la tâche de construction manuelle du modèle souvent pénible et de contrôler les connaissances a priori données au modèle. Un travail préliminaire sur l'analyse de documents consistait en l'étude des différents formalismes existant pour représenter les structures de documents. En se basant sur le formalisme ODA, nous avons défini un modèle de structures adapté à la lecture optique de documents. Étant donne que l'architecture du modèle est arborescente, nous nous sommes dirigés naturellement vers les méthodes d'inférence de grammaires d'arbres. Chaque document est segmenté puis représenté par une structure spécifique. Afin de contrôler ce processus (ne pas altérer la structure par celles de mauvais échantillons) et d'introduire la structure logique, un modèle de base est d'abord construit à partir de quelques échantillons de documents et avec toute la vaillance de l'utilisateur. À l'étape d'inférence, la structure spécifique de chaque échantillon est d'abord comparée au modèle de base. Puis, en cas de validité, elle est utilisée pour l'inférence du modèle générique. Cette inférence est effectuée par la méthode d'inférence de grammaires d'arbres. Une dernière étape de réduction est utilisée pour éliminer les répétitions et les redondances. Le résultat de ce système est un ensemble de règles décrivant le modèle générique de la classe de documents à laquelle appartiennent les échantillons utilisés pour l'apprentissage. Le système a été testé sur une base complète de documents correspondant aux pages de titre des articles des actes des conférences ICPR (International Conference On Pattern Recognition) et les résultats sont concluants

APA, Harvard, Vancouver, ISO, and other styles

22

Ertzscheid, Olivier. "Les enjeux cognitifs et stylistiques de l'organisation hypertextuelle : le Lieu, Le Lien, Le Livre." Phd thesis, Université Toulouse le Mirail - Toulouse II, 2002. http://tel.archives-ouvertes.fr/tel-00006260.

Full text

Abstract:

L'enjeu de ce doctorat est de montrer comment la perception et les pratiques liées à la figure de l'hypertexte permettent d'entrevoir de profonds bouleversements dans notre rapport à l'écrit (document numérique, nouveaux genres littéraires, textualité renouvelée), à l'organisation de la connaissance, ainsi qu'à la manière dont s'agrègent, se constituent, se développent et se transforment les différents types de rapport au réel présents dans toute organisation sociale réticulée. L'analyse critique de ces transformations nous permet de préciser comment se met progressivement en place une nouvelle écologie cognitive, en quoi elle est rendue nécessaire, et quels sont les outils (typologie englobante des processus de liaison entre entités) et les pratiques sociales émergentes qui la fondent.

Dans notre premier chapitre, nous faisons d'abord un point sur les effets déjà mesurables de l'organisation hypertextuelle dans le rapport à l'écrit pour isoler les transformations cognitives occasionnées par ce nouveau support, pour isoler également la nouvelle organisation des structures traditionnelles de l'énonciation dans le processus de communication (rapports auteur-lecteur, agencements collectifs d'énonciation). Nous concluons par une typologie des nouveaux genres hypertextuels (liés notamment à l'utilisation de générateurs) et sur le statut littéraire de ces productions.
Notre second chapitre aborde les aspects plus « théoriques » de l'organisation hypertextuelle au travers de l'étude systématique de ses procédés de liaison. Après un état de l'art de la question, nous définissons une typologie englobante des liens hypertextuels prenant en compte leurs aspects informatiques, les structures rhétoriques et formelles qui les sous-tendent et les différents types de rapport entre ces « entités-liens » autorisant à qualifier différentes organisations hypertextuelles. Sur tous ces points, les propositions formulées dans ce travail devront permettre d'améliorer les pratiques de navigation et de réduire certains effets liés (surcharge cognitive, désorientation).
Notre troisième chapitre montre que ce que ces liens révèlent du fonctionnement de la pensée humaine (mode essentiellement associatif) est en train de changer la manière dont les systèmes et les organisations sociales se constituent et se développent, en mettant en place, de manière effective, des artefacts et de processus habituellement implicites et dont l'enjeu sera, pour le chercheur, d'accompagner le passage à l'explicite. Ce dernier chapitre s'appuie sur le dispositif expérimental FoRSIC et l'utilisation qu'il fait de différents types ontologiques, ce dernier étant caractéristique des ces nouveaux rapports au savoir que notre travail essaie de qualifier plus que de quantifier.

APA, Harvard, Vancouver, ISO, and other styles

23

Gong, Yihong. "Reconnaissance des structures de documents." Compiègne, 1994. http://www.theses.fr/1994COMPD681.

Full text

Abstract:

La reconnaissance des structures de documents est indispensable pour intégrer les documents sur support papier dans un système de gestion documentaire. Dans cette thèse, nous présentons notre travail qui couvre la chaîne entière de reconnaissance des structures textuelles d'un document scientifique : des images binaires du document jusqu'a la structure logique hiérarchique du document, en passant par la reconnaissance de la structure physique du document. La reconnaissance des structures spécifiques d'un document est basée sur les structures génériques correspondantes. L'identification des objets physiques et logiques ainsi que l'étiquetage logique des portions de contenu du document sont réalisés en utilisant des règles de reconnaissance. Les représentations des structures internes du document s'inspirent de la norme ODA.

APA, Harvard, Vancouver, ISO, and other styles

24

Plutniak, Sébastien. "L’opération archéologique. Sociologie historique d’une discipline aux prises avec l’automatique et les mathématiques. France, Espagne, Italie, 2e moitié du XXe siècle." Thesis, Paris, EHESS, 2017. http://www.theses.fr/2017EHES0045.

Full text

Abstract:

La seconde moitié du XXe siècle donna lieu à un accroissement des tentatives de redéfinir en termes opérationnels divers domaines de l'activité sociale tant scientifique, militaire, administratif ou industriel. Ces tentatives tirèrent parti des innovations scientifiques et techniques de la Deuxième Guerre mondiale, puis de la généralisation de l'automatique. Cette thèse en propose une sociologie historique, menée à partir du cas particulier de l’archéologie. Ce domaine scientifique fait alors l’objet d’efforts accrus de disciplinarisation et de professionnalisation. C’est également le cas des mathématiques appliquées puis de l’informatique : cette étude porte précisément sur les rapports établis à l’intersection de ces trois domaines. En France, au cours des années 1950 et 1960, les innovations méthodologiques et conceptuelles y ont été particulièrement importantes. Pourtant, par la suite, leur réception s’est révélée relativement mineure. En archéologie, les innovations relatives aux mathématiques appliquées, à la formalisation du langage et à l’automatique n’ont pas donné lieu au développement d’une spécialité fondée sur le calcul. Cette situation contraste avec celle d’autres disciplines ou d’autres pays, et ceci alors même que les redéfinitions théoriques et méthodologiques de la « New Archaeology » anglophone se diffusaient à l’échelle internationale. La thèse explore les cas de trois entreprises collectives, menées respectivement autour de Georges Laplace, Jean-Claude Gardin et Jean Lesage, entre France, Espagne et Italie. Ces cas sont complétés par ceux d’un ensemble d’acteurs ayant été à la fois ingénieurs et archéologues. D’un point de vue général, cette étude porte sur les statuts cognitifs et sociaux des contributions méthodologiques dans l’activité scientifique. Trois modèles de relations entre spécialistes d’un domaine scientifique et spécialistes des sciences formelles sont identifiés et décrits. Les transformations entraînées par l’introduction des mathématiques et de l’automatique dans la division du travail et la distribution des formes de reconnaissance sont analysées. La réception de ces propositions méthodologiques est discutée à l’aune de différents facteurs et modèles de l’innovation scientifique. Ce sont, au final, des éclairages nouveaux sur le développement de l’archéologie de sauvetage puis préventive et sur la genèse des recours aux technologies « numériques » en sciences de l'homme qui sont proposés.L’analyse tire parti de 82 entretiens, 23 fonds d’archives et de plusieurs jeux de données bibliométriques (pré-existants ou constitués pour cette étude). En écho aux travaux pris pour objets, cette thèse entend également être une proposition et une illustration d’un usage possible de la formalisation et de l’informatique en sciences sociales. Fondées sur l’emploi d’un wiki et les principes de la programmation lettrée et de la reproductibilité des analyses, les architectures documentaire et démonstrative de cette étude font elles-mêmes l’objet d’une analyse
During the second half of the 20th century, attempts were made to operationally redefine various social activities, including those related to science, the military, administration and industry. These attempts were aided by scientific and technical innovations developed in the Second World War, and subsequently by the increase in use of automation in various domains. This Ph.D. thesis addresses these attempts from a sociohistorical perspective, focusing on the specific case of archaeology. During this period, the domain of archaeology underwent a process of disciplinarisation and professionalisation. The same occurred in applied mathematics and then computer science: this thesis focuses on the relationships between these three domains. In France, during the 1950's and 1960's, there were significant methodological and conceptual innovations. Their subsequent scientific recognition, was, however, relatively minor. In archaeology, innovations related to applied mathematics and automatics did not lead to the emergence of an archaeological speciality based on computation. This situation was in striking contrast to what happened in other scientific domains and in archaeology in other countries, where new theoretical and methodological Anglophone definitions in ‘New Archaeology’ were spreading worldwide.This thesis explores three collective attempts to redefine the conceptual and methodological basis of archaeology, led by Georges Laplace, Jean-Claude Gardin and Jean Lesage, across France, Spain and Italy. These cases are completed by other people who had significant careers in both engineering and archaeology. In general, this thesis studies a scientific activity by investigating the cognitive and social aspects of peoples’ methodological contributions. Three models of the relationships between experts in a scientific domain and experts in an applied science (here mathematics and computing) are empirically identified and described. The effects of introducing mathematical and automation procedures on the division of labour and the distribution of recognition are analysed. The success or failure of the methodological propositions are discussed with reference to several factors and models of scientific innovation. This thesis generates new information on the development of rescue and preventive archaeology and on the use of digital technologies in human sciences.The analysis draws on 82 interviews, 23 archives and several bibliometric datasets (extracted from pre-existing databases or constructed for the purpose of this research). Mirroring the archaeological propositions under study, this research also intends to illustrate the possible use of computing and formalised procedures in social sciences. The documentation and demonstrative principles underlying this work, implemented by using Wiki, the methods of literate programming and reproducible research, are themselves analysed

APA, Harvard, Vancouver, ISO, and other styles

25

Sayadi, Karim. "Classification du texte numérique et numérisé. Approche fondée sur les algorithmes d'apprentissage automatique." Thesis, Paris 6, 2017. http://www.theses.fr/2017PA066079/document.

Full text

Abstract:

Différentes disciplines des sciences humaines telles la philologie ou la paléographie font face à des tâches complexes et fastidieuses pour l'examen des sources de données. La proposition d'approches computationnelles en humanités permet d'adresser les problématiques rencontrées telles que la lecture, l'analyse et l'archivage de façon systématique. Les modèles conceptuels élaborés reposent sur des algorithmes et ces derniers donnent lieu à des implémentations informatiques qui automatisent ces tâches fastidieuses. La première partie de la thèse vise, d'une part, à établir la structuration thématique d'un corpus, en construisant des espaces sémantiques de grande dimension. D'autre part, elle vise au suivi dynamique des thématiques qui constitue un réel défi scientifique, notamment en raison du passage à l'échelle. La seconde partie de la thèse traite de manière holistique la page d'un document numérisé sans aucune intervention préalable. Le but est d'apprendre automatiquement des représentations du trait de l'écriture ou du tracé d'un certain script par rapport au tracé d'un autre script. Il faut dans ce cadre tenir compte de l'environnement où se trouve le tracé : image, artefact, bruits dus à la détérioration de la qualité du papier, etc. Notre approche propose un empilement de réseaux de neurones auto-encodeurs afin de fournir une représentation alternative des données reçues en entrée
Different disciplines in the humanities, such as philology or palaeography, face complex and time-consuming tasks whenever it comes to examining the data sources. The introduction of computational approaches in humanities makes it possible to address issues such as semantic analysis and systematic archiving. The conceptual models developed are based on algorithms that are later hard coded in order to automate these tedious tasks. In the first part of the thesis we propose a novel method to build a semantic space based on topics modeling. In the second part and in order to classify historical documents according to their script. We propose a novel representation learning method based on stacking convolutional auto-encoder. The goal is to automatically learn plot representations of the script or the written language

APA, Harvard, Vancouver, ISO, and other styles

26

Lamirel, Jean-Charles. "Vers une approche systémique et multivues pour l'analyse de données et la recherche d'information : un nouveau paradigme." Habilitation à diriger des recherches, Université Nancy II, 2010. http://tel.archives-ouvertes.fr/tel-00552247.

Full text

Abstract:

Le sujet principal de notre travail d'habilitation concerne l'extension de l'approche systémique, initialement implantée dans le Système de Recherche d'Information NOMAD, qui a fait l'objet de notre travail de thèse, pour mettre en place un nouveau paradigme général d'analyse de données basé sur les points de vue multiples, paradigme que nous avons baptisé MVDA (Multi-View Data Analysis). Ce paradigme couvre à la fois le domaine de l'analyse de données et celui de la fouille de données. Selon celui-ci, chaque analyse de données est considérée comme une vue différente sur les données. Le croisement entre les vues s'opère par l'intermédiaire d'un réseau bayésien construit, de manière non supervisée, à partir des données ou des propriétés partagées entre ces dernières. Le paradigme MDVA repose également sur l'exploitation de méthodes spécifiques de visualisation, comme la visualisation topographique ou la visualisation hyperbolique. La mise en place de nouveaux estimateurs de qualité de type Rappel/Précision non supervisés basés sur l'analyse de la distribution des propriétés associées aux classes, et qui à la fois sont indépendants des méthodes de classification et des changements relatifs à leur mode opératoire (initialisation, distances utilisées ...), nous a permis de démontrer objectivement la supériorité de ce paradigme par rapport à l'approche globale, classique en analyse de données. Elle nous a également permis de comparer et d'intégrer dans le paradigme MVDA des méthodes de classification non supervisées (clustering) neuronales qui sont plus particulièrement adaptées à la gestion des données ultra-éparses et fortement multidimensionnelles, à l'image des données documentaires, ainsi que d'optimiser le mode opératoire de telles méthodes. Notre démarche a par ailleurs impliqué de développer la cohabitation entre le raisonnement neuronal et le raisonnement symbolique, ou entre des modèles de nature différente, de manière à couvrir l'ensemble des fonctions de la recherche et de l'analyse de l'information et à éliminer, sinon à réduire, les défauts inhérents à chacun des types d'approche. A travers de nombreuses applications, notamment dans le domaine de l'évaluation des sciences, nous montrons comment l'exploitation d'un tel paradigme peut permettre de résoudre des problèmes complexes d'analyse de données, comme ceux liés l'analyse diachronique à grande échelle des données textuelles polythématiques. Nous montrons également comment l'ensemble des outils développés dans le cadre de ce paradigme nous ont permis mettre en place de nouvelles méthodes très robustes et très performantes pour la classification supervisée et pour le clustering incrémental. Nous montrons finalement comment nous envisageons d'étendre leur application à d'autres domaines très porteurs, comme ceux du traitement automatique des langues ou de la bioinformatique.

APA, Harvard, Vancouver, ISO, and other styles

27

Tremblay, Émilie. "Représentations des religions traditionnelles africaines : analyse comparative de réseaux régionaux et disciplinaires africains et occidentaux." Thèse, 2010. http://hdl.handle.net/1866/4467.

Full text

Abstract:

Ce mémoire présente une réflexion critique sur différentes représentations des religions traditionnelles africaines (RTA) au sein de réseaux régionaux et disciplinaires africains et occidentaux. Dans un premier temps, plusieurs formes de représentations (cartographiques et graphiques) issues de milieux universitaires occidentaux sont explorées pour comparer le traitement des RTA. Cette exploration soulève le problème des catégorisations employées qui ne rendent pas compte de la diversité, du dynamisme, de la complexité et de l’importance des RTA; et de manière plus générale, cette analyse révèle un problème sur le plan de l’équité dans les représentations des religions du monde. À l’aide d’une analyse conceptuelle, un certain nombre de catégories utilisées pour définir les RTA, notamment celle de « religion ethnique », sont remises en question, tout comme la notion de religion du monde (world religion). Dans un deuxième temps, les stratégies de recherche utilisées pour retracer des réseaux de chercheurs africains sont présentées. Différents outils et ressources documentaires occidentaux sont analysés et évalués selon qu’ils donnent accès ou non à la production de chercheurs africains sur les RTA. L’analyse de ces documents, laquelle est inspirée d’une démarche d’analyse de discours, révèle à quel point la contribution des chercheurs africains est peu prise en compte à l’intérieur du corpus sélectionné. Or, l’exploration de la situation actuelle de l’enseignement et de la recherche sur les RTA dans certaines universités du Nigéria met en lumière la somme importante de travaux sur les RTA et la diversité des canaux de communication. En somme, ce mémoire démontre à quel point le savoir est localisé et lié aux ancrages culturels, disciplinaires et idéologiques des chercheurs. Il ouvre, à partir de l’analyse de textes africains, sur la question plus large de la difficulté de la représentation de l’unité et des particularismes des RTA.
This thesis provides a critical analysis of several different representations of African Traditional Religions (ATR) as found within a number of regional and disciplinary networks in Western and African countries. First, numerous means of representation (geographical maps and graphics) from different western scientific media were used to examine different ways in which ATR are represented. This analysis reveals that the categorization systems employed in these media to represent ATR do not reflect the variety, vitality, complexity and significance of ATR; and, on a more general level, reveals a lack of equity in the representations of different world religions. A conceptual analysis puts into question a number of categories (e.g. “ethnic religion”) used to define ATR as well as the notion of world religion. Second, the research strategies that were used to identify African research networks are presented. Several different Western tools and documentary resources (Database, encyclopedic articles, etc) were evaluated on their usage and citations of African research on ATR. This analysis, which was drawn from a qualitative discourse analysis approach, highlights the limited importance that is given to African researchers. In contrast, our evaluation of RTA-related education and research in Nigerian universities reveals an enormous amount of RTA-related research as well as a diversity of communication channels. On a more general level, this thesis demonstrates the extent to which knowledge is localized and linked to the cultural, disciplinary, and ideological presuppositions of researchers, and, from the analysis of African documents, opens to the larger question of the difficulty to represent the unity and specificities of ATR.

APA, Harvard, Vancouver, ISO, and other styles

Dissertations / Theses on the topic 'Réseau documentaire'

Create a spot-on reference in APA, MLA, Chicago, Harvard, and other styles