To see the other types of publications on this topic, follow the link: Multimedia documents.

Dissertations / Theses on the topic 'Multimedia documents'

Create a spot-on reference in APA, MLA, Chicago, Harvard, and other styles

Select a source type:

Consult the top 50 dissertations / theses for your research on the topic 'Multimedia documents.'

Next to every source in the list of references, there is an 'Add to bibliography' button. Press on it, and we will generate automatically the bibliographic reference to the chosen work in the citation style you need: APA, MLA, Harvard, Chicago, Vancouver, etc.

You can also download the full text of the academic publication as pdf and read online its abstract whenever available in the metadata.

Browse dissertations / theses on a wide variety of disciplines and organise your bibliography correctly.

1

Martins, Diogo Santana. "Models and operators for extension of active multimedia documents via annotations." Universidade de São Paulo, 2013. http://www.teses.usp.br/teses/disponiveis/55/55134/tde-30012014-082907/.

Full text
Abstract:
Multimedia production is an elaborate activity composed of multiple information management and transformation tasks that support an underlying creative goal. Examples of these activities are structuring, organization, modification and versioning of media elements, all of which depend on the maintenance of supporting documentation and metadata. In professional productions, which can count on proper human and material resources, such documentation is maintained by the production crew, being key to secure a high quality in the final content. In less resourceful configurations, such as amateur-oriented productions, at least reasonable quality standards are desirable in most cases, however the perceived difficulty in managing and transforming content can inhibit amateurs on producing content with acceptable quality. This problem has been tackled in many fronts, for instance via annotation methods, smart browsing methods and authoring techniques, just to name a few. In this dissertation, the primary objective is to take advantage of user-created annotations in order to aid amateur-oriented multimedia authoring. In order to support this objective, the contributions are built around an authoring approach based on structured multimedia documents. First, a custom language for Web-based multimedia documents is defined, based on SMIL (Synchronized Multimedia Integration Language). This language brings several contributions, such as the formalization of an extended graph-based temporal layout model, live editing of document elements and extended reuse features. Second, a model for document annotation and an algebra for document transformations are defined, both of which allows composition and extraction of multimedia document fragments based on annotations. Third, the previous contributions are integrated into a Web-based authoring tool, which allows manipulating a document while it is active. Such manipulations encompass several interaction techniques for enriching, editing, publishing and extending multimedia documents. The contributions have been instantiated with multimedia sessions obtained from synchronous collaboration tools, in scenarios of video-based lectures, meetings and video-based qualitative research. Such instantiations demonstrate the applicability and utility of the contributions
Produção multimídia é uma atividade complexa composta por múltiplas atividades de gerência e transformação de informação, as quais suportam um objetivo de criar conteúdo. Exemplos dessas atividades são estruturação, organização, modificação e versionamento de elementos de mídia, os quais dependem da manutenção de documentos auxiliares e metadados. Em produções profissionais, as quais podem contar com recursos humanos e materiais adequados, tal documentação é mantida pela equipe de produção, sendo instrumental para garantir a uma alta qualidade no produto final. Em configurações com menos recursos, como produções amadoras, ao menos padrões razoáveis de qualidade são desejados na maioria dos casos, contudo a dificuldade em gerenciar e transformar conteúdo pode inibir amadores a produzir conteúdo com qualidade aceitável. Esse problema tem sido atacado em várias frentes, por exemplo via métodos de anotação, métodos de navegação e técnicas de autoria, apenas para nomear algumas. Nesta tese, o objetivo principal é tirar proveito de anotações criadas pelo usuário com o intuito de apoiar autoria multimídia por amadores. De modo a subsidiar esse objetivo, as contribuições são construídas em torno uma abordagem de autoria baseada em documentos multimídia estruturados. Primeiramente, uma linguagem customizada para documentos multimídia baseados na Web é definida, baseada na linguagem SMIL (Synchronized Multimedia Integration Language). Esta linguagem traz diversas contribuições, como a formalização de um modelo estendido para formatação temporal baseado em grafos, edição ao vivo de elementos de um documento e funcionalidades de reúso. Em segundo, um modelo para anotação de documentos e uma álgebra para transformação de documentos são definidos, ambos permitindo composição e extração de fragmentos de documentos multimídia com base em anotações. Em terceiro, as contribuições anteriores são integradas em uma ferramenta de autoria baseada na Web, a qual permite manipular um documento enquanto o mesmo está ativo. Tais manipulações envolvem diferentes técnicas de interação com o objetivo de enriquecer, editar, publicar e estender documentos multimídia interativos. As contribuições são instanciadas com sessões multimídia obtidas de ferramentas de colaboração síncrona, em cenários de aulas baseadas em vídeos, reuniões e pesquisa qualitativa baseada em vídeos. Tais instanciações demonstram a aplicabilidade e utilidade das contribuições
APA, Harvard, Vancouver, ISO, and other styles
2

Buchanan, Maria Cecelia. "Specifying temporal behavior in interactive multimedia documents /." Thesis, Connect to this title online; UW restricted, 1995. http://hdl.handle.net/1773/6933.

Full text
APA, Harvard, Vancouver, ISO, and other styles
3

Jeong, Ki Tai. "A Common Representation Format for Multimedia Documents." Thesis, University of North Texas, 2002. https://digital.library.unt.edu/ark:/67531/metadc3336/.

Full text
Abstract:
Multimedia documents are composed of multiple file format combinations, such as image and text, image and sound, or image, text and sound. The type of multimedia document determines the form of analysis for knowledge architecture design and retrieval methods. Over the last few decades, theories of text analysis have been proposed and applied effectively. In recent years, theories of image and sound analysis have been proposed to work with text retrieval systems and progressed quickly due in part to rapid progress in computer processing speed. Retrieval of multimedia documents formerly was divided into the categories of image and text, and image and sound. While standard retrieval process begins from text only, methods are developing that allow the retrieval process to be accomplished simultaneously using text and image. Although image processing for feature extraction and text processing for term extractions are well understood, there are no prior methods that can combine these two features into a single data structure. This dissertation will introduce a common representation format for multimedia documents (CRFMD) composed of both images and text. For image and text analysis, two techniques are used: the Lorenz Information Measurement and the Word Code. A new process named Jeong's Transform is demonstrated for extraction of text and image features, combining the two previous measurements to form a single data structure. Finally, this single data measurements to form a single data structure. Finally, this single data structure is analyzed by using multi-dimensional scaling. This allows multimedia objects to be represented on a two-dimensional graph as vectors. The distance between vectors represents the magnitude of the difference between multimedia documents. This study shows that image classification on a given test set is dramatically improved when text features are encoded together with image features. This effect appears to hold true even when the available text is diffused and is not uniform with the image features. This retrieval system works by representing a multimedia document as a single data structure. CRFMD is applicable to other areas of multimedia document retrieval and processing, such as medical image retrieval, World Wide Web searching, and museum collection retrieval.
APA, Harvard, Vancouver, ISO, and other styles
4

Ebadat, Ali-Reza. "Toward Robust Information Extraction Models for Multimedia Documents." Phd thesis, INSA de Rennes, 2012. http://tel.archives-ouvertes.fr/tel-00760383.

Full text
Abstract:
Au cours de la dernière décennie, d'énormes quantités de documents multimédias ont été générées. Il est donc important de trouver un moyen de gérer ces données, notamment d'un point de vue sémantique, ce qui nécessite une connaissance fine de leur contenu. Il existe deux familles d'approches pour ce faire, soit par l'extraction d'informations à partir du document (par ex., audio, image), soit en utilisant des données textuelles extraites du document ou de sources externes (par ex., Web). Notre travail se place dans cette seconde famille d'approches ; les informations extraites des textes peuvent ensuite être utilisées pour annoter les documents multimédias et faciliter leur gestion. L'objectif de cette thèse est donc de développer de tels modèles d'extraction d'informations. Mais les textes extraits des documents multimédias étant en général petits et bruités, ce travail veille aussi à leur nécessaire robustesse. Nous avons donc privilégié des techniques simples nécessitant peu de connaissances externes comme garantie de robustesse, en nous inspirant des travaux en recherche d'information et en analyse statistique des textes. Nous nous sommes notamment concentré sur trois tâches : l'extraction supervisée de relations entre entités, la découverte de relations, et la découverte de classes d'entités. Pour l'extraction de relations, nous proposons une approche supervisée basée sur les modèles de langues et l'algorithme d'apprentissage des k-plus-proches voisins. Les résultats expérimentaux montrent l'efficacité et la robustesse de nos modèles, dépassant les systèmes état-de-l'art tout en utilisant des informations linguistiques plus simples à obtenir. Dans la seconde tâche, nous passons à un modèle non supervisé pour découvrir les relations au lieu d'en extraire des prédéfinies. Nous modélisons ce problème comme une tâche de clustering avec une fonction de similarité là encore basée sur les modèles de langues. Les performances, évaluées sur un corpus de vidéos de matchs de football, montrnt l'intérêt de notre approche par rapport aux modèles classiques. Enfin, dans la dernière tâche, nous nous intéressons non plus aux relations mais aux entités, source d'informations essentielles dans les documents. Nous proposons une technique de clustering d'entités afin de faire émerger, sans a priori, des classes sémantiques parmi celles-ci, en adoptant une représentation nouvelle des données permettant de mieux tenir compte des chaque occurrence des entités. En guise de conclusion, nous avons montré expérimentalement que des techniques simples, exigeant peu de connaissances a priori, et utilisant des informations linguistique facilement accessibles peuvent être suffisantes pour extraire efficacement des informations précises à partir du texte. Dans notre cas, ces bons résultats sont obtenus en choisissant une représentation adaptée pour les données, basée sur une analyse statistique ou des modèles de recherche d'information. Le chemin est encore long avant d'être en mesure de traiter directement des documents multimédia, mais nous espérons que nos propositions pourront servir de tremplin pour les recherches futures dans ce domaine.
APA, Harvard, Vancouver, ISO, and other styles
5

Ebadat, Ali Reza. "Toward robust information extraction models for multimedia documents." Rennes, INSA, 2012. http://www.theses.fr/2012ISAR0022.

Full text
Abstract:
L'énorme quantité de documents multimédias constamment générés incite au développement de méthodes d'analyse automatique. Dans ce cadre, notre objectif est de faciliter ce processus en extrayant des informations à partir de n'importe quel texte relatif à ces documents. En outre, nous voulons des techniques suffisamment robustes pour traiter des données bruitées et de petite taille. Pour ce faire, nous utilisons des techniques simples nécessitant peu de connaissances externes comme une garantie de robustesse. Plus précisément, nous utilisons des techniques inspirées de la recherche d'information et de l'analyse statistique. Dans cette thèse, nous montrons expérimentalement que des techniques simples, sans connaissance a priori peuvent être utiles pour extraire efficacement les informations à partir du texte. Dans notre cas, ces bons résultats ont été obtenus en choisissant une représentation adaptée pour les données au lieu d'exiger de traitements complexes
Due to the huge amounts of multimedia documents that have been generated, researchers studied approaches to manage them. Our goal is to facilitate this process by extracting information from any text related to such documents. Moreover, we want techniques robust enough to handle noisy and small data. We use simple and nowledge-light techniques as a guarantee of robustness. Indeed, we use statistical analysis of text and some techniques inspired from Information Retrieval. In this thesis, we experimentally show that simple techniques without a priori knowledge can be useful to effectively extract information from text. In our case, such results have indeed been achieved by choosing suited representation for the data instead of requiring complex processings
APA, Harvard, Vancouver, ISO, and other styles
6

Uscamayta, Andrey Omar Mozo. "Ubiquitous collaborative multimedia capture of live experiences toward authoring extensible interactive multimedia documents." Universidade de São Paulo, 2017. http://www.teses.usp.br/teses/disponiveis/55/55134/tde-14092017-083647/.

Full text
Abstract:
The growing importance of multimedia content generated by ordinary users demands research for models, methods, technologies and systems that support multimedia production. Despite recent results allowing the collaborative capture of video via mobile devices, there is gap in supporting the collaborative capture of multiple media. In this dissertation we propose that ubiquitous collaborative multimedia production can be carried out by users who capture and annotate multiple media using the CMoViA mobile application. CMoViA also allows export the user-generated content to the CI+WaC, which allows them to edit the user-generated content in the form of interactive and extensible multimedia documents. The proposal demanded extending recent work reported in the literature, namely the I+WaC-IE (Interactors+WaC-Interaction Events) model, the I+WaC-Editor tool and MoViA tool. Hence, CMoViA follows the proposed CI+WaC-IE model. We discuss results from a case study, carried out in the educational domain, in which students collaboratively capture a lecture.
A crescente importância de conteúdo multimídia gerado por usuários amadores exige pesquisas por modelos, métodos, tecnologias e sistemas que apoiem a produção multimídia. Apesar dos recentes resultados que permitem captura colaborativa em vídeo utilizando dispositivos móveis, existe uma lacuna no apoio à captura colaborativa de múltiplas mídias. O trabalho apresentado nesta dissertação propõe que a produção multimídia colaborativa ubíqua possa ser alcançada por usuários que realizem a captura de múltiplas mídias e de anotações utilizando o aplicativo móvel CMoViA. CMoViA também permite que o conteúdo gerado por esses usuários seja exportado para a plataforma CI+WaC, a qual permite editar e anotar documentos multimídia interativos. Essa proposta requer a extensão de trabalho recentes reportados na literatura: o modelo I+WaC-IE (Interactors+WaC-Interaction Events), a ferramenta I+WaC-Editor e a ferramenta MoViA. Assim, a aplicação CMoViA segue o modelo CI+WaC-IE proposto neste trabalho como extensão do modelo I+WaC-IE. A proposta foi avaliada por meio de estudo de caso realizado no domínio educacional, no qual estudantes capturam colaborativamente uma palestra.
APA, Harvard, Vancouver, ISO, and other styles
7

Hirzalla, Naél B. "Media processing and retrieval model for multimedia documents databases." Thesis, National Library of Canada = Bibliothèque nationale du Canada, 1998. http://www.collectionscanada.ca/obj/s4/f2/dsk2/tape17/PQDD_0013/NQ28346.pdf.

Full text
APA, Harvard, Vancouver, ISO, and other styles
8

Vijayan, Usha. "A user interaction language for accessing multimedia news documents." Thesis, National Library of Canada = Bibliothèque nationale du Canada, 1997. http://www.collectionscanada.ca/obj/s4/f2/dsk2/tape16/PQDD_0005/MQ40236.pdf.

Full text
APA, Harvard, Vancouver, ISO, and other styles
9

Hsi, Chen-Ning. "Techniques for authoring multimedia documents: Scheduling and flow control." Diss., The University of Arizona, 1994. http://hdl.handle.net/10150/186866.

Full text
Abstract:
The area of multimedia applications keeps growing as more media become accessible and affordable on various computer platforms. Through the use of multiple information channels, more effective and expressive communication among people using computers is possible. However, due to the lack of a systematic authoring environment, multimedia documents are difficult to construct and their production is unnecessarily constrained in the ways that temporal and spatial relationships within the document can be expressed, and in the ways which user interactions can be employed. In this dissertation, a number of techniques to enhance the multimedia authoring environment are presented. A hierarchical framework is provided to form the basic multimedia document structure and to support various media materials uniformly, including regular media as well as user interactions. Based on this framework a set of algorithms for low-level analysis and synthesis are developed to support high level authoring tools. Error checking such as resource conflict detection and resolution, as well as better understanding of a multimedia document therefore become possible. A number of flow control primitives have also been identified to support flexible user interactivity. Finally, mechanisms to realize a novel multimedia authoring approach, the walk-through paradigm, are developed. All these techniques are implemented and tested in a multimedia authoring prototype environment following object-oriented design principles. Together, these techniques support more interesting multimedia documents, better authoring aids and more friendly authoring environment. Better user interaction is possible in multimedia documents with flexible scheduling and presentation flow control. Interactively analyzing and modifying the document provides useful authoring support, and the walk-through mechanism supports an easy-to-use authoring tool.
APA, Harvard, Vancouver, ISO, and other styles
10

Limame, Mohamed. "Un modele generalise pour le classement de documents multimedia." Paris 7, 1988. http://www.theses.fr/1988PA077192.

Full text
Abstract:
Cette these debat du probleme du classement de l'information bureautique. Celle-ci se trouve sous forme de documents multimedia, c'est-a-dire que son contenu peut renfermer differents types de donnees; on y trouve du texte, du graphique, de l'image, des sequences sonores, etc. Un modele semantique a ete propose pour classer et/ou rechercher cette information. Il est base sur des mecanismes d'abstraction utilisant les notions de generalisation, de specialisation de regroupement, etc. L'approche orientee objet a ete utilisee pour definir les objets et les actions de classement. Le modele a ete valide par une realisation effectuee dans le cadre d'un systeme de gestion de documents multimedia au sein d'un systeme bureautique integre. Le modele relationnel a ete utilise comme noyau pour batir le systeme de classement
APA, Harvard, Vancouver, ISO, and other styles
11

Hirzalla, Nael B. "Media processing and retrieval model for multimedia documents databases." Thesis, University of Ottawa (Canada), 1998. http://hdl.handle.net/10393/4541.

Full text
Abstract:
Typically, multimedia applications involve thousands of hours of video, images, audio, text and graphics that need to be stored, retrieved and manipulated in a large multimedia database. There is therefore an important need for novel techniques and systems which provide an efficient retrieval facility of the voluminous information stored in the multimedia database. Such a facility will consist of a query language, a query user interface, a data structure, indexing and finally content searching algorithms. Our interests focus on the first four components of such system. In this thesis, we propose a multimedia query specification language that can be used to fully describe a multimedia segment that needs to be received from a database. We designed an object-oriented database schema that can integrate the logical, temporal and spatial information of a multimedia document. We also proposed an algorithm to index a video by detecting camera breaks and coarse camera operations which will then be used as indices. Moreover, we discussed how to index interactive multimedia documents where undetermined user actions are involved, by proposing a temporal model that has the capability to represent interactive multimedia document scenarios. Indices that represent possible user actions and reactions are then extracted from the model and used to index such documents. Finally, we designed a simple and friendly query user interface on top of the proposed language, in which users can fully describe graphically a multimedia segment.
APA, Harvard, Vancouver, ISO, and other styles
12

Budnik, Mateusz. "Active and deep learning for multimedia." Thesis, Université Grenoble Alpes (ComUE), 2017. http://www.theses.fr/2017GREAM011.

Full text
Abstract:
Les thèmes principaux abordés dans cette thèse sont l'utilisation de méthodes d'apprentissage actif et d'apprentissage profond dans le contexte du traitement de documents multimodaux. Les contributions proposées dans cette thèse abordent ces deux thèmes. Un système d'apprentissage actif a été introduit pour permettre une annotation plus efficace des émissions de télévision grâce à la propagation des étiquettes, à l'utilisation de données multimodales et à des stratégies de sélection efficaces. Plusieurs scénarios et expériences ont été envisagés dans le cadre de l'identification des personnes dans les vidéos, en prenant en compte l'utilisation de différentes modalités (telles que les visages, les segments de la parole et le texte superposé) et différentes stratégies de sélection. Le système complet a été validé au cours d'un ``test à blanc'' impliquant des annotateurs humains réels.Une deuxième contribution majeure a été l'étude et l'utilisation de l'apprentissage profond (en particulier les réseaux de neurones convolutifs) pour la recherche d'information dans les vidéos. Une étude exhaustive a été réalisée en utilisant différentes architectures de réseaux neuronaux et différentes techniques d'apprentissage telles que le réglage fin (fine-tuning) ou des classificateurs plus classiques comme les SVMs. Une comparaison a été faite entre les caractéristiques apprises (la sortie des réseaux neuronaux) et les caractéristiques plus classiques (``engineered features''). Malgré la performance inférieure des seconds, une fusion de ces deux types de caractéristiques augmente la performance globale.Enfin, l'utilisation d'un réseau neuronal convolutif pour l'identification des locuteurs à l'aide de spectrogrammes a été explorée. Les résultats ont été comparés à ceux obtenus avec d'autres systèmes d'identification de locuteurs récents. Différentes approches de fusion ont également été testées. L'approche proposée a permis d'obtenir des résultats comparables à ceux certains des autres systèmes testés et a offert une augmentation de la performance lorsqu'elle est fusionnée avec la sortie du meilleur système
The main topics of this thesis include the use of active learning-based methods and deep learning in the context of retrieval of multimodal documents. The contributions proposed during this thesis address both these topics. An active learning framework was introduced, which allows for a more efficient annotation of broadcast TV videos thanks to the propagation of labels, the use of multimodal data and selection strategies. Several different scenarios and experiments were considered in the context of person identification in videos, including using different modalities (such as faces, speech segments and overlaid text) and different selection strategies. The whole system was additionally validated in a dry run involving real human annotators.A second major contribution was the investigation and use of deep learning (in particular the convolutional neural network) for video retrieval. A comprehensive study was made using different neural network architectures and training techniques such as fine-tuning or using separate classifiers like SVM. A comparison was made between learned features (the output of neural networks) and engineered features. Despite the lower performance of the engineered features, fusion between these two types of features increases overall performance.Finally, the use of convolutional neural network for speaker identification using spectrograms is explored. The results are compared to other state-of-the-art speaker identification systems. Different fusion approaches are also tested. The proposed approach obtains comparable results to some of the other tested approaches and offers an increase in performance when fused with the output of the best system
APA, Harvard, Vancouver, ISO, and other styles
13

Morris, Stephen John. "A method for the design and development of multimedia documents." Thesis, Imperial College London, 1996. http://ethos.bl.uk/OrderDetails.do?uin=uk.bl.ethos.243380.

Full text
APA, Harvard, Vancouver, ISO, and other styles
14

Nayyar, Vibha Mukul. "Design and Implementation of a Model for Authoring and Presenting Interactive Multimedia Documents." PDXScholar, 1996. https://pdxscholar.library.pdx.edu/open_access_etds/5187.

Full text
Abstract:
Multimedia technology enables direct manipulation of multiple media such as text, image, audio, and video, all integrated into one entity - the multimedia document. Interactive multimedia documents integrate text, images and continuous media such as audio and video, treat them as objects to be presented for a certain duration, and allow users to interact with the presentation. Authoring and presenting interactive multimedia documents imposes new requirements on document representation. We designed the interactive timeline model (ITM) for authoring and presenting interactive multimedia documents. We implemented the model and created a playback tool using the scripting language Tel. ITM uses an enhanced timeline model for representing interactive multimedia scenarios. ITM is a layered model that supports the creation of the logical, temporal, and presentation structures of a multimedia document and emphasizes the separation of content from its structure. The storage layer provides interfaces for creation and storage of media objects like text, images, scripts, choices, and audio. Choice is a media object that allows users to interact with the presentation. A script object causes Tel code to be executed. The composition layer specifies the logical structure and provides interfaces to compose a multimedia document. The presentation layer specifies the temporal and spatial structure of the document and describes the user interface for the playback tool. The run-time layer specifies the interfaces to start and control the flow of the presentation, describes the possible interactions between a user and the presentation at run-time, and specifies the actions to be taken when interaction takes place. ITM allows users to configure the playback tool according to their needs. It provides authors with a mechanism to create new interfaces and register them with the playback tool. To evaluate the design decisions of ITM and verify its usability, we conducted usability tests on the model. We asked a representative sample of end users ( both authors and viewers) to perform realistic tasks using the model. ITM is a powerful model to create and present interactive learning materials and dynamic presentations.
APA, Harvard, Vancouver, ISO, and other styles
15

Charpentier, Ana. "Identification de copies de documents multimedia grâce aux codes de Tardos." Phd thesis, Université Rennes 1, 2011. http://tel.archives-ouvertes.fr/tel-00646028.

Full text
Abstract:
Les travaux présentés dans cette thèse se situent dans le contexte du fingerprinting. Un distributeur de documents multimédia souhaite se prémunir contre la redistribution illégale des données en insérant dans chaque copie distribuée un identifiant propre à chaque utilisateur. En cas de redistribution de cette copie, il est donc possible de retrouver l'utilisateur indiscret. Afin de contrer les attaques par collusion, qui surviennent lorsque les utilisateurs se mettent à plusieurs pour créer une copie pirate, les identifiants doivent être pris dans un code anti-collusion. Cette thèse étudie une famille de codes anti-collusion particulière, les codes de Tardos. Ces codes probabilistes sont particulière- ment intéressants, car leur longueur est optimale. Ils sont de plus faciles à implémenter, et remarquablement efficaces. Dans cette thèse,nous présentons une amélioration de la phase d'accusation des codes de Tardos. Plus spécifiquement nous montrons comment l'optimiser en fonction de la stratégie d'attaque des pirates. Nous proposons également des moyens d'estimer à partir d'une copie pirate le nombre d'attaquants qui se sont ras- semblés pour la créer, ainsi que la stratégie qu'ils ont employée. Notre solution s'appuie sur un algorithme itératif a la EM (Expectation-Maximization). Une autre contribution est l'étude d'un environnement asymétrique.Dans un tel environnement, seul l'utilisa- teur est en possession de la copie marquée avec son identifiant. L'identifiant doit être partiellement inconnu du distributeur tout en assurant sa fonction de traçage. Nous présentons un schéma de fingerprinting asymétrique entièrement spécifié intégrant les codes de Tardos, en utilisant une primitive cryptographique appelée Oblivious Transfer.
APA, Harvard, Vancouver, ISO, and other styles
16

Putthividhya, Duangmanee (Pew). "A family of statistical topic models for text and multimedia documents." Diss., [La Jolla] : University of California, San Diego, 2010. http://wwwlib.umi.com/cr/ucsd/fullcit?p3398161.

Full text
Abstract:
Thesis (Ph. D.)--University of California, San Diego, 2010.
Title from first page of PDF file (viewed May 6, 2010). Available via ProQuest Digital Dissertations. Vita. Includes bibliographical references (leaves 102-107).
APA, Harvard, Vancouver, ISO, and other styles
17

Selim, Hossam Abdelatif Mohamed. "A novel secure autonomous generalized document model using object oriented technique." Thesis, University of Kent, 2002. http://ethos.bl.uk/OrderDetails.do?uin=uk.bl.ethos.269141.

Full text
APA, Harvard, Vancouver, ISO, and other styles
18

Sabry-Ismail, Loay. "Schéma d'éxécution pour les documents multimédia distribués." Université Joseph Fourier (Grenoble), 1999. http://www.theses.fr/1999GRE10021.

Full text
Abstract:
Le travail presente dans cette these se situe dans le domaine de la presentation de documents multimedia. Un document multimedia est le resultat de la composition d'un ensemble d'objets media de differentes natures comme le texte, les images, le son et la video. Quatre types de relations entre les objets media servent a definir l'organisation d'un document : les relations hierarchiques, temporelles, spatiales et hypermedia. La presentation d'un document multimedia consiste en la restitution des objets media qu'il contient en respectant d'une part les contraintes internes representees par les relations de composition entre ces objets et d'autre part les contraintes externes imposees par la disponibilite des ressources de la plate-forme d'execution. La prise en compte de ces contraintes souleve de nombreux problemes dans la realisation des fonctions de presentation comme la synchronisation inter-objets, la navigation temporelle, la gestion de l'indeterminisme et la gestion de la distribution des objets media. Dans cette these, nous proposons une architecture de presentation multimedia qui permet d'integrer de facon efficace les differentes fonctions de presentation grace a une approche dite predictive-reactive. Ces propositions sont experimentees au sein du systeme d'edition/presentation madeus. Cette these se compose des quatre chapitres suivants : 1. L'etude des systemes et des standards multimedia existants. 2. La definition d'une architecture de presentation multimedia dont le cur est constitue d'un format interne de document multimedia. 3. La definition d'une machine d'execution multimedia integrant des techniques de synchronisation faible et forte, le support pour les operations de navigation temporelle et un mecanisme de compensation des decalages temporels dus a l'indeterminisme. 4. La definition d'un schema d'acces aux objets distants qui permette d'adapter la qualite de la presentation des objets en fonction du debit du reseau. La definition d'un schema d'acces aux objets distants qui permette d'adapter la qualite de la presentation des objets en fonction du debit du reseau.
APA, Harvard, Vancouver, ISO, and other styles
19

Elagouni, Khaoula. "Combining neural-based approaches and linguistic knowledge for text recognition in multimedia documents." Thesis, Rennes, INSA, 2013. http://www.theses.fr/2013ISAR0013/document.

Full text
Abstract:
Les travaux de cette thèse portent sur la reconnaissance des indices textuels dans les images et les vidéos. Dans ce cadre, nous avons conçu des prototypes d'OCR (optical character recognition) capables de reconnaître tant des textes incrustés que des textes de scène acquis n'importe où au sein d'images ou de vidéos. Nous nous sommes intéressée à la définition d'approches robustes à la variabilité des textes et aux conditions d'acquisition. Plus précisément, nous avons proposé deux types de méthodes dédiées à la reconnaissance de texte : - une approche fondée sur une segmentation en caractères qui recherche des séparations non linéaires entre les caractères adaptées à la morphologie de ces derniers ; - deux approches se passant de la segmentation en intégrant un processus de scanning multi-échelles ; la première utilise un modèle de graphe pour reconnaître les textes tandis que la seconde intègre un modèle connexionniste récurrent spécifiquement développé pour gérer les contraintes spatiales entre les caractères.Outre les originalités de chacune des approches, deux contributions supplémentaires de ce travail résident dans la définition d'une reconnaissance de caractères fondée sur un modèle de classification neuronale et l'intégration de certaines connaissances linguistiques permettant de tirer profit du contexte lexical. Les différentes méthodes conçues ont été évaluées sur deux bases de documents : une base de textes incrustés dans des vidéos et une base publique de textes de scène. Les expérimentations ont permis de montrer la robustesse des approches et de comparer leurs performances à celles de l'état de l'art, mettant en évidence leurs avantages et leurs limites
This thesis focuses on the recognition of textual clues in images and videos. In this context, OCR (optical character recognition) systems, able to recognize caption texts as well as natural scene texts captured anywhere in the environment have been designed. Novel approaches, robust to text variability (differentfonts, colors, sizes, etc.) and acquisition conditions (complex background, non uniform lighting, low resolution, etc.) have been proposed. In particular, two kinds of methods dedicated to text recognition are provided:- A segmentation-based approach that computes nonlinear separations between characters well adapted to the localmorphology of images;- Two segmentation-free approaches that integrate a multi-scale scanning scheme. The first one relies on a graph model, while the second one uses a particular connectionist recurrent model able to handle spatial constraints between characters.In addition to the originalities of each approach, two extra contributions of this work lie in the design of a character recognition method based on a neural classification model and the incorporation of some linguistic knowledge that enables to take into account the lexical context.The proposed OCR systems were tested and evaluated on two datasets: a caption texts video dataset and a natural scene texts dataset (namely the public database ICDAR 2003). Experiments have demonstrated the efficiency of our approaches and have permitted to compare their performances to those of state-of-the-art methods, highlighting their advantages and limits
APA, Harvard, Vancouver, ISO, and other styles
20

FGAIER, NABIL. "Des nouvelles methodes de comparaison document-question pour des systemes gerant des documents structures multimedia et organises selon une approche orientee objet." Paris 11, 1992. http://www.theses.fr/1992PA112299.

Full text
Abstract:
Dans les systemes documentaires une grande difficulte reside dans le fait que la notion d'unite documentaire n'est pas clairement definie. Cela peut, pour un livre par exemple, etre aussi bien l'ouvrage dans son entier, qu'un chapitre, un paragraphe ou tout autre decoupage plus ou moins arbitraire. L'unite documentaire devrait etre liee a une notion d'homogeneite semantique et en liaison avec une certaine idee preconcue de son utilisation. Dans les systemes actuels, cette unite est definie de facon statique. L'adoption d'une notion dynamique fondee sur la structure logique des documents (sgml), permet d'eliminer cette difficulte. La prise en compte de cette structure lors de la comparaison document-question ameliore la qualite des reponses. Cela necessite l'elaboration d'un algorithme recursive qui parcourt l'arbre de bas en haut afin de determiner les plus petites unites documentaires pertinentes. Le choix d'un systeme oriente objet pour gerer les documents structures contribue au rapprochement entre bases editoriales et bases documentaires
APA, Harvard, Vancouver, ISO, and other styles
21

Branko, Milosavljević. "Proširivi sistem za pronalaženje multimedijalnih dokumenata." Phd thesis, Univerzitet u Novom Sadu, Fakultet tehničkih nauka u Novom Sadu, 2003. http://dx.doi.org/10.2298/NS2003MILOSAVLJEVICBRANKO.

Full text
Abstract:
Oblast pronalaženja informacija kao jedan od osnovnih problema razmatra pronalaženje dokumenata u kolekciji koji su relevantni sa stanovišta korisnika. Ova disertacija se bavi problemima pronalaženja strukturiranih multimedijalnih dokumenata. Strukturirani multimedijalni dokumenti mogu, kao svoje elemente, sadržati objekte različitih tipova medija(tekst, slika, zvuk, ili video). Tema disertacije je formalna specifikacija modela sistema koji omogućava pronalaženje multimedijalnih dokumenata obezbeđujući pri tom proširivost sistema podrškom za različite tipove medija (što uključuje upotrebu različitih postojećih rešenja iz ove oblasti) i proširivost sistema različitim modelima pronalaženja dokumenata. XML jezik se koristi kao jezik za reprezentaciju dokumenata i kao jezik za komunikacijusistema sa klijentima. Sistem je verifikovan na realnom primeru digitalne biblioteke doktorskih i magistarskih teza pomoću razvijenog prototipa. Prikazana prototipska implementacija koja ispunjava ciljeve u pogledu funkcionalnosti postavljene predsistem predstavlja potvrdu praktiˇcne vrednosti predloženog modela.
The field of information retrieval deals with retrieval of documents judged as relevant by users. This dissertation focuses on problems in retrieval of structured multimedia documents. Structured multimedia documents comprise objects of different media types (such as text, images, audio or video clips) as their elements. The subject of the dissertation is a formal specification of a multimedia information retrieval system providing extensibility with support for different media types (including utilizing existing solutions in this field) and extensibility with different document retrieval models. XML is used as a language for expressing document content and as a langugage for communication between the system and its clients. The system is verified by a case study on a networked digital library of theses and dissertations. The presented prototype implementation presents a proof of the proposed model’s practical value.
APA, Harvard, Vancouver, ISO, and other styles
22

Manzat, Ana-Maria. "Contribution à la modélisation des métadonnées associées aux documents multimédias et à leur enrichissement par l’usage." Phd thesis, Toulouse, INPT, 2013. http://oatao.univ-toulouse.fr/11342/1/Manzat.pdf.

Full text
Abstract:
De nos jours, ce ne sont pas que les collections multimédias qui deviennent de plus en plus volumineuses, mais aussi les métadonnées qui les décrivent. L’extraction des métadonnées est très coûteuse en consommation de ressources. Cela pose le problème de la gestion efficace de ces grands volumes de données, en minimisant cette consommation. Le fait que les utilisateurs sont en constante interaction avec les documents multimédias et les métadonnées complique encore plus cette gestion. Dans cette thèse, nous étudions le problème de la gestion de métadonnées en intégrant les interactions des utilisateurs à deux niveaux: dans le processus de création de métadonnées et dans leur enrichissement. La grande variété de standards et normes de métadonnées existants ne sont pas interopérables. Les solutions proposées à ce problème d’interopérabilité se sont focalisées sur la création d’ontologies qui décrivent les contenus multimédias du point de vue sémantique, sans forcément prendre en compte les standards de métadonnées et d’autres informations de plus bas niveau sur les documents. Pour résoudre ce problème nous proposons un format de métadonnées qui intègre les standards et normes les plus utilisés et qui est flexible et extensible en structure et en vocabulaire. Dans le cadre d’un système de gestion des contenus multimédias, le processus d’indexation est celui qui consomme le plus de ressources, à travers les algorithmes d’indexation qui extraient les métadonnées. Dans les systèmes classiques, cette indexation est accomplie avec un ensemble d’algorithmes d’indexation figé dans le temps, sans se soucier de la consommation des ressources ni de l’évolution des besoins de l’utilisateur. Pour prendre en compte les besoins que l’utilisateur spécifie dans sa requête, afin de n’extraire que les métadonnées nécessaires et ainsi limiter d’un côté le volume de métadonnées à gérer et de l’autre la consommation des ressources, nous proposons de répartir le processus d’indexation en deux phases: une fois à l’acquisition des contenus (indexation implicite), et une deuxième fois, si besoin, au moment de l’exécution de la requête de l’utilisateur (indexation explicite) en ayant recours à une liste d’algorithmes d’indexation déterminée principalement en fonction de la requête de l’utilisateur. L’utilisateur est de plus en plus pris en compte dans les systèmes multimédias à travers ses interactions avec le système et le document. Nous proposons d’aller plus loin dans la prise en compte de l’utilisateur, en considérant ses interactions avec les différentes parties du document mais aussi avec les métadonnées qui décrivent le document. Cela a été réalisé à travers l’extension du format de métadonnées proposée, par l’ajout d une température à chaque élément du format, qui varie dans le temps, étant calculée en fonction de la façon dont l’utilisateur interagit avec le document, mais aussi avec les métadonnées dans une période de temps. Nous avons validé nos propositions dans deux domaines différents: la vidéo surveillance et le commerce électronique. Le projet LINDO nous a permis la validation du format des métadonnées et de la sélection des algorithmes d’indexation dans le cadre de l’indexation explicite, dans le cadre de la vidéo surveillance. Dans le domaine du commerce électronique, nous avons exploité les interactions des utilisateurs réels avec un site de vente en ligne pour calculer la température des métadonnées associées aux pages du site pendant une période de deux mois. Nous avons utilisé cette température pour réaliser le reclassement des résultats obtenus pour une requête de l’utilisateur. Nous avons réalisé un test utilisateur sur une vingtaine de personnes. Ce test montre que pour certaines requêtes de l’utilisateur ce reclassement des résultats aide les utilisateurs à trouver les informations recherchés plus vite. Ce travail a permis de répondre au problème de la prise compte de l’utilisateur dans le processus de gestion des documents multimédias, en proposant: un modèle de métadonnées qui intègre les standards de métadonnées les plus utilisés; l’indexation différée des contenus multimédias (indexation implicite et explicite); l’enrichissement des métadonnées en considérant les interactions des utilisateurs avec le système, les documents multimédias et les métadonnées.
APA, Harvard, Vancouver, ISO, and other styles
23

Layaida, Nabil. "Madeus : système d'édition et de présentation de documents structurés multimédia." Phd thesis, Université Joseph Fourier (Grenoble), 1997. http://tel.archives-ouvertes.fr/tel-00004952.

Full text
Abstract:
Les travaux de cette thèse ont pour cadre l'édition de documents électroniques multimédia en considérant en tout premier lieu leur dimension temporelle (enchaînement des objets dans le temps). L'objectif concerne à la fois l'intégration de cette nouvelle dimension dans la structure globale d'un document (logique, spatiale et hypertexte) et l'intégration d'objets de base qui ont eux-mêmes une dimension temporelle (vidéo, audio, interactions de l'utilisateur ..). Les documents visés sont donc multimédia, temporisés et interactifs. Notre étude a porté tout d'abord sur la définition d'un langage temporel multimédia. Celui-ci permet de spécifier, de façon déclarative, le scénario temporel d'un document en s'appuyant sur des résultats obtenus dans le domaine de la satisfaction de contraintes temporelles et de la planification. Nous avons ensuite conçu des mécanismes d'analyse qui permettent la vérification de la cohérence d'une spécification tout en prenant en compte trois aspects essentiels aux systèmes multimédia : l'incrémentalité, l'efficacité, et la gestion de l'indéterminisme. Nous proposons des mécanismes de synthèse qui permettent alors le calcul d'une solution qui sera exploitée par le système de présentation. Celui-ci permet, à partir d'un automate d'états finis extrait du graphe temporel de contraintes, d'exécuter la présentation multimédia et de contrôler dynamiquement son déroulement. Enfin, nous présentons l'ensemble des résultats à travers leur application concrète au sein d'un outil d'édition et de présentation appelé Madeus.
APA, Harvard, Vancouver, ISO, and other styles
24

Métayer, Natacha. "Compréhension et stratégies d’exploration des documents pédagogiques illustrés." Thesis, Rennes 2, 2016. http://www.theses.fr/2016REN20001/document.

Full text
Abstract:
Il est aujourd’hui plus aisé de proposer dans un même document d’apprentissage de nombreuses sources d’information présentées sous des formats différents. Si présenter plusieurs médias peut apporter des bénéfices en termes de performances d’apprentissage, traiter efficacement ces différentes sources d’information est une activité complexe. C’est pourquoi, proposer des documents guidant l’apprenant lors de sa consultation peut s’avérer nécessaire afin de favoriser la construction d’un modèle mental de qualité. Les études empiriques menées au cours de cette thèse se sont attachées à déterminer quels formats étaient les plus efficaces tout en augmentant progressivement le guidage au sein du document. Ainsi, ont été testés : la position de l’illustration par rapport au texte, l’effet de la consigne, la segmentation du texte et l’introduction d’un guidage via un contraste figure/fond. De plus, afin d’apporter de nouveaux éléments de réflexion quant à la manière dont les individus explorent un document d’apprentissage et l’impact de ces stratégies sur les performances, les mouvements oculaires des apprenants ont été enregistrés. Les résultats obtenus ont mis en évidence que les modifications du format de présentation des informations avaient un impact sur les stratégies de consultation du document notamment sur l’augmentation des transitions oculaires effectuées entre les textes et les illustrations. Cependant, seule la segmentation du texte sous forme de paragraphes sémantiques a permis d’obtenir des bénéfices en termes de compréhension
It is easier today to offer in one informative document many sources of information presented in different formats. Presenting various media can bring benefits in terms of learning performance, but dealing effectively with these different sources of information is complex. Therefore, offering documents guiding the learner when he is reading may be necessary to promote the construction of a qualitative mental model. Empirical studies that are conducted during this thesis endeavour to determine which formats are most effective while gradually increasing guidance within the document. Thus, four items are tested: the position of the picture relative to the text, the effect of the instructions, the text segmentation and the introduction of a guidance through a figure-ground contrast. Moreover, in order to bring new elements of reflection about how people explore an informative document and the impact of these strategies on performance, the eye movements of the learners were recorded. The results showed that changes in the format of information have an impact on the strategies of consultation of the document, including the increasing eye transitions between texts and illustrations. However, only the segmentation of the text in the form of semantic paragraphs brought benefits in terms of understanding
APA, Harvard, Vancouver, ISO, and other styles
25

Johnson, Matthew G. "Using a multimedia assessment tool to impact evolution education strategies in South Carolina's public high schools." Connect to this title online, 2009. http://etd.lib.clemson.edu/documents/1263397421/.

Full text
APA, Harvard, Vancouver, ISO, and other styles
26

Fourel, Franck. "Modélisation, indexation et recherche de documents structurés." Phd thesis, Université Joseph Fourier (Grenoble), 1998. http://tel.archives-ouvertes.fr/tel-00004888.

Full text
Abstract:
Les systèmes actuels de recherche de documents électroniques, que ce soit des systèmes de gestion de bases de données ou des systèmes de recherche d'informations, n'exploitent pas suffisament la richesse des documents. Les uns n'analysent pas le contenu des documents et se laissent diriger par la structure du document alors que les autres délaissent l'aspect structurel en s'appuyant sur des méthodes trop peu adaptées aux nouvelles caractéristiques de ces documents. Le but de notre travail, situé à l'intersection de ces deux types de systèmes, est de réconcilier les différentes modalités d'accès aux documents électroniques et de rendre accessible tout document ou toute partie de documents qui peut résoudre le problème d'informations d'un utilisateur. Notre travail comporte plusieurs phases : la définition de modèles de représentation des documents structurés ainsi que de leurs composantes monomédias et multimédias (texte et image fixe) et la mise en place d'un processus d'indexation structurelle support du processus d'interrogation. Le modèle de représentation des documents structurés s'articule autour de trois relations de structure que nous avons particulièrement identifiées dans les documents textuels : la relation de composition, la relation de séquence et la relation de référence. Elles établissent l'organisation syntaxique des parties des documents, appelées éléments de structure, qui comme nous le montrons, possède une organisation duale, la structure sémantique. Nous exploitons les caractéristiques de cette dernière pour définir des propriétés sur les descripteurs des éléments de structure. Ces propriétés sont formalisées par la notion de portées des attributs et par la classification des attributs qui s'en suit. Pour chaque attribut d'un élément de structure, sa portée indique les autres éléments de structure concernés par l'attribut et par sa valeur. C'est en suivant les relations de structure que nous retrouvons les éléments concernés, puis nous leur assignons un attribut et une valeur dépendante de la valeur de l'attribut de l'élément qui est à la source de l'information. L'application des portées fournit une représentation du document au sein de laquelle les informations, si elles ne sont pas modifiées, sont mieux réparties et pour laquelle la plupart des informations sont explicitées pour chaque élément de structure et sont rendues dépendantes les unes des autres. Le processus d'interrogation utilise ces dépendances pour retrouver le ou les éléments de structure pertinents d'un document structuré. Nous avons validé ce travail par le développement du prototype my Personal Daily News qui permet d'interroger une base constituée de quotidiens d'informations en mêlant dans les requêtes des critères structurels et des critères de contenu. Nous montrons ainsi que notre approche rend des éléments accessibles et augmente la flexibilité d'interrogation en autorisant une connaissance imparfaite de la structure des documents.
APA, Harvard, Vancouver, ISO, and other styles
27

Torjmen, Mouna. "Approches de recherche multimédia dans des documents semi-structurés : utilisation du contexte textuel et structurel pour la sélection d'objets multimédia." Toulouse 3, 2009. http://thesesups.ups-tlse.fr/673/.

Full text
Abstract:
L'évolution conjointe des besoins utilisateurs et des documents électroniques ne cesse de soulever de nouvelles problématiques dans le domaine de la Recherche d'Information (RI). Si l'on considère la recherche dans des corpus de documents semi-structurés (XML), la structure des documents permet aux Systèmes de Recherche d'Information (SRI) de se focaliser sur le besoin utilisateur en renvoyant non plus des documents entiers mais des parties de document répondant de manière précise au besoin. Parallèlement à l'apparition de l'information structurelle dans les documents, l'insertion de contenus multimedia, et notamment d'images, a également soulevé de nombreuses problématiques. Afin de valoriser au mieux l'ensemble des informations multimedia disponibles, les méthodes existantes de la Recherche Multimedia (RM) doivent être adaptées. Alors que l'exploitation de la structure dans la recherche d'information textuelle a montré son intérêt, peu de travaux ont étudié son utilisation dans la recherche multimedia. La plupart des travaux existants pour la recherche multimedia structurée consistent soit à combiner une recherche XML textuelle et une recherche multimedia basée sur le contenu physique des éléments multimedia, soit à effectuer une recherche XML textuelle et ensuite à filtrer les résultats en gardant seulement ceux répondant aux besoins multimedia. L'objectif de nos travaux est de proposer des méthodes permettant de répondre aux besoins multimedia en tenant compte à la fois de la structure des documents et de la spécificité multimedia. Nos approches peuvent être appliquées à n'importe quel type de media (image, son, video) car elles sont indépendantes du contenu physique des medias, mais nous nous intéressons plus particulièrement à la recherche d'images. Nos méthodes permettent ainsi soit la recherche d'éléments multimedia à travers le contexte textuel et structurel des images; soit la recherche de fragments multimedia (c'est-à-dire d'images et éventuellement de texte). Pour la recherche d'éléments multimedia, l'idée de base est de déterminer le score de pertinence de ces éléments en fonction des autres éléments non-multimedia. Le problème est alors de sélectionner les éléments à utiliser pour évaluer les scores de pertinence des éléments multimedia. . .
The evolution of user needs and electronic documents raises new issues in the Information R(IR) domain. Indeed, when considering semi-structured documents (XML), the document structure allows the Information Retrieval Systems (IRS) to answer more precisely to the user information needs, by returning parts of documents instead of whole documents. With the emergence of structural information in documents, the integration of multimedia content, like images for example, has also raised many issues. To exploit all the multimedia and structural information at best, the existing methods of Multimedia Retrieval (MR) must be adapted. Although the use of the document structure in textual information retrieval has shown its interest, only a few studies have investigated its impact in multimedia retrieval. In the literature, most of the existing works in multimedia structured retrieval consists either of combining XML textual search and content-based multimedia retrieval, or of using an XML textual search and then filtering the results by keeping only those having a multimedia specification. The aim of our work is to propose methods to answer to the multimedia information needs, by taking into account both the document structure and the multimedia specificity. Our approaches can be applied on any type of media (images, audio, video) because they are independent of the physical content of the media. However, we are particularly interested in image retrieval. For multimedia elements (images) retrieval, the basic idea is to determine their relevance score thanks to the other non-multimedia elements scores. At this stage, the challenge is to select the elements used to evaluate the multimedia elements scores. For this purpose, we proposed two approaches: they are respectively based on the implicit and explicit use of textual and structural context. For multimedia fragments retrieval, we use the multimedia elements retrieved by one of the two previous methods to determine the best multimedia fragment to be returned to the user. .
APA, Harvard, Vancouver, ISO, and other styles
28

Derbas, Nadia. "Contributions à la détection de concepts et d'événements dans les documents vidéos." Thesis, Grenoble, 2014. http://www.theses.fr/2014GRENM035/document.

Full text
Abstract:
L'explosion de la quantité de documents multimédias, suite à l'essor des technologies numériques, a rendu leur indexation très coûteuse et manuellement impossible. Par conséquent, le besoin de disposer de systèmes d'indexation capables d'analyser, de stocker et de retrouver les documents multimédias automatiquement, et en se basant sur leur contenu (audio, visuel), s'est fait ressentir dans de nombreux domaines applicatifs. Cependant, les techniques d'indexation actuelles rencontrent encore des problèmes de faisabilité ou de qualité. Leur performance reste très limitée et est dépendante de plusieurs facteurs comme la variabilité et la quantité de données à traiter. En effet, les systèmes d'indexation cherchent à reconnaître des concepts statiques, comme des objets (vélo, chaise,...), ou des événements (mariage, manifestation,...). Ces systèmes se heurtent donc au problème de variabilité de formes, de positions, de poses, d'illuminations, d'orientations des objets. Le passage à l'échelle pour pouvoir traiter de très grands volumes de données tout en respectant des contraintes de temps de calcul et de stockage est également une contrainte.Dans cette thèse, nous nous intéressons à l'amélioration de la performance globale de ces systèmes d'indexation de documents multimédias par le contenu. Pour cela nous abordons le problème sous différents angles et apportons quatre contributions à divers stades du processus d'indexation. Nous proposons tout d'abord une nouvelle méthode de fusion "doublement précoce " entre différentes modalités ou différentes sources d'informations afin d'exploiter au mieux la corrélation entre les modalités. Cette méthode est ensuite appliquée à la détection de scènes violentes dans les films. Nous développons ensuite une méthode faiblement supervisée pour la localisation des concepts basiques (comme les objets) dans les images qui pourra être utilisé plus tard comme un descripteur et une information supplémentaire pour la détection de concepts plus complexes (comme des événements). Nous traitons également la problématique de réduction du bruit généré par des annotations ambiguës sur les données d'apprentissage en proposant deux méthodes: une génération de nouvelles annotations au niveau des plans et une méthode de pondération des plans. Enfin, nous avons mis en place une méthode d'optimisation des représentations du contenu multimédia qui combine une réduction de dimension basée sur une ACP et des transformations non linéaires.Les quatre contributions sont testées et évaluées sur les collections de données faisant référence dans le domaine, comme TRECVid ou MediaEval. Elles ont participé au bon classement de nos soumissions dans ces campagnes
A consequence of the rise of digital technology is that the quantity of available collections of multimedia documents is permanently and strongly increasing. The indexing of these documents became both very costly and impossible to do manually. In order to be able to analyze, classify and search multimedia documents, indexing systems have been defined. However, most of these systems suffer quality or practicability issues. Their performance is limited and depends on the data volume and data variability. Indexing systems analyze multimedia documents, looking for static concepts (bicycle, chair,...), or events (wedding, protest,...). Therefore, the variability in shapes, positions, lighting or orientation of objects hinders the process. Another aspect is that systems must be scalable. They should be able to handle big data while using reasonable amount of computing time and memory.The aim of this thesis is to improve the general performance of content-based multimedia indexing systems. Four main contributions are brought in this thesis for improving different stages of the indexing process. The first one is an "early-early fusion method" that merges different information sources in order to extract their deep correlations. This method is used for violent scenes detection in movies. The second contribution is a weakly supervised method for basic concept (objects) localization in images. This can be used afterwards as a new descriptor to help detecting complex concepts (events). The third contribution tackles the noise reduction problem on ambiguously annotated data. Two methods are proposed: a shot annotation generator, and a shot weighing method. The last contribution is a generic descriptor optimization method, based on PCA and non-linear transforms.These four contributions are tested and evaluated using reference data collections, including TRECVid and MediaEval. These contributions helped our submissions achieving very good rankings in those evaluation campaigns
APA, Harvard, Vancouver, ISO, and other styles
29

Poignant, Johann. "Identification non-supervisée de personnes dans les flux télévisés." Phd thesis, Université de Grenoble, 2013. http://tel.archives-ouvertes.fr/tel-00958774.

Full text
Abstract:
Ce travail de thèse a pour objectif de proposer plusieurs méthodes d'identi- fication non-supervisées des personnes présentes dans les flux télévisés à l'aide des noms écrits à l'écran. Comme l'utilisation de modèles biométriques pour reconnaître les personnes présentes dans de larges collections de vidéos est une solution peu viable sans connaissance a priori des personnes à identifier, plusieurs méthodes de l'état de l'art proposent d'employer d'autres sources d'informations pour obtenir le nom des personnes présentes. Ces méthodes utilisent principalement les noms prononcés comme source de noms. Cependant, on ne peut avoir qu'une faible confiance dans cette source en raison des erreurs de transcription ou de détection des noms et aussi à cause de la difficulté de savoir à qui fait référence un nom prononcé. Les noms écrits à l'écran dans les émissions de télévision ont été peu utilisés en raison de la difficulté à extraire ces noms dans des vidéos de mauvaise qualité. Toutefois, ces dernières années ont vu l'amélioration de la qualité des vidéos et de l'incrustation des textes à l'écran. Nous avons donc ré-évalué, dans cette thèse, l'utilisation de cette source de noms. Nous avons d'abord développé LOOV (pour Lig Overlaid OCR in Vidéo), un outil d'extraction des textes sur-imprimés à l'image dans les vidéos. Nous obtenons avec cet outil un taux d'erreur en caractères très faible. Ce qui nous permet d'avoir une confiance importante dans cette source de noms. Nous avons ensuite comparé les noms écrits et les noms prononcés dans leurs capacités à fournir le nom des personnes présentes dans les émissions de télévisions. Il en est ressorti que deux fois plus de personnes sont nommables par les noms écrits que par les noms prononcés extraits automatiquement. Un autre point important à noter est que l'association entre un nom et une personne est intrinsèquement plus simple pour les noms écrits que pour les noms prononcés. Cette très bonne source de noms nous a donc permis de développer plusieurs méthodes de nommage non-supervisé des personnes présentes dans les émissions de télévision. Nous avons commencé par des méthodes de nommage tardives où les noms sont propagés sur des clusters de locuteurs. Ces méthodes remettent plus ou moins en cause les choix fait lors du processus de regroupement des tours de parole en clusters de locuteurs. Nous avons ensuite proposé deux méthodes (le nommage intégré et le nommage précoce) qui intègrent de plus en plus l'information issue des noms écrits pendant le processus de regroupement. Pour identifier les personnes visibles, nous avons adapté la méthode de nommage précoce pour des clusters de visages. Enfin, nous avons aussi montré que cette méthode fonctionne aussi pour nommer des clusters multi-modaux voix-visage. Avec cette dernière méthode, qui nomme au cours d'un unique processus les tours de paroles et les visages, nous obtenons des résultats comparables aux meilleurs systèmes ayant concouru durant la première campagne d'évaluation REPERE.
APA, Harvard, Vancouver, ISO, and other styles
30

Perez, Celso Roberto. "A modelagem de documentos estruturados multitmídia integrando sistemas de hipertextos e ODA/ODIF." reponame:Biblioteca Digital de Teses e Dissertações da UFRGS, 1994. http://hdl.handle.net/10183/25461.

Full text
Abstract:
Há um grande numero de aplicações que necessitam manipular documentos. Tal manipulação exige uma gerência dos mesmos nas tarefas de criação, armazenamento, recuperação e transmissão. Estas tarefas devem levar em conta características e aspectos inerentes aos documentos tais como estrutura lógica, estrutura de apresentação e hiperestrutura formada pelas referências internas e externas existentes nos documentos envolvidos. A multimídia estabelece novos requisitos para os sistemas de gerência de documentos estruturados. Gráficos, sons, e imagens contêm informações que enriquecem o conteúdo textual tradicional dos documentos, podendo ser potencialmente explorados pelos usuários em um processo de formulação de consultas e busca de documentos. A complexidade das aplicações que manipulam documentos estruturados e do tipo multimídia exige o apoio de modelos capazes de expressar características semanticamente mais ricas. Desta forma, tais modelos devem permitir modelar as seguintes estruturas: lógica, de apresentação e hiperestrutura. A adoção de um modelo conceitual de documentos é fator determinante nas possibilidades oferecidas para consultas e recuperação dos referidos documentos. Para a especificação e definição de tal modelo, foram consideradas duas possibilidades: i) utilização dos sistemas de hipertextos, nos quais a ênfase é fornecer um corpo estruturado de objetos com ligações conectando objetos relacionados. Aqui, a estrutura está projetada especificamente para auxiliar aos leitores a navegar através da informação, ii) uso do padrão de documentos eletrônicos ODA/ODIF, o qual dá ênfase à composição e controle da forma dos documentos, preocupando-se, também, com a divisão layout-estrutura-conteúdo dos mesmos, mas faltando nele um tratamento específico em relação às características hipertextuais. Neste trabalho se considera que a integração destas duas filosofias permitirá, de uma maneira natural, a modelagem de Documentos Estruturados Multimídia. As pesquisas e propostas para combinar estas duas opções foram escassas no passado e se desconhecem trabalhos deste tipo visando a Gerência de Documentos Estruturados Multimídia. Como resultado desta integração, no presente trabalho é definido e especificado o meta-modelo OHypA (Office HyperDocument Architecture), que pode ser considerado como uma extensão do padrão ODA/ODIF. Tal meta-modelo terá uma aplicação real e prática pela combinação da tecnologia de hipermídia e a representação de documentos do tipo ODA. Assim sendo, uma vez que o presente trabalho trata a modelagem de Documentos Estruturados Multimídia , envolvendo as áreas definidas, ele permitirá o estudo e delineamento de possíveis soluções para problemas comuns resultantes da integração das referidas áreas. Finalmente, serão integrados dois enfoques em pleno desenvolvimento, resultando num meta-modelo orientado a objetos, que será facilmente integrado a um Sistema de Banco de Dados Orientado a Objetos.
There it a great number of applications that need a document manipulation. Such manipulation demands a management of these documents on tasks like creation, storage, recovery and transmission. Such tasks should consider marks and aspects inherent on documents such as logical structure, presentation structure and hyperstructure, shaped by internal and external references existent in the documents involved. Multimedia establishes new requirements for management systems of structured documents. Graphics, sounds and images contain informations which increase the traditional textual content from the documents that might be potentially explored by user in a process of formulation- queries and search for documents. The complexity of the applications that manipulate structured documents and the kind of multimedia, demands support from models which are able to express characteristics semanually ricer. This way, such models must allow the modeling of the following structures: luzical, presentation and hyperstructure. The adoption of a respected model of documents is a main factor on the offered possibilities for queries and recovering of the reported documents. For spt-Afication and definition of such model, two possibilities were considered: i) utilization of hypertexts systems, in which the emphasis is to provide a structured body of objets connecting other objects related. Here, the structure is designed specificity to help re.ers to navigate through the information, ii) application of the electronic documents model ODA/ODIF, which emphasizes the composition and control of the documents shape, worries also about its sharing of layout-structure-content, but lacks an specific treatment in relation to hypertextual characteristics. This work considers that the integration of these two philosophies will allow, in a natural way, the modeling of multimedia structured documents. The researches and proposals to connect these two options used to be rare in the past. Besides, works that emphasizes the Management of Multimedia Structured Documents are unknown. As a result of such integration, this work describes precisely the OHypA metamodel (Office HyperDocument Architecture) which might be consider as an extension of the ODA/ODIF model. This metamodel will have a real and practical application with the connection of hypermedia technology and the representation of ODA documents. This way, since this work is about the modeling of Mul timedia Structured Documents, covering the described areas, it'll allows the study and outline of possible solutions to common problems that come from the integration of such areas. Finally, two topics in development will be integrated, resulting in a objectoriented metamodel, that should be easily integrated in a Object-Oriented Data Base System.
APA, Harvard, Vancouver, ISO, and other styles
31

Oliveros, Didier Augusto Vega. "Operadores de interação multimídia para criação automática de documentos: Interactors." Universidade de São Paulo, 2011. http://www.teses.usp.br/teses/disponiveis/55/55134/tde-28062011-145629/.

Full text
Abstract:
Neste trabalho foi investigado o problema de autoria automatizada de informação multimídia sob a perspectiva da computação ubíqua de modo geral, e da interação do usuário com aplicações de captura e accesso (C&A) de modo particular. O objetivo do projeto foi a definição de operadores sobre interação do usuário em ambientes e em aplicações para permitir a geração automática de documentos multimídia interativos, um dos temas de pesquisa da área de engenharia de documentos. A abordagem da proposta foi a generalização dos operadores Inkteractors, definidos sobre a interação do usuário com aplicações baseadas em tinta eletrônica, considerando a interação do usuário na voz, mensagens de texto, vídeo e lousa. Como resultado foram definido os novos Interactors: operadores de interação sobre informação capturada em aplicações que envolvem interação do usuário com as mídias. Os Interactors foram validados no contexto de engenharia de documentos ao serem utilizados para a geração automática de documentos multimídia interativos, associados a aplicações de C&A para oferecer novas possibilidades de indexar, visualizar e acessar os documentos multimídia
This study investigated the problem of automated authoring of multimedia information from the perspective of ubiquitous computing in general, and the user interaction with applications of capture and acess (C&A) in particular. The project goal was to formalize operators on user interaction environments and applications to enable automatic generation of interactive multimedia documents, one of the themes of the research area of document engineering. The proposed approach is a generalization of the Inkteractors operators, defined on the user interaction with electronic ink-based applications on the users interaction with digital voice, text messaging, video and whiteboard. As a result we defined the new Interactors: interaction operators of captured information in applications that involve user interaction with the media. TheInteractors were validated in the context of document engineering to be used for the automatic generation of interactive multimedia documents, and in C&A aplications to offer new possibilities for indexing, viewing and accessing multimedia documents
APA, Harvard, Vancouver, ISO, and other styles
32

Carré, Matthieu. "Systèmes de Recherche de Documents Musicaux par Chantonnement." Phd thesis, Ecole nationale supérieure des telecommunications - ENST, 2002. http://tel.archives-ouvertes.fr/tel-00001593.

Full text
Abstract:
Avec l'explosion des données numériques disponibles (notamment via Internet), la question de l'accès aux documents reçoit depuis quelques années une attention accrue. En effet, l'indexation des documents, traditionnellement fondée sur la description textuelle, atteint rapidement ses limites en particulier lorsque le contenu concerné est musical.

Cette thèse focalise sur la recherche de documents musicaux par chantonnement. Nous présentons un système qui permet de retrouver une musique à partir d'un extrait chanté par l'utilisateur. Sa réalisation a nécessité deux études préalables qui ont comblé quelques lacunes d'un domaine de recherche encore jeune. Nous nous sommes intéressés, d'une part, à la "justesse" des mélodies chantonnées (par l'étude de 500 requêtes), et d'autre part, à certains aspects de la similarité mélodique (par la réalisation de tests subjectifs).

Grâce à ces études, nous proposons un système de recherche original et performant. Refusant une description tempérée de la requête (i.e. comportant une quantification des notes au demi-ton), le système proposé retrouve plus de 90% des documents musicaux attendus, pour une taille de requête moyenne (13 notes). La base de données consultée est constituée de 20.000 fichiers MIDI (40 millions de notes indexées). Le temps d'attente est acceptable puisqu'il ne faut que quelques secondes au système pour fournir sa réponse (i.e. la liste des documents les plus similaires à la requête, ceux-ci étant classés par ordre de similarité).

Cette thèse apporte également une aide dans le processus d'évaluation de la qualité de tels systèmes. En effet, nous proposons une modélisation de l'imprécision des mélodies chantonnées. Celle-ci permet la génération de requêtes artificielles qui peuvent être substituées aux requêtes réelles lors du test de systèmes. Cette alternative permet d'alléger le processus de test tout en conservant une stimulation réaliste.
APA, Harvard, Vancouver, ISO, and other styles
33

Hamroun, Mohamed. "Indexation et recherche par contenu visuel, sémantique et multi-niveaux des documents multimédia." Thesis, Bordeaux, 2019. http://www.theses.fr/2019BORD0372.

Full text
Abstract:
Suite aux derniers progrès technologiques, la quantité de données multimédias ne cesse d'augmenter. Dans ce contexte, le problème qui se pose est comment exploiter efficacement ces données ? il est nécessaire de mettre en place des outils facilitant leur accès et leur manipulation.Pour répondre à ces besoins, nous avons proposé, tout d’abord, un modèle d’indexation et de recherche de planes vidéos (ou images) par son contenu visuel (ISE). Les fonctionnalités innovantes d'ISE sont les suivantes : (i) définition d'un nouveau descripteur "PMC" et (ii) application de l'algorithme génétique (AG) pour améliorer la recherche (PMGA).Ensuite, nous nous sommes intéressés à la détection des concepts dans les plans vidéo (Approche LAMIRA). Dans ce même contexte, nous avons proposé une méthode d’annotation semi-automatique des plans vidéo afin d’améliorer la qualité d’indexation basée sur l’AG.Puis, nous avons fourni une méthode d’indexation sémantique séparant le niveau donné, d’un niveau conceptuel et d’un autre, plus abstrait, contextuel. Ce nouveau système intègre, aussi, des mécanismes d’expansion de la requête et de retour de pertinence. Pour donner plus de fluidité dans la requête utilisateur, l’utilisateur peut effectuer une recherche par navigation sur les trois niveaux d’abstraction. Deux systèmes appelés VISEN et VINAS ont été mis en place pour valider ces dernières positions.Finalement, un Framework SIRI a été propose sur la base d’une fusion multi-niveaux combinant nos 3 systèmes : ISE, VINAS et VISEN. Ce Framework fournit une représentation bidimensionnelle de vecteurs descripteurs (haut niveau et bas niveau) pour chaque image
Due to the latest technological advances, the amount of multimedia data is constantly increasing. In this context, the problem is how to effectively use this data? it is necessary to set up tools to facilitate its access and manipulation.To achieve this goal, we first propose an indexation and retrieval model for video shots (or images) by their visual content (ISE). The innovative features of ISE are as follows: (i) definition of a new descriptor "PMC" and (ii) application of the genetic algorithm (GA) to improve the retrieval (PMGA).Then, we focus on the detection of concepts in video shots (LAMIRA approach). In the same context, we propose a semi-automatic annotation method for video shots in order to improve the quality of indexation based on the GA.Then, we provide a semantic indexation method separating the data level from a conceptual level and a more abstract, contextual level. This new system also incorporates mechanisms for expanding the request and relevance feedback. To add more fluidity to the user query, the user can perform a navigation using the three levels of abstraction. Two systems called VISEN and VINAS have been set up to validate these last positions.Finally, a SIRI Framework was proposed on the basis of a multi-level indexation combining our 3 systems: ISE, VINAS and VISEN. This Framework provides a two-dimensional representation of features (high level and low level) for each image
APA, Harvard, Vancouver, ISO, and other styles
34

Fuentes, Fort Maria. "A Flexible Multitask Summarizer for Documents from Different Media, Domain and Language." Doctoral thesis, Universitat Politècnica de Catalunya, 2008. http://hdl.handle.net/10803/6655.

Full text
Abstract:
Automatic Summarization is probably crucial with the increase of document generation. Particularly when retrieving, managing and processing information have become decisive tasks. However, one should not expect perfect systems able to substitute human sumaries. The automatic sumarization process strongly depends not only on the characteristics of the documents, but also on user different needs.Thus, several aspects have to be taken into account when designing an information system for summarizing, because, depending on the characteristics of the input documents and the desired results, several techniques can be aplied. In order to suport this process, the final goal of the thesis is to provide a flexible multitask summarizer architecture. This goal is decomposed in three main research purposes. First, to study the process of porting systems to different summarization tasks, processing documents in different lenguages, domains or media with the aim of designing a generic architecture to permit the easy addition of new tasks by reusing existents tools. Second, the developes prototypes for some tasks involving aspects related with the lenguage, the media and the domain of the document or documents to be summarized as well as aspects related with the summary content: generic, novelly summaries, or summaries that give answer to a specific user need. Third, to create an evaluation framework to analyze the performance of several approaches in written news and scientific oral presentation domains, focusing mainly in its intrinsic evaluation.
El resumen automático probablemente sea crucial en un momento en que la gran cantidad de documentos generados diariamente hace que recuperar, tratar y asimilar la información que contienen se haya convertido en una ardua y a su vez decisiva tarea. A pesar de ello, no podemos esperar que los resúmenes producidos de forma automática vayan a ser capaces de sustituir a los humanos. El proceso de resumen automático no sólo depende de las características propias de los documentos a ser resumidos, sino que es fuertemente dependiente de las necesidades específicas de los usuarios. Por ello, el diseño de un sistema de información para resumen conlleva tener en cuenta varios aspectos. En función de las características de los documentos de entrada y de los resultados deseados es posible aplicar distintas técnicas. Por esta razón surge la necesidad de diseñar una arquitectura flexible que permita la implementación de múltiples tareas de resumen. Este es el objetivo final de la tesis que presento dividido en tres subtemas de investigación. En primer lugar, estudiar el proceso de adaptabilidad de sistemas a diferentes tareas de resumen, como son procesar documentos producidos en diferentes lenguas, dominios y medios (sonido y texto), con la voluntad de diseñar una arquitectura genérica que permita la fácil incorporación de nuevas tareas a través de reutilizar herramientas existentes. En segundo lugar, desarrollar prototipos para distintas tareas, teniendo en cuenta aspectos relacionados con la lengua, el dominio y el medio del documento o conjunto de documentos que requieren ser resumidos, así como aspectos relacionados con el contenido final del resumen: genérico, novedad o resumen que de respuesta a una necesidad especifica. En tercer lugar, crear un marco de evaluación que permita analizar la competencia intrínseca de distintos prototipos al resumir noticias escritas y presentaciones científicas orales.
APA, Harvard, Vancouver, ISO, and other styles
35

Pons, Patrick. "Etude et developpement d'un systeme de generation, interpretation et execution des procedures de traitement integrees aux documents electroniques intelligents, dans le cadre d'une base de donnees multimedia." Paris 6, 1990. http://www.theses.fr/1990PA066656.

Full text
Abstract:
Cette these presente un systeme de classement et de stockage de documents electroniques multimedia. Apres avoir defini la notion de document electronique intelligent, nous passons en revue quelques systemes utilisant ce type de documents. Ensuite, nous exposons les bases d'un modele de document intelligent pour gerer la circulation des documents dans une entreprise. Nous proposons alors un l4g (langage de 4eme generation) pour representer les differents objets du modele. Enfin, nous etudions l'integration d'un systeme de gestion de documents intelligents au sein du produit bureautique multimedia de bull (diderot)
APA, Harvard, Vancouver, ISO, and other styles
36

Rebillard, Franck. "La presse multimedia : Etude de la constitution d'une spécialité médiatique dans la presse écrite à l'heure de sa diversification sur les nouveaux supports électroniques." Lyon 2, 1999. http://theses.univ-lyon2.fr/documents/lyon2/1999/frebillard.

Full text
Abstract:
La médiatisation d'un domaine d'activités sociales par la presse spécialisée est complexe. Elle résulte actuellement d'un rapport d'interdépendance économique entre les acteurs (journalistes/institutions/lecteurs) qui y participent. Il est susceptible d'être ré-agencé avec la diversification de la presse sur cd-rom et internet. La presse multimédia fournit à ce sujet des indications, parce que son thème journalistique est récent, et parce qu'elle s'est fortement étendue sur ces nouveaux supports. De 1994 à 1998, trois configurations ont émerge. La première est marquée par des expérimentations innovantes, tant dans le traitement du thème du multimédia, à partir d'une matrice idéologique d'inspiration cybernétique, que dans les formes inédites de ses versions multimédias. Un aspect original du notamment aux facilites de publication sur le web, et son caractère alors non-marchand. Ces particularités s'estompent ensuite : le mode de médiatisation redevient plus classique. Il repose sur une dichotomie entre les aspects professionnels et divertissants du multimédia, courante dans la presse magazine, et sur une exploitation des extensions électroniques comme compléments pratiques des éditions imprimées. La presse multimédia se stabilisera finalement autour d'un modèle propre, articule entre une description généraliste centrée sur les pratiques de surf et de création de sites web, et des CD-Rom respectivement transformes en interface de navigation et plate-forme pour la création. Les versions électroniques des publications exercent ainsi une intermédiation entre les lecteurs-internautes et les institutions du secteur du multimédia. Cette mise en relation des différents acteurs de l'information, caractéristique de l'activité médiatique contemporaine, est favorisée par l'hypertextualité. Cette spécificité du nouveau dispositif de la presse s'intègre à son mode de médiatisation existant et contribue à l'accentuer légèrement.
APA, Harvard, Vancouver, ISO, and other styles
37

Limame, Mohamed. "Un Modèle généralisé pour le classement de documents multimédia." Grenoble 2 : ANRT, 1988. http://catalogue.bnf.fr/ark:/12148/cb376153269.

Full text
APA, Harvard, Vancouver, ISO, and other styles
38

Fernandez, Jonathan. "Favoriser un apprentissage actif : Effets des tests d’entraînement sur les processus cognitifs et métacognitifs." Thesis, Rennes 2, 2017. http://www.theses.fr/2017REN20047/document.

Full text
Abstract:
Il est aujourd’hui reconnu que la réussite des étudiants à l’université repose sur leurs capacités à autoréguler leur apprentissage, c’est-à-dire à 1) fixer des objectifs adaptés à la tâche, 2) déployer des stratégies d’apprentissage efficaces et 3) vérifier régulièrement si ces objectifs ont été atteints. Or, lorsqu’ils apprennent des documents complexes, ceux-ci ont tendance à traiter passivement l’information et à surestimer la qualité de leur apprentissage. Cette thèse vise à déterminer si le fait d’insérer des tests d’entraînement au sein d’un document multimédia amène les étudiants à traiter plus activement les informations. Pour ce faire, nous avons réalisé quatre expériences au cours desquelles des étudiants recevaient ou non des tests d’entraînement pendant qu’ils apprenaient un cours de neurosciences. Afin d’évaluer les effets des tests sur l’activité cognitive et métacognitive des participants, nous avons combiné un questionnaire d’estimation de l’apprentissage à un protocole de verbalisation. Nos résultats montrent que les participants qui bénéficient de tests estiment plus précisément la qualité de leur apprentissage et obtiennent de meilleures performances que les participants non testés. Par ailleurs, ces meilleures performances s’expliquent par un déploiement de stratégies d’apprentissage plus adaptées à l’exigence de la tâche. Enfin, ces effets bénéfiques disparaissent lorsque l’exigence des tests d’entraînement diffère de celles de l’évaluation finale. L’ensemble de nos résultats permet de mieux comprendre les mécanismes sous-tendant l’effet des tests sur l’apprentissage ainsi que d’identifier les conditions qui favorisent leur efficacité
It is generally accepted that students need to effectively self-regulate their learning to succeed in university, that is to 1) establish appropriate goals, 2) use effective learning strategies and 3) frequently monitor if their goals have been met. Unfortunately, when students learn complex document, they tend to process the information in a passive way and be overconfident regarding the quality of their learning. The purpose of this thesis is to study if inserting regular practice tests in a multimedia document can promote a more active learning. To pursue this thesis’ aim, four experiments were conducted whereby students were exposed to a neuroscience course and were provided with or not, different types of practice tests. We used a judgment of learning questionnaire and a think aloud protocol to assess the impact of practices tests on cognitive and metacognitive processes. Results showed that, compared with control groups, participants in the practice testing groups were significantly less overconfident in their ability to recall recently learned information and performed better on a post-test questionnaire. Furthermore, enhanced learning performance was explained by the use of more efficient learning strategies. However, when test requirement mismatched those of the final test, practice tests brought none of these beneficial effects and was therefore unhelpful for students learning. Overall, the studies’ results gave us a better insight into the psychological mechanism underlying the testing effect on learning and identify the conditions that favor it
APA, Harvard, Vancouver, ISO, and other styles
39

Egyed-Zsigmond, Elod Pinon Jean-Marie Mille Alain. "Gestion des connaissances dans une base de documents multimédias." Villeurbanne : Doc'INSA, 2005. http://docinsa.insa-lyon.fr/these/pont.php?id=egyed_zsigmond.

Full text
APA, Harvard, Vancouver, ISO, and other styles
40

Smith, R. W. "The extraction and recognition of text from multimedia document images." Thesis, University of Bristol, 1987. http://hdl.handle.net/1983/c1de9e88-004f-4ee7-8060-e7cf025e86b6.

Full text
APA, Harvard, Vancouver, ISO, and other styles
41

Emery, James W. "Design and implementation of a time-based multimedia document architecture." Thesis, University of Ottawa (Canada), 1994. http://hdl.handle.net/10393/6710.

Full text
Abstract:
Multimedia documents differ significantly form traditional documents that are composed of text and possibly geometric graphics. The introduction of continuous media such as audio, video, and computer generated graphics (e.g. animation) imposes new requirements on document representation. In contrast with static media (e.g. text and graphics), continuous media are presented according to a specific rate and duration. While traditional documents consists of a sequence of pages that can be read, multimedia documents are viewed as a presentation that changes continuously with time. This presentation is referred to as the playback of the document. An author creates a multimedia document that will be seen and heard by a viewer. The multimedia document creation process includes the creation of a presentation schedule to specify when the multimedia objects contained in a document will be rendered. In this thesis, a time-based multimedia document architecture called MEDIADOC is presented. This architecture contains rules and guidelines for the creation and representation of multimedia documents. It is a time-based model since it provides support for the creation of presentation schedules that will drive the playback of multimedia documents. Our model integrates many of the concepts of document representation including logical structures, layout structures, and presentation schedules. Special multimedia authoring tools and system support, which are required to facilitate the potentially complicated nature of multimedia document creation and manipulation, are also discussed. MEDIADOC was implemented as part of a multimedia authoring system. The discussion of the implementation includes a description of the authoring system, the object-oriented methodology that was used for implementing MEDIADOC, and the creation of a sample multimedia document.
APA, Harvard, Vancouver, ISO, and other styles
42

Watanabe, Yasuhiko. "Integrated Analysis of Image, Diagram, and Text for Multimedia Document Retrieval." 京都大学 (Kyoto University), 2002. http://hdl.handle.net/2433/149384.

Full text
APA, Harvard, Vancouver, ISO, and other styles
43

Jaillot, Vincent. "3D, temporal and documented cities : formalization, visualization and navigation." Thesis, Lyon, 2020. http://www.theses.fr/2020LYSE2026.

Full text
Abstract:
L'étude et la compréhension de l'évolution des villes est un enjeu sociétal important, notamment pour améliorer la qualité de vie dans une ville toujours plus dense. Le numérique et en particulier les modèles 3D de villes peuvent être des éléments de réponse. Leur manipulation est parfois rendue complexe par la prise en compte de leurs dimensions thématique, géométrique et topologique ainsi que de leur structuration hiérarchique
The study and understanding of cities evolution is an important societal issue, particularly for improving the quality of life in an increasingly dense city. Digital technology and in particular 3D city models can be part of the answer. Their manipulation is however sometimes complex due to their thematic, geometric, topological dimensions and hierarchical structure.In this thesis, we focus on the integration of the temporal dimension and in the enrichment with multimedia documents of these 3D models of the city, in an objective of visualization and navigation on the web. Moreover, we take a particular interest in interoperability (based on standards), reusability (with a shared software architecture and open source components) and reproducibility (to make our experiments durable).Our first contribution is a formalization of the temporal dimension of cities for interactive navigation and visualization on the web. For this, we propose a conceptual model of existing standards for the visualization of cities on the web, which we extend with a formalization of the temporal dimension. We also propose a logical model and a technical specification of these proposals.Our second contribution allows the integration of multimedia documents into city models for spatial, temporal and thematic visualization and navigation on the web. We propose a conceptual model for the integration of heterogeneous and multidimensional geospatial data. We then use it for the integration of multimedia documents and 3D city models.Finally, this thesis took place in a multidisciplinary context via the Fab-Pat project of the LabEx IMU, which focuses on cultural heritage sharing and shaping. In this framework, a contribution combining social sciences and computer science has allowed the design of DHAL, a methodology for the comparative analysis of devices for sharing heritage via digital technology. Dans cette thèse, nous nous intéressons à l'intégration de la dimension temporelle et à l'enrichissement avec des documents multimédia de ces modèles 3D de la ville, dans un objectif de visualisation et de navigation sur le web. Nous portons un intérêt particulier à l'intéropérabilité (en s'appuyant sur des standards), à la réutilisabilité (avec une architecture logicielle partagée et des composants open source) et à la reproductibilité (permettant de rendre nos expérimentations pérennes).Notre première contribution est une formalisation de la dimension temporelle des villes pour une navigation et visualisation interactive sur le web. Pour cela, nous proposons un modèle conceptuel des standards existants pour la visualisation de villes sur le web, que nous étendons avec une formalisation de la dimension temporelle. Nous proposons également un modèle logique et une spécification technique de ces propositions.Notre deuxième contribution permet d'intégrer des documents multimédias aux modèles de villes pour une visualisation et une navigation spatiale, temporelle et thématique sur le web. Nous proposons un modèle conceptuel pour l'intégration de données géospatiales hétérogènes et multidimensions. Nous l'utilisons ensuite pour l'intégration de documents multimédias et de modèles 3D de villes.Enfin, cette thèse s'est déroulée dans un contexte pluridisciplinaire via le projet Fab-Pat, du LabEx IMU, qui s'intéresse au partage de la fabrique du patrimoine. Dans ce cadre, une contribution mêlant sciences sociales et informatique a permis de concevoir DHAL, une méthodologie pour l’analyse comparative de dispositifs pour le partage du patrimoine via le numérique
APA, Harvard, Vancouver, ISO, and other styles
44

Pentes, Tatiana. "BlackBOX : painting a digital picture of documented memory." University of Technology, Sydney. Faculty of Humanities and Social Sciences, 2005. http://hdl.handle.net/2100/357.

Full text
Abstract:
This study investigates and records the production of a digital media artwork blackBOX: Painting A Digital Picture of Documented Memory, generated through the media technologies of interactive multimedia, exploiting the creative potentials of digitally produced music, sound, image and text relationships in a disc based and online (Internet) environment. The artwork evolves from an imaginary electronic landscape that can be uniquely explored/ played in a non-sequential manner. The artwork/ ‘game’ is a search for the protagonist Nina’s hybrid cultural identity. This is mirrored in the exploration of random, fragmentary and non-linear experiences designed for the player engaged with the artwork. The subjective intervention of the player/ participant in the electronic artwork is metaphoric of the improvisational tendencies that have evolved in the Greek Blues (Rembetika), Jazz, and Hindustani musical and performative dance forms. The protagonist Nina’s discovery of these musical forms reveal her cultural/ spiritual origins. As a musical composer arranges notes, melodies and harmonies, and sections of instruments, so too, the multimedia producer designs a ensemble of audio-visual fragments to be navigated. Dance also becomes a driving metaphor, analogous to the players movement in and through these passages of image/ sound/ text and as a movement between theories and ideas explored in the content of the program. The central concern is to playfully reverse, obscure, distort the look of the dominating/colonialist gaze, in the production of an interactive ‘game’ and allow the girl to picture herself. One of my objectives is to explore the ways in which social research can be undertaken by the creation of an interactive program in the computer environment utilising interactive digital media technologies. The study reveals that, through the subjective intervention of the (player) user4 with the digital artefact, a unique experience and responsiveness is produced with the open ended text. The work is comprised of a website http://www.strangecities.net; an interactive CD-ROM; a gallery installation; digital photomedia images; and a written thesis documenting and theorising the production. 4 The term user, while widely debated has been in usage from the 1980s to refer to the unique human interaction with the digital artefact, electronic screen work, and computer interface.
APA, Harvard, Vancouver, ISO, and other styles
45

Collet, Christine Adiba Michel. "Les formulaires complexes dans les bases de données multimédia." S.l. : Université Grenoble 1, 2008. http://tel.archives-ouvertes.fr/tel-00325851.

Full text
APA, Harvard, Vancouver, ISO, and other styles
46

Pirazzini, Lorenzo. "Sviluppo di un framework per la gestione di documenti multimediali." Master's thesis, Alma Mater Studiorum - Università di Bologna, 2016.

Abstract:
Questo lavoro di tesi si propone di realizzare un sistema in grado non solo di gestire la similarità tra media di stesso tipo, in modo tale da essere al pari per potenzialità in catalogazione e ricerca dei sistemi esistenti, ma di introdurre anche il concetto di similarità tra documenti, i quali contengono media di diverso tipo. Anche se esistono già DBMS in grado di gestire tipi di media complessi, nessuno ha un modello in grado di gestire la compresenza di più tipi di dato efficientemente. Per realizzare un sistema multimediale che sia in grado di gestire non solo la similarità tra media compatibili per tipo ma in generale la ricerca tra documenti si è deciso di utilizzare sistemi per media specifici già esistenti e di integrarli in modo da farli cooperare. A tale proposito si è deciso inizialmente di creare un sistema in grado di gestire documenti che possano contenere inizialmente parti testuali, immagini, video e serie temporali. E’ chiaro intuire come le differenze tra i singoli sistemi (e tra le singole tipologie di dati) rendano quasi impossibile il confronto tra media di tipo diverso esaminandone solamente il contenuto. Per questo un sistema multimediale come quello proposto non potrà effettuare ricerca per contenuto tra media differenti (a parte tra immagini e video in cui può essere possibile confrontare l’immagine con gli screenshot che compongono un video) ma si baserà principalmente sul confronto semantico tra media di tipo diverso e lo combinerà invece con ricerche per metadati e contenuto tra media dello stesso tipo. In questa tesi verranno analizzate le tecnologie utilizzate, le modifiche apportate ai framework esistenti e le novità introdotte per realizzare il sistema generale e in seguito verrà proposta la realizzazione due applicazioni su casi reali per dimostrare l’efficacia di tale sistema.
APA, Harvard, Vancouver, ISO, and other styles
47

Gross, Pierre Henri. "A document architecture and conferencing system for a network of multimedia medical workstations." Thesis, University of Ottawa (Canada), 1989. http://hdl.handle.net/10393/5951.

Full text
APA, Harvard, Vancouver, ISO, and other styles
48

Harb, Hadi Chen Liming. "Classification du signal sonore en vue d'une indexation par le contenu des documents multimédia." [S.l.] : [s.n.], 2003. http://bibli.ec-lyon.fr/exl-doc/hharb.pdf.

Full text
APA, Harvard, Vancouver, ISO, and other styles
49

Gelin, Philippe. "Détection de mots clés dans un flux de parole : application à l'indexation de documents multimédia /." [S.l.] : [s.n.], 1997. http://library.epfl.ch/theses/?nr=1658.

Full text
APA, Harvard, Vancouver, ISO, and other styles
50

Klaghstan, Merza. "Multimedia data dissemination in opportunistic systems." Thesis, Lyon, 2016. http://www.theses.fr/2016LYSEI125/document.

Full text
Abstract:
Les réseaux opportunistes sont des réseaux mobiles qui se forment spontanément et de manière dynamique grâce à un ensemble d'utilisateurs itinérants dont le nombre et le déplacement ne sont pas prévisibles. En conséquence, la topologie et la densité de tels réseaux évoluent sans cesse. La diffusion de bout-en-bout d'informations, dans ce contexte, est incertaine du fait de la forte instabilité des liens réseaux point à point entre les utilisateurs. Les travaux qui en ont envisagé l'usage visent pour la plupart des applications impliquant l'envoi de message de petite taille. Cependant, la transmission de données volumineuses telles que les vidéos représente une alternative très pertinente aux réseaux d'infrastructure, en cas d'absence de réseau, de coût important ou pour éviter la censure d'un contenu. La diffusion des informations de grande taille en général et de vidéos en particulier dans des réseaux oppnets constitue un challenge important. En effet, permettre, dans un contexte réseau très incertain et instable, au destinataire d’une vidéo de prendre connaissance au plus vite du contenu de celle-ci, avec la meilleure qualité de lecture possible et en encombrant le moins possible le réseau reste un problème encore très largement ouvert. Dans cette thèse, nous proposons un nouveau mécanisme de diffusion de vidéos dans un réseau opportuniste de faible densité, visant à améliorer le temps d'acheminement de la vidéo tout en réduisant le délai de lecture à destination. La solution proposée se base sur le choix d'encoder la vidéo en utilisant l'encodage SVC, grâce auquel la vidéo se décline en un ensemble de couches interdépendantes (layers), chacune améliorant la précédente soit en terme de résolution, soit en terme de densité, soit en terme de perception visuelle. Notre solution se décline en trois contributions. La première consiste à proposer une adaptation du mécanisme de diffusion Spray-and-Wait, avec comme unités de diffusion, les couches produites par SVC. Les couches sont ainsi diffusées avec un niveau de redondance propre à chacune, adapté à leur degré d'importance dans la diffusion de la vidéo. Notre seconde contribution consiste à améliorer le mécanisme précédent en prenant en compte une granularité plus fine et adaptative en fonction de l'évolution de la topologie du réseau. Cette amélioration a la particularité de ne pas engendrer de coût de partitionnement, les couches vidéos dans l'encodage SVC étant naturellement déclinées en petites unités (NALU) à base desquelles l'unité de transfert sera calculée. Enfin, la troisième contribution de cette thèse consiste à proposer un mécanisme hybride de complétion des couches vidéos arrivées incomplètes à destination. Cette méthode se caractérise par le fait d'être initiée par le destinataire. Elle combine un protocole de demande des parties manquantes aux usagers proches dans le réseau et des techniques de complétion de vidéo à base d’opérations sur les frames constituant la vidéo
Opportunistic networks are human-centric mobile ad-hoc networks, in which neither the topology nor the participating nodes are known in advance. Routing is dynamically planned following the store-carry-and-forward paradigm, which takes advantage of people mobility. This widens the range of communication and supports indirect end-to-end data delivery. But due to individuals’ mobility, OppNets are characterized by frequent communication disruptions and uncertain data delivery. Hence, these networks are mostly used for exchanging small messages like disaster alarms or traffic notifications. Other scenarios that require the exchange of larger data are still challenging due to the characteristics of this kind of networks. However, there are still multimedia sharing scenarios where a user might need switching to an ad-hoc alternative. Examples are the cases of 1) absence of infrastructural networks in far rural areas, 2) high costs due limited data volumes or 3) undesirable censorship by third parties while exchanging sensitive content. Consequently, we target in this thesis a video dissemination scheme in OppNets. For the video delivery problem in the sparse opportunistic networks, we propose a solution that encloses three contributions. The first one is given by granulating the videos at the source node into smaller parts, and associating them with unequal redundancy degrees. This is technically based on using the Scalable Video Coding (SVC), which encodes a video into several layers of unequal importance for viewing the content at different quality levels. Layers are routed using the Spray-and-Wait routing protocol, with different redundancy factors for the different layers depending on their importance degree. In this context as well, a video viewing QoE metric is proposed, which takes the values of the perceived video quality, delivery delay and network overhead into consideration, and on a scalable basis. Second, we take advantage of the small units of the Network Abstraction Layer (NAL), which compose SVC layers. NAL units are packetized together under specific size constraints to optimize granularity. Packets sizes are tuned in an adaptive way, with regard to the dynamic network conditions. Each node is enabled to record a history of environmental information regarding the contacts and forwarding opportunities, and use this history to predict future opportunities and optimize the sizes accordingly. Lastly, the receiver node is pushed into action by reacting to missing data parts in a composite backward loss concealment mechanism. So, the receiver asks first for the missing data from other nodes in the network in the form of request-response. Then, since the transmission is concerned with video content, video frame loss error concealment techniques are also exploited at the receiver side. Consequently, we propose to combine the two techniques in the loss concealment mechanism, which is enabled then to react to missing data parts
APA, Harvard, Vancouver, ISO, and other styles
We offer discounts on all premium plans for authors whose works are included in thematic literature selections. Contact us to get a unique promo code!

To the bibliography