Dissertations / Theses on the topic 'Reconocimiento visual de palabras'
Create a spot-on reference in APA, MLA, Chicago, Harvard, and other styles
Consult the top 32 dissertations / theses for your research on the topic 'Reconocimiento visual de palabras.'
Next to every source in the list of references, there is an 'Add to bibliography' button. Press on it, and we will generate automatically the bibliographic reference to the chosen work in the citation style you need: APA, MLA, Harvard, Chicago, Vancouver, etc.
You can also download the full text of the academic publication as pdf and read online its abstract whenever available in the metadata.
Browse dissertations / theses on a wide variety of disciplines and organise your bibliography correctly.
Orihuela, Kuri Karla Beatriz. "Visual word recognition of morphological complex words and multilingualism." Thesis, Toulouse 2, 2019. http://www.theses.fr/2019TOU20034.
Full textThis PhD thesis describes the processes involved during reading from a psycho-linguistic perspective, in particular, the role of morphology in the early stages of visual word recognition. It also seeks to better understand the differences and similarities between Monolingual and Multilingual mental lexical representation. To this end a series of experimental studies were designed. The so called ”pseudo-morphology” effect was tested in the first sections (exploring affixation and directionality), with the aim to explore how the structure of the word and saliency (for example, internal characteristics and frequency) play a role in lexical access. The section dedicated to multilingualism tests effect in first and second language and the cognate facilitation effect across languages (English, Spanish and French). The results obtained go in line with the recent supra-lexical model (Giraudo & Dal Maso, 2018) which postulates that construction morphology (Booij, 2010) is the main principle of organization of the mental lexicon
La presente tesis doctoral describe los procesos involucrados durante la lectura desde una perspectiva psico-lingüística, en particular, el papel de la morfología en las primeras etapas del reconocimiento visual de palabras. También busca comprender mejor las diferencias y similitudes entre la representación léxica mental monolingüe y multilingüe. Para ello se diseñaron una serie de estudios experimentales. El supuesto efecto "pseudo-morfológico" se pexploró de forma experimental, con el objetivo de comprender cómo la estructura de la palabra y la sus características (por ejemplo, frecuencia) desempeñan un papel en el acceso léxico. Incluye de igual manera una sección dedicada a experimentos con participantes multilingües en la cual se explora el afecta el efecto de facilitación de reconocimiento de cognados (en inglés, español y francés). Los resultados obtenidos concuerdan con el reciente modelo supra-léxico (Giraudo & Dal Maso, 2018)
González, Galleguillos Diego Mauricio. "Estrategias de reconocimiento visual en la percepción del movimiento biológico : exploración visual libre o fijación visual forzada." Tesis, Universidad de Chile, 2018. http://repositorio.uchile.cl/handle/2250/151367.
Full textUno de los movimientos complejos con importancia evolutiva en humanos es el movimiento biológico, definido como un conjunto de puntos de alto contraste que siguen un patrón coherente de movimiento y que involucra un nivel de procesamiento complejo que integra la velocidad, la forma de los objetos en movimiento, interpretando acciones, estímulos sociales y emociones. Se proponen tres hipótesis para entender qué estrategias visuales permiten la percepción del movimiento biológico. Por una parte, a través de un seguimiento ocular continuo que explora el movimiento biológico (“por partes”), por otra, a través de un foco de atención local discontinuo que extrapola la percepción del movimiento biológico sin explorarlo (“un todo”) y una última que integra ambas hipótesis. Estas hipótesis plantean vías de procesamiento en dos fases: la primera de movimientos locales que se integran en regiones corticales sensoriales de fragmentos del cuerpo. Y la segunda, de fragmentos que generan representaciones completas en la corteza multimodal. Existe actualmente una discusión abierta acerca de cuál de estas estrategias es prioritaria para la percepción del movimiento biológico. Para ello se determinó qué estrategias de reconocimiento visual son usadas preferentemente para la percepción del MB observando si existen diferencias en el desempeño conductual de la percepción visual del MB, durante la exploración libre comparada con la fijación forzada de un objetivo mediante el uso de un sistema de seguimiento ocular (“eye tracker”). Según hallazgos de este estudio se puede afirmar que en la muestra evaluada para un mejor desempeño de la percepción del movimiento biológico es necesario el uso de estrategias de exploración visual libre, y esta conducta ocular obedece a lugares estratégicos del movimiento biológico según la valencia de este. Estudios futuros de este paradigma podrían incluir registro de actividad de señales corticales como el uso de EEG, tanto en sujetos sanos como en personas con patologías que afecten la percepción de esta tarea, como en pacientes con esquizofrenia.
One of the complex movements with evolutionary importance in humans is the biological movement, defined as a set of high-contrast points that follow a coherent pattern of motion and involve a complex processing level that integrates speed the form of moving objects, interpreting actions, social stimuli and emotions. Three hypotheses are proposed to understand visual strategies allow the perception of biological movement. On the one hand, through follow-up continuous ocular that explores the biological movement ("by parts"). On the other, to through a discontinuous local focus of attention that extrapolates the perception of biological movement without exploring it ("a whole"). And a last one that integrates both hypothesis these hypotheses are ways of processing in two phases: The first of local movements which are integrated into sensory cortical regions of fragments of the body. The second of fragments generate by complete representations in multimodal crust. There is currently an open discussion about which of these strategies is a priority for the perception of biological movement. For this, it was determined which visual recognition strategies are used preferentially for MB perception by observing if there are differences in behavioral performance of MB visual perception. During the scan-free compared with forced fixation of a target by using an ocular tracking system (eye tracker). According to findings of this study it can be said that use sample evaluated for a better performance of the perception of biological movement It is necessary to use free visual scanning strategies, and this ocular behavior is due to strategic location of biological movement according to the valence of this. Future studies of this paradigm could include recording activity of cortical signals such as the use of EEG, Both in healthy subject as in people with pathologies that affect the perception of this task as in patients with schizophrenia.
Simón, Bendezú Giovani Said. "Filtro adaptivo LMS y su aplicación en el reconocimiento de palabras aisladas para el control de un equipo de sonido por medio de la voz." Bachelor's thesis, Pontificia Universidad Católica del Perú, 2004. http://tesis.pucp.edu.pe/repositorio/handle/123456789/280.
Full textTesis
Padilla, López José Ramón. "Protección de la Privacidad Visual basada en el Reconocimiento del Contexto." Doctoral thesis, Universidad de Alicante, 2015. http://hdl.handle.net/10045/52056.
Full textRedolfi, Javier A. "Aplicación en agricultura de precisión de esquemas actuales de reconocimiento visual." Doctoral thesis, Universidad Nacional de Córdoba Facultad de Ciencias Exactas, Físicas y Naturales, 2018. http://hdl.handle.net/11086/6564.
Full textEn esta tesis se aplican modelos de clasificación de imágenes como son vectores de Fisher y redes neuronales convolucionales a problemas de agricultura de precisión, como la clasificación de especies de plantas, variedades de semillas y uso de suelo a través de imágenes PolSAR. Con la inclusión de tales modelos se logra otorgar un mayor nivel de robustez y escalabilidad a los sistemas lo cual se traduce en un aumento en la exactitud de la solución de estos problemas.
Guerrero, Ocaña Celly Elpidia, and Leon Yany Victoria Neyra. "Dificultades específicas en el aprendizaje de la lectura a nivel de reconocimiento de palabras. Estudio de caso de un niño de 9 años." Bachelor's thesis, Pontificia Universidad Católica del Perú, 2018. http://hdl.handle.net/20.500.12404/14351.
Full textTesis de segunda especialidad
Soto, Barra Claudia Naiomi. "Reconocimiento rápido de objetos usando objects proposals y deep learning." Tesis, Universidad de Chile, 2017. http://repositorio.uchile.cl/handle/2250/150337.
Full textEl reconocimiento (o detección) de objetos es un área activa y en continua mejora de la visión computacional. Recientemente se han introducido distintas estrategias para mejorar el desempeño y disminuir los costos y el tiempo de detección. Entre estas, se encuentran la generación de Object Proposals (regiones en la imágen donde hay alta probabilidad de encontrar un objeto) para acelerar la etapa de localización, como respuesta al paradigma de ventana deslizante; el cada vez más popular uso de redes Deep Learning y, en particular, para la clasi cación y detección de imágenes, las redes convolucionales (CNN). Si bien existen diversos trabajos que utilizan ambas técnicas, todos ellos se centran en tener una buena performance en conocidas bases de datos y competencias en lugar de estudiar su comportamiento en problemas reales y el efecto que tiene la modi cación de arquitecturas de redes convencionales y la elección adecuada de un sistema de generación de proposals. En este trabajo de título, entonces, se tiene como objetivo principal el caracterizar métodos de generación de proposals para su uso en el reconocimiento de objetos con redes CNN, comparando el desempeño tanto de los proposals generados como del sistema completo en bases de datos fabricadas manualmente. Para estudiar el sistema completo, se comparan dos estructuras conocidas, llamadas R-CNN y Fast R-CNN, que utilizan de distintas formas ambas técnicas (generación de proposals y detección) y donde se considera en el estado del arte mejor Fast R-CNN. Se propone en este trabajo que esta hipótesis no es del todo cierta en el caso de que se trabaje con un número su cientemente bajo de proposals (donde las bases de datos acá construidas se enfocan en precisamente asegurar una cantidad baja de objetos de tamaños similares presentes en cada una: objetos sobre super cies y objetos de una sala de estar) y se acelere el proceso de clasi cación alterando el tamaño de entrada de la red convolucional utilizada. Se eligieron tres métodos de generación de Proposals de la literatura a partir de su desempe ño reportado, y fueron comparados en distintos escenarios sus tiempos de procesamiento, calidad de proposals generados (mediante análisis visual y numérico) en función del número generados de estos. El método llamado BING presenta una ventaja sustancial en términos del tiempo de procesamiento y tiene un desempeño competitivo medido con el recall (fracción de los objetos del ground truth correctamente detectados) para las aplicaciones escogidas. Para implementar R-CNN se entrenan dos redes del tipo SqueezeNet pero con entradas reducidas y seleccionando los 50 mejores proposals generados por BING se encuentra que para una red de entrada 64x64 se alcanza casi el mismo recall (~ 40%) que se obtiene con el Fast R-CNN original y con una mejor precisión, aunque es 5 veces más lento (0.75s versus 0.14s). El sistema R-CNN implementado en este trabajo, entonces, no sólo acelera entre 10 y 20 veces la etapa de generación de proposals en comparación a su implementación original, si no que el efecto de reducir la entrada de la red utilizada logra disminuir el tiempo de detección a uno que es sólo 5 veces más lento que Fast R-CNN cuando antes era hasta 100 veces más lento y con un desempeño equivalente.
Mate, Castellà Judit. "El efecto de similitud en la memoria de trabajo visual mediante tareas de reconocimiento." Doctoral thesis, Universitat Autònoma de Barcelona, 2010. http://hdl.handle.net/10803/4779.
Full textEnríquez, Vásquez Raúl Antonio. "Sistema Móvil de Recuperación de Información Visual Utilizando Formas y Colores para el Reconocimiento de Obras Arquitectónicas." Thesis, Universidad de las Américas Puebla, 2013. http://catarina.udlap.mx/u_dl_a/tales/documentos/lst/enriquez_v_ra/.
Full textFigueroa, Flores Carola. "Visual Saliency for Object Recognition, and Object Recognition for Visual Saliency." Doctoral thesis, Universitat Autònoma de Barcelona, 2021. http://hdl.handle.net/10803/671964.
Full textEl reconocimiento de objetos para los seres humanos es un proceso instantáneo, preciso y extremadamente adaptable. Además, tenemos la capacidad innata de aprender nuevas categorias de objetos a partir de unos pocos ejemplos. El cerebro humano reduce la complejidad de los datos entrantes filtrando parte de la información y procesando las cosas que captan nuestra atención. Esto, combinado con nuestra predisposición biológica a responder a determinadas formas o colores, nos permite reconocer en una simple mirada las regiones más importantes o destacadas de una imagen. Este mecanismo se puede observar analizando en qué partes de las imágenes los sujetos ponen su atención; por ejemplo donde fijan sus ojos cuando se les muestra una imagen. La forma más precisa de registrar este comportamiento es rastrear los movimientos de los ojos mientras se muestran imágenes. La estimación computacional del ‘saliency’, tiene como objetivo diseñar algoritmos que, dada una imagen de entrada, estimen mapas de ‘saliency’. Estos mapas se pueden utilizar en una variada gama de aplicaciones, incluida la detección de objetos, la compresión de imágenes y videos y el seguimiento visual. La mayoría de la investigación en este campo se ha centrado en estimar automáticamente estos mapas de ‘saliency’, dada una imagen de entrada. En cambio, en esta tesis, nos propusimos incorporar la estimación de ‘saliency’ en un procedimiento de reconocimiento de objeto, puesto que, queremos investigar si los mapas de ‘saliency’ pueden mejorar los resultados de la tarea de reconocimiento de objetos. En esta tesis, identificamos varios problemas relacionados con la estimación del ‘saliency’ visual. Primero, pudimos determinar en qué medida se puede aprovechar la estimación del ‘saliency’ para mejorar el entrenamiento de un modelo de reconocimiento de objetos cuando se cuenta con escasos datos de entrenamiento. Para resolver este problema, diseñamos una red de clasificación de imágenes que incorpora información de ‘saliency’ como entrada. Esta red procesa el mapa de ‘saliency’ a través de una rama de red dedicada y utiliza las características resultantes para modular las características visuales estándar ascendentes de la entrada de la imagen original. Nos referiremos a esta técnica como clasificación de imágenes moduladas por prominencia (SMIC en inglés). En numerosos experimentos realizando sobre en conjuntos de datos de referencia estándar para el reconocimiento de objetos ‘fine-grained’, mostramos que nuestra arquitectura propuesta puede mejorar significativamente el rendimiento, especialmente en conjuntos de datos con datos con escasos datos de entrenamiento. Luego, abordamos el principal inconveniente del problema anterior: es decir, SMIC requiere explícitamente un algoritmo de ‘saliency’, el cual debe entrenarse en un conjunto de datos de ‘saliency’. Para resolver esto, implementamos un mecanismo de alucinación que nos permite incorporar la rama de estimación de ‘saliency’ en una arquitectura de red neuronal entrenada de extremo a extremo que solo necesita la imagen RGB como entrada. Un efecto secundario de esta arquitectura es la estimación de mapas de ‘saliency’. En varios experimentos, demostramos que esta arquitectura puede obtener resultados similares en el reconocimiento de objetos como SMIC pero sin el requisito de mapas de ‘saliency’ para entrenar el sistema. Finalmente, evaluamos la precisión de los mapas de ‘saliency’ que ocurren como efecto secundario del reconocimiento de objetos. Para ello, utilizamos un de conjuntos de datos de referencia para la evaluación de la prominencia basada en experimentos de seguimiento ocular. Sorprendentemente, los mapas de ‘saliency’ estimados son muy similares a los mapas que se calculan a partir de experimentos de seguimiento ocular humano. Nuestros resultados muestran que estos mapas de ‘saliency’ pueden obtener resultados competitivos en mapas de ‘saliency’ de referencia.
For humans, the recognition of objects is an almost instantaneous, precise and extremely adaptable process. Furthermore, we have the innate capability to learn new object classes from only few examples. The human brain lowers the complexity of the incoming data by filtering out part of the information and only processing those things that capture our attention. This, mixed with our biological predisposition to respond to certain shapes or colors, allows us to recognize in a simple glance the most important or salient regions from an image. This mechanism can be observed by analyzing on which parts of images subjects place attention; where they fix their eyes when an image is shown to them. The most accurate way to record this behavior is to track eye movements while displaying images. Computational saliency estimation aims to identify to what extent regions or objects stand out with respect to their surroundings to human observers. Saliency maps can be used in a wide range of applications including object detection, image and video compression, and visual tracking. The majority of research in the field has focused on automatically estimating saliency maps given an input image. Instead, in this thesis, we set out to incorporate saliency maps in an object recognition pipeline: we want to investigate whether saliency maps can improve object recognition results. In this thesis, we identify several problems related to visual saliency estimation. First, to what extent the estimation of saliency can be exploited to improve the training of an object recognition model when scarce training data is available. To solve this problem, we design an image classification network that incorporates saliency information as input. This network processes the saliency map through a dedicated network branch and uses the resulting characteristics to modulate the standard bottom-up visual characteristics of the original image input. We will refer to this technique as saliency-modulated image classification (SMIC). In extensive experiments on standard benchmark datasets for fine-grained object recognition, we show that our proposed architecture can significantly improve performance, especially on dataset with scarce training data. Next, we address the main drawback of the above pipeline: SMIC requires an explicit saliency algorithm that must be trained on a saliency dataset. To solve this, we implement a hallucination mechanism that allows us to incorporate the saliency estimation branch in an end-to-end trained neural network architecture that only needs the RGB image as an input. A side-effect of this architecture is the estimation of saliency maps. In experiments, we show that this architecture can obtain similar results on object recognition as SMIC but without the requirement of ground truth saliency maps to train the system. Finally, we evaluated the accuracy of the saliency maps that occur as a side-effect of object recognition. For this purpose, we use a set of benchmark datasets for saliency evaluation based on eye-tracking experiments. Surprisingly, the estimated saliency maps are very similar to the maps that are computed from human eye-tracking experiments. Our results show that these saliency maps can obtain competitive results on benchmark saliency maps. On one synthetic saliency dataset this method even obtains the state-of-the-art without the need of ever having seen an actual saliency image for training.
Universitat Autònoma de Barcelona. Programa de Doctorat en Informàtica
Ghosh, Suman Kumar. "Word spotting and recognition in images from heterogeneous sources." Doctoral thesis, Universitat Autònoma de Barcelona, 2018. http://hdl.handle.net/10803/665691.
Full textEl texto es la forma más común de compartir información desde edades. Con el reciente desarrollo de bases de datos de imágenes de manuscritos históricos manuscritos, la demanda de algoritmos para hacer accesibles estas bases de datos para la navegación y la indexación están en aumento. El aumento exponencial de las bases de datos de imágenes disponibles al público y las colecciones personales de imágenes, este interés ahora también abarca la comprensión de texto en imágenes naturales. La habilitación de la búsqueda o la comprensión de una gran colección de manuscritos o bases de datos de imágenes necesita un método rápido y sólido. Los investigadores han encontrado diferentes maneras de representar la palabra recortada para la comprensi ón y la coincidencia, que funciona bien cuando las palabras ya están segmentadas. Sin embargo, no hay una forma trivial de ampliar estos para documentos no segmentados. En esta tesis, exploramos diferentes métodos para la recuperación y el reconocimiento de texto a partir de documentos no segmentados e imégenes de escena. Existen dos formas diferentes de representación en la literatura, una usa una representaci ón de longitud fija aprendida de palabras recortadas y otra una secuencia de características de longitud variable. A lo largo de esta tesis, hemos estudiado estas dos representaciones por su idoneidad en la segmentación, la comprensión libre del texto. En la primera parte, nos centramos en la detección de palabras sin segmentación utilizando una representación de longitud fija. Extendimos el uso de una representación exitosa para la recuperación libre de segmentación. En la segunda parte de la tesis, exploramos las características basadas en secuencia y finalmente proponemos una soluci´on unificada donde el mismo marco puede generar ambos tipos de representaciones.
Text is the most common way of information sharing from ages. With recent development of images databases of handwritten historic manuscripts the demand for algorithms to make these databases accessible for browsing and indexing are in rise. Exponential increase of publicly available image databases and personal collections of pictures, this interest now also embraces text understanding on natural images. Enabling search or understanding large collection of manuscripts or image databases need fast and robust method. Researchers have found different ways to represent cropped word for understanding and matching, which works well in when words are already segmented. However there is no trivial way to extend these for non-segmented documents. In this thesis we explore different methods for text retrieval and recognition from unsegmented document and scene images. Two different ways of representation exists in literature, one uses a fixed length representation learned from cropped words and another a sequence of features of variable length. Throughout this thesis, we have studied both these representation for their suitability in segmentation free understanding of text. In the first part we are focused on segmentation free word spotting using a fixed length representation. We extended the use of one successful representation for segmentation free retrieval. In the second part of the thesis, we explore sequence based features and finally propose a unified solution where same framework can generate both kind of representations.
Mateo, Agulló Carlos. "Reconocimiento geométrico de objetos 3D y detección de deformaciones en manipulación robótica." Doctoral thesis, Universidad de Alicante, 2017. http://hdl.handle.net/10045/72265.
Full textAguilar, Ramírez Ximena. "Programa de comunicación audiovisual con fines educativos, basado en un sistema de reconocimiento para el Parque Zoológico Buin Zoo." Tesis, Universidad de Chile, 2004. http://repositorio.uchile.cl/handle/2250/100556.
Full textKosti, Ronak. "Visual scene context in emotion perception." Doctoral thesis, Universitat Oberta de Catalunya, 2019. http://hdl.handle.net/10803/667808.
Full textLos estudios psicológicos muestran que el contexto de la escena, además de la expresión facial y la pose corporal, aporta información importante a nuestra percepción de las emociones de las personas. Sin embargo, el procesamiento del contexto para el reconocimiento automático de emociones no se ha explorado en profundidad, en parte debido a la falta de datos adecuados. En esta tesis presentamos EMOTIC, un conjunto de datos de imágenes de personas en situaciones naturales y diferentes anotadas con su aparente emoción. La base de datos EMOTIC combina dos tipos diferentes de representación de emociones: (1) un conjunto de 26 categorías de emociones y (2) las dimensiones continuas de valencia, excitación y dominación. También presentamos un análisis estadístico y algorítmico detallado del conjunto de datos junto con el análisis de concordancia de los anotadores. Los modelos CNN están entrenados en EMOTIC, combinando características de la persona con características de escena (contexto). Nuestros resultados muestran cómo el contexto de la escena aporta información importante para reconocer automáticamente los estados emocionales, lo cual motiva más investigaciones en esta dirección.
Psychological studies show that the context of a setting, in addition to facial expression and body language, lends important information that conditions our perception of people's emotions. However, context's processing in the case of automatic emotion recognition has not been explored in depth, partly due to the lack of sufficient data. In this thesis we present EMOTIC, a dataset of images of people in various natural scenarios annotated with their apparent emotion. The EMOTIC database combines two different types of emotion representation: (1) a set of 26 emotion categories, and (2) the continuous dimensions of valence, arousal and dominance. We also present a detailed statistical and algorithmic analysis of the dataset along with the annotators' agreement analysis. CNN models are trained using EMOTIC, combining a person's features with those of the setting (context). Our results not only show how the context of a setting contributes important information for automatically recognizing emotional states but also promote further research in this direction.
Pequeño, Bueno Andrea. "Palabras, imágenes, cosas: sentidos de pertenencia y vínculos transnacionales en inmigrados/as chilenos/as en Barcelona, España, a partir de la cultura material visual." Doctoral thesis, Universitat Autònoma de Barcelona, 2017. http://hdl.handle.net/10803/457428.
Full textMy doctoral research explores identity formation processes and transnational family experiences among Chilean immigrants living in mixed (binational) unions in Barcelona, Spain. In this effort, I pay attention to material culture, with a focus on photography. I analyze immigrants’ displacement trajectories and the conformation of family life and romantic partnerships, as well as ties with the country, culture and nucleus of origin. In sum, I look at the relationships and continuous adjustments that such processes entail and the different identities that come into play (gender, country of origin, socio-professional status, among others). I do this by focusing on the role of objects and images in such life experiences. In tandem, I analyze how these processes are affected by the migrant’s partner (place of origin and characteristics). This research project is ethnographic and qualitative in nature. My fieldwork (undertaken between 2012 and 2015 in the Province of Barcelona, Autonomous Community of Cataluña) is based on participant observation and in-depth interviews. During interviews, I included guided tours of domestic spaces (Hometour) and a shared visualization and discussion of family photos. In some cases, interviewees constructed- through objects and images- narratives about their migration process and couple life. My informants are people who were born in Chile, lived there until they reached the legal age of majority (18 years), and now reside in Barcelona in heterosexual binational unions. They exhibit diverse migratory profiles and motivations (economic, studies and love) as well as varied sociodemographic characteristics. I also included, as a counterpoint, an informant in an endogamic union (Chile/Chile). I included this informant to explore the relative influence of partner’s place of origin on the construction of a sense of belonging and transnational ties. His migratory trajectory (political exile) has contributed to the analytical richness of this study. The biographic particularities and varied sociodemographic characteristics of my interviewees (in terms of gender, age, socio-professional status, time residing in Barcelona, among others) further enrich this study. The methodology I deployed and the analysis of data itself contribute to the understanding of visual and material culture’s social and personal meanings in the experiences of immigrants and in their transnational ties. This research also delves on the ways immigrants represent themselves and the narratives they produce, allowing for a reconstruction of biographic trajectories and family relations, among other aspects. Even though there is a wealth of research on migration and material culture, up until recently few studies approached these two aspects together and the links between them. In this sense, my dissertation is a contribution. This contribution is accentuated by the fact that the Chilean population who has migrated to Cataluña and Spain, receives very scant attention among academic circles, even more so when it comes to considering binational couples. Finally, I would like to add that my doctoral studies were supported by Chile’s government program: Programa Formación de Capital Humano Avanzado, launched by the Comisión Nacional de Investigación Científica y Tecnológica (CONICYT).
Silva, Leal Juan Sebastián. "Optimización de proceso de detección de partículas a partir de imágenes de video mediante paralelización." Tesis, Universidad de Chile, 2012. http://www.repositorio.uchile.cl/handle/2250/111362.
Full textLa detección de objetos a partir de imágenes se ha convertido en una herramienta muy poderosa para diferentes disciplinas. El Laboratorio de Materia Fuera del Equilibrio del Departamento de Física de la Facultad cuenta con una implementación en C del Método χ^2 usando bibliotecas ad-hoc compatibles con Mac OSX para detectar partículas en sistemas granulares cuasi-bidimensionales compuestos por miles de partículas de acero de 1 mm de diámetro, pudiendo detectar partículas en una imagen de 1 MegaPixel en alrededor de 10 segundos. Sin embargo, estas imágenes provienen de videos que se desean analizar y en una sesión de trabajo se puede requerir analizar alrededor de unas 100.000 imágenes en total, por lo cual el procesamiento y posterior análisis de estas imágenes de video tiene una duración de varios días. Es por esto que fue necesario agilizar de alguna manera este procesamiento de imágenes y generar una solución robusta. El objetivo principal de la memoria consistió en reducir los tiempos de detección de partículas generando un nuevo software basado en el anterior, facilitando extensiones futuras, y utilizando el máximo poder de cómputo disponible en el laboratorio. El alumno ideó como solución un sistema distribuido haciendo uso de todos los computadores disponibles para el procesamiento de imágenes, reimplementando el código del software, en ese entonces utilizado, de C a C++ utilizando patrones de diseño para facilitar futuras extensiones del software y threads con el fin de aumentar el rendimiento de este. También se agregó tecnología CUDA para el procesamiento de datos reduciendo de forma considerable los tiempos de ejecución. Como resultado final de la memoria, se logró obtener un speedup de alrededor de 5x haciendo uso de distribución de carga computacional, uso de procesos en paralelo, hilos de ejecución y tecnología CUDA, además se logró una solución más robusta y extensible para futuros cambios o generación de nuevos algoritmos de procesamiento. Todo el proceso de investigación, desde la obtención de datos hasta la validación de la hipótesis, lleva mucho tiempo, en donde la detección de partículas es solo una parte de todo el calculo computacional que se debe realizar, por lo que se aconseja implementar en lenguajes no interpretados y más rápidos, como por ejemplo C++, otras etapas de cálculo de datos y además, en lo posible, distribuir el computo y usar CUDA.
Pérez, Lucero Paloma. "Edición de un medio de comunicación visual, para Guia de reconocimiento, identificación y valoración del Patrimonio Cultural-Histórico del casco de Santiago Centro, orientado al turismo cultural." Tesis, Universidad de Chile, 2004. http://repositorio.uchile.cl/handle/2250/100551.
Full textHaro, Rodríguez Juan. "Semantic ambiguity: The role of number of meanings and relatedness of meanings in word processing." Doctoral thesis, Universitat Rovira i Virgili, 2018. http://hdl.handle.net/10803/586087.
Full textArenas, Sepúlveda Matías Esteban. "Detección y Seguimiento de Robots Articulados Mediante Análisis Computacional de Imágenes." Tesis, Universidad de Chile, 2009. http://repositorio.uchile.cl/handle/2250/102172.
Full textLuvizotto, André Luiz. "The Encoding and decoding of complex visual stimuli : a neural model to optimize and read out a temporal population code." Doctoral thesis, Universitat Pompeu Fabra, 2012. http://hdl.handle.net/10803/94143.
Full textEl sistema visual dels mamífers té una remarcable capacitat per processar informació en intervals de temps de mili-segons sota condicions molt variables i adquirir representacions invariants d'aquesta informació. Recentment un model del còrtex primari visual explota les característiques d'alta connectivitat excitatriu local del neocortex per modelar aquestes capacitats. El model integra ràpidament l'activitat repartida espaialment de les neurones i genera codificacions invariants que s'anomenen Temporal Population Codes (TPC). Aquí investiguem una qüestió que ha persistit des de la introducció del TPC: estudiar un procés biològicament possible capaç de fer la lectura d'aquestes codificacions. Nosaltres proposem un nou circuit neuronal de lectura basat en la Wavelet Transform que decodifica la senyal TPC en diferents intervals de freqüència. Monstrem que, comparat amb lectures purament lineals utilitzades previament, el sistema proposat proporciona una representació robusta, ràpida i compacta de l'entrada visual. També presentem una generalització d'aquest paradigma de codificació-decodificació optimitzat que apliquem a diferents tasques de visió per computador i a la visió dins del context de la robòtica. Els resultats del nostre estudi suggereixen que la representació d'escenes visuals complexes, com cares humanes, gestos amb les mans i senyals del medi ambient podrien ser codificades pel TPC el qual es pot considerar un poderós marc biològic per reconeixement d'objectes en temps real. A més a més, els nostres resultats suggereixen que la representació de l'entrada sensorial pot ser integrada en un codi espai-temporal interpretat i analitzat en una serie de components Wavelet per àrees visuals superiors.
Santos, Vilma Constancia Fioravante dos. "A saúde como direito : um manifesto visual da luta por reconhecimento." reponame:Biblioteca Digital de Teses e Dissertações da UFRGS, 2018. http://hdl.handle.net/10183/186177.
Full textThe present thesis deals with health as a right of citizenship, focusing on the health professional as an important element to think about the construction of public spaces that support the exercise of citizenship through health. Having as a turning point the fact that the scope of the public space occurs when subjects are recognized as worthy members in intersubjective relations, thus constituting a public life capable of promoting health as a right of citizenship, acting in the name of the field health as a source of appreciation and social visibility. An ethnographic study was carried out using images for the constitution of visual narratives that indicated the spaces and situations involved in the establishment of intersubjective relations and in the occupation of a public space by health professionals in the rural areas. The data was generated in a rural area health service in the city of Gravataí (RS, Brazil), with the production of photographs, participant observation, field diary records and semi-structured interviews. The activities in empirical field occurred between September 2016 to March 2017. The process of data analysis took place through an interpretative orientation performed in the light of the contributions of Clifford Gueertz and the theoretical framework offered by the Theory of Recognition of Axel Honneth. The images, rather than illustrate, explain the meaning of the text constructed from the spheres of Recognition as an analytical reference of daily life, affection, law and social esteem. The imagens also bring the description of assistential trajectories that reveal the configuration of relationships which are established between professionals and users. The visual narratives enunciate the forms of disrespect experienced by the professionals, instigating the reflection on the repression imposed by the normative logic of health services functioning. The sociability that conforms in the institutionalized space of the health service imposes more forms of disrespect than of strengthening interest in the public space. The construction of visual narratives that express experiences in health (not necessarily experiences of citizenship or experiences rights reaching), transcribed by the assistential trajectories by and with the photographs, occurred in order to visualize mechanisms that conform the daily life of a health service. These mechanisms have the potential to value intersubjective relations, invisible by the logic of institutional organization and the formulation of public policies in the field of health, stating that the public space established outside the physical space of the health service takes place in a more respectful way. In general, the visual narratives bring to light the emptying of the public space in its potential to be mediator of the formation of the public will and to mechanisms that endorse the invisibility of the subjects. The grammar of social relations indicates the production of anonymous subjects who cannot symbolize how their individual needs are relevant to collaborate with the collective and conform a public life. From this emerges the consideration that it is necessary to occupy the public space as an exercise of citizenship. The struggle for health, as a right, comes from the re-signification of the senses of what is public, from the desire of those who are involved in activities such as health professionals to engage with what is public.
La presente tesis tiene como tema de investigación a la salud como un derecho de ciudadanía, centrándose en la figura del profesional de la salud como un elemento importante en la construcción de espacios públicos que sustentan el ejercicio de la ciudadanía por la vía de la salud. Partimos de la reflexión de que el alcance del espacio público se da cuando los sujetos se ven reconocidos como integrantes dignos de valor en las relaciones intersubjetivas, constituyendo de esta manera una vida pública capaz de promover la salud como un derecho de ciudadanía, actuando en nombre del campo de la salud como fuente de valoración y visibilidad social. Se realizó un estudio etnográfico, con uso de imágenes para la constitución de narrativas visuales que muestren los espacios y situaciones involucradas en el establecimiento de relaciones intersubjetivas y en la ocupación de un espacio público atendido por profesionales de la salud en el ámbito rural. Los datos fueron recolectados en un servicio de salud rural del Municipio de Gravataí, con elaboración de fotografías, observación participante, registros en diario de campo y realización de entrevistas semi-estructuradas. Las actividades en campo empírico se realizaron entre septiembre de 2016 a marzo de 2017. El proceso de análisis de los datos se efectuó por medio de la orientación interpretativa realizada a la luz de las contribuciones de Clifford Gueertz y del referente teórico ofrecido por la Teoría del Reconocimiento de Axel Honneth. Las imágenes, más que ilustrar, explican el sentido del texto construido a partir de las esferas del Reconocimiento: del afecto, del derecho y de la estima social. Las narrativas visuales enuncian las formas de irrespeto vivenciadas por los profesionales, instigando la reflexión sobre la represión impuesta por la lógica normativa de funcionamiento de los servicios de salud. La sociabilidad que se conforma en el espacio institucionalizado del servicio de salud impone más formas de irrespeto que de fortalecimiento del interés por el espacio público. La construcción de narrativas visuales que expresan experiencias en salud (no necesariamente experiencias de ciudadanía o de alcance de derechos), transcritas por las trayectorias asistenciales y las fotografías, se efectuó con la intención de visibilizar mecanismos que se conforman en lo cotidiano de un servicio de salud. Estos mecanismos tienen el potencial de valorizar las relaciones intersubjetivas, invisibilizadas por la lógica de la organización institucional y la formulación de las políticas públicas en el campo de la salud, explicitando que el espacio público establecido fuera del espacio físico del servicio de salud ocurre de forma más respetuosa. De modo general, las narrativas visuales muestran el vaciamiento del espacio público en su potencial de ser mediador de la formación de voluntad pública y de mecanismos que endosan la invisibilidad de los sujetos. La gramática de las relaciones sociales indica la producción de sujetos anónimos que no logran simbolizar cuán relevantes son sus necesidades individuales para colaborar con el colectivo y conformar una vida pública. Surge entonces, la consideración de que es preciso ocupar el espacio público como un ejercicio de ciudadanía. La lucha de la salud como un derecho, proviene de la re-significación del sentido de lo público y del deseo de involucrarse con lo que es público, desde los profesionales de la salud.
Liu, Xialei. "Visual recognition in the wild: learning from rankings in small domains and continual learning in new domains." Doctoral thesis, Universitat Autònoma de Barcelona, 2019. http://hdl.handle.net/10803/670154.
Full textLas redes neuronales convolucionales profundas (CNNS) han alcanzado resultados muy positivos en diferentes aplicaciones de reconocimiento visual, tales como clasificación, detección o segmentación de imágenes. En esta tesis, abordamos dos limitaciones de las CNNs. La primera, entrenar CNNs profundas requiere grandes cantidades de datos etiquetados, los cuales sonmuy costosos y arduos de conseguir. La segunda es que entrenar en sistemas de aprendizaje continuo es un problema abierto para la investigación. El olvido catastrófico en redes es muy común cuando se adapta un modelo entrenado a nuevos entornos o nuevas tareas. Por lo tanto, en esta tesis, tenemos como objetivo mejorar las CNNs para aplicaciones con datos limitados y adaptarlas de forma continua a nuevas tareas. El aprendizaje auto-supervisado compensa la falta de datos etiquetados con la introducción de tareas auxiliares en las cuales los datos están fácilmente disponibles. En la primera parte de la tesis, mostramos cómo los ránquings se pueden utilizar de forma parecida a una tarea auto-supervisada para los problemas de regresión. Después, proponemos una técnica de propagación hacia atrás eficiente para redes siamesas que previene el computo redundante introducido por las arquitecturas de red multi-rama. Además, demostramos quemedir la incertidumbre de las redes en las tareas parecidas a las auto-supervisadas, es una buena medida de la cantidad de información que contienen los datos no etiquetados. Dicha medida puede ser entonces usada para la ejecución de algoritmos de aprendizaje activo. Estosmarcos que proponemos los aplicamos entonces a dos problemas de regresión: Evaluación de Calidad de Imagen (IQA) y el contador de personas. En los dos casos, mostramos cómo generar de forma automática grupos de imágenes ranqueadas para los datos no etiquetados. Nuestros resultados muestran que las redes entrenadas para la regresión de las anotaciones de los datos etiquetados, a la vez que para aprender a ordenar los ránquings de los datos no etiquetados, obtienen resultados significativamente mejores al estado del arte. También demostramos que el aprendizaje activo utilizando ránquings puede reducir la cantidad de etiquetado en un 50% para ambas tareas de IQA y contador de personas. En la segunda parte de la tesis, proponemos dos métodos para evitar el olvido catastrófico en escenarios de aprendizaje secuencial de tareas. El primer método deriva del de Consolidación Elástica de Pesos, el cuál utiliza la diagonal de laMatriz de Información de Fisher (FIM) para medir la importancia de los pesos de la red. No obstante, la aproximación asumida no es realista. Por lo tanto, diagonalizamos la aproximación de la FIM utilizando un grupo de parámetros de rotación factorizada proporcionando una mejora significativa en el rendimiento de tareas secuenciales para el caso del aprendizaje continuo. Para el segundo método, demostramos que el olvido se manifiesta de forma diferente en cada capa de la red y proponemos un método híbrido donde la destilación se utiliza para el extractor de características y la rememoración en el clasificador mediante generación de características. Nuestro método soluciona la limitación de la rememoración mediante generación de imágenes y la destilación de probabilidades (como la utilizada en elmétodo Aprendizaje Sin Olvido), y puede añadir de forma natural nuevas tareas en un único clasificador bien calibrado. Los experimentos confirman que el método propuesto sobrepasa las métricas de referencia y parte del estado del arte.
Deep convolutional neural networks (CNNs) have achieved superior performance in many visual recognition application, such as image classification, detection and segmentation. In this thesis we address two limitations of CNNs. Training deep CNNs requires huge amounts of labeled data, which is expensive and labor intensive to collect. Another limitation is that training CNNs in a continual learning setting is still an open research question. Catastrophic forgetting is very likely when adapting trainedmodels to new environments or new tasks. Therefore, in this thesis, we aim to improve CNNs for applications with limited data and to adapt CNNs continually to new tasks. Self-supervised learning leverages unlabelled data by introducing an auxiliary task for which data is abundantly available. In the first part of the thesis, we show how rankings can be used as a proxy self-supervised task for regression problems. Then we propose an efficient backpropagation technique for Siamese networks which prevents the redundant computation introduced by the multi-branch network architecture. In addition, we show that measuring network uncertainty on the self-supervised proxy task is a good measure of informativeness of unlabeled data. This can be used to drive an algorithm for active learning. We then apply our framework on two regression problems: Image Quality Assessment (IQA) and Crowd Counting. For both, we show how to automatically generate ranked image sets from unlabeled data. Our results show that networks trained to regress to the ground truth targets for labeled data and to simultaneously learn to rank unlabeled data obtain significantly better, state-of-the-art results. We further show that active learning using rankings can reduce labeling effort by up to 50% for both IQA and crowd counting. In the second part of the thesis, we propose two approaches to avoiding catastrophic forgetting in sequential task learning scenarios. The first approach is derived from ElasticWeight Consolidation, which uses a diagonal Fisher InformationMatrix (FIM) tomeasure the importance of the parameters of the network. However the diagonal assumption is unrealistic. Therefore, we approximately diagonalize the FIM using a set of factorized rotation parameters. This leads to significantly better performance on continual learning of sequential tasks. For the second approach, we show that forgetting manifests differently at different layers in the network and propose a hybrid approach where distillation is used in the feature extractor and replay in the classifier via feature generation. Our method addresses the limitations of generative image replay and probability distillation (i.e. learning without forgetting) and can naturally aggregate new tasks in a single, well-calibrated classifier. Experiments confirmthat our proposed approach outperforms the baselines and some start-of-the-art methods.
Goday, Lucas Elena. "Reconocimiento y dignificación de las víctimas del conflicto armado interno vivido en el Perú entre 1980-2000, a través de su representación visual en el libro fotográfico Yuyanapaq : para recordar : relato visual del conflicto armado interno 1980-2000 : análisis semiótico de dos fotografías." Bachelor's thesis, Pontificia Universidad Católica del Perú, 2011. http://tesis.pucp.edu.pe/repositorio/handle/123456789/1183.
Full textTesis
Aznar, Casanova José Antonio. "El "continuum de eficacia en la recuperación": un marco integrador para el estudio de los comportamientos mnémicos. Modelo predictivo de la eficacia y contraste experimental en pruebas de reconocimiento verbal visual." Doctoral thesis, Universitat de Barcelona, 1989. http://hdl.handle.net/10803/2552.
Full textLa corriente del Procesamiento de información (en su enfoque neoconexionista, fundamentado en la metáfora del ordenador) ha utilizado habitualmente las pruebas de recuerdo libre, con claves de recuperación y reconocimiento, como un medio que permitía inferir una explicación del mecanismo del sistema de memoria humano. Dicho en términos cognitivistas, responder al problema de ¿qué estructuras, procesos y representaciones subyacen a la memoria? y ¿cómo éstas interactúan entre si?
En esta investigación, básicamente, pretendemos dar puesta a otras cuestiones complementarias: ¿qué factores de las pruebas mnémicas determinan las modificaciones de los procesos que subyacen a la memoria? y ¿a qué agrupamientos de procesos (estrategias) dan lugar. Es decir, se intenta buscar una explicación, en términos de procesamiento de información, sobre cómo interactúa la estructura formal de las pruebas de memoria con la estructura física y lógica de la memoria para dar lugar a comportamientos dirigidos por estrategias.
Partimos de un análisis de los comportamientos anémicos (recuerdo libre y con claves, reconstrucción y reconocimiento). Como consecuencia de éste, se ponen de manifiesta diferencias en las demandas de la tarea que inducen a distintas estrategias. Además, las condiciones de prueba de la memoria parecen ordenarse en un "continuum de recuperación", definida por la función inversa entre las variables "comprensión" y "extensión" categorial. De confirmarse dicho continuo, nos proporcionaría un marco integrador de los comportamientos mnémicos, que pueden generarse al manipular las condiciones de prueba.
Con objeto de verificar estas cuestiones, confeccionamos ocho pruebas de reconocimiento, que nos permitieran establecer comparaciones válidas en condiciones uniformes. Así, decidimos utilizar un paradigma experimental de búsqueda visual con elección múltiple forzada.
Estas situaciones de prueba (tratamientos) surgen de la combinación de tres factores dicotómicos: formato del ítem consigna, de los ítems de prueba (CG= configuración global o LC= lista de características) y nivel de procesamiento (grafémico o semántico).
De la combinación de los dos formatos (consigna y prueba) establecer dos tipos de tarea: analógica o de formatos isomórficos y categorial o de formatos heteromórficos. Y en estos tipos de tarea, cuatro direcciones de recuperación de información: CG->CG, LC->LC, CG->LC y LC->CG.
Para profundizar en los procesos que son postulados para estas condiciones de reconocimiento, seleccionamos una serie de variables que nos permiten manipular la complejidad de la tarea: nivel de integración-disociación, tamaño de la matriz de reconocimiento, tipa de ensayo (positivo, negativo), localización del ítem crítico, similitud, longitud de los ítems y familiaridad de las palabras.
También se pretende elaborar un modela predictivo de la eficacia alcanzada par los sujetos en estas tareas y contrastar otros modelos estructurales generados para cada Prueba.
El diseño de recogida de datos se ajusta a un factorial mixto, donde las variables de agrupamiento son el sexo y el orden de aplicación (contrabalanceo) indicador del entrenamiento en la tarea. Intervinieron 32 sujetos voluntarios, de 13-14 años y en igual proporción de sexo.
Los resultados se agrupan en dos bloques: análisis de variables (interpruebas e intrapruebas) y análisis del modelo (macromodelo y micromodelos). Éstos ponen de manifiesto el ajuste de las condiciones estudiadas al modelo, respecto a la variable "eficacia en los procesos de recuperación". Dicha variable, definida mediante el coste temporal (latencias) de cada acierto (exactitud) en una determinada prueba, posibilita una ordenación de los tratamientos. La pendiente de la recta nos indica la velocidad del procesamiento. Además, detectamos dos estrategias que los sujetos utilizan en estas tareas: globalista-contextual y analítico-semántica.
Estos datos apoyan la existencia de un sólo mecanismo de memoria y las diferencias interpruebas deben atribuirse, con mayor propiedad, al uso de tales estrategias deliberadas que a una dicotomía funcional entre los sistemas de memoria episódico y semántico.
Además de la importancia de variables situacionales y estimulares, también se evidenció la relevancia de las expectativas y entrenamiento en la tarea.
The objective of this work is to show the functional relations among same experimental conditions of recognition, that originate several mnemonics behaviour and certain aspects of the response (speed, exactness and efficacy).
The analysis of this behaviour manifests the following:
1) The factors that may generate them
2) Its arrangement in a continuum of efficacy in recuperation
3) The use of deliberate strategies
4) The adequacy of processes and representations to request of the task and nature of the stimulus.
In order to verify this hypothesis we carried out eight trials of recognition, formally equivalent and interrelated, that they have been applied to 32 students of 8th. E.G.B (age=13-14 years).
The results confirm the relevant facts, verify the "continuum", suggest two strategies (globalist-contextual and analytical-semantic) and inform of processes and representations.
Hernández-Vela, Antonio. "From pixels to gestures: learning visual representations for human analysis in color and depth data sequences." Doctoral thesis, Universitat de Barcelona, 2015. http://hdl.handle.net/10803/292488.
Full textL’anàlisi visual de persones a partir d'imatges és un tema de recerca molt important, atesa la rellevància que té a una gran quantitat d'aplicacions dins la visió per computador, com per exemple: detecció de vianants, monitorització i vigilància,interacció persona-màquina, “e-salut” o sistemes de recuperació d’matges a partir de contingut, entre d'altres. En aquesta tesi volem aprendre diferents representacions visuals del cos humà, que siguin útils per a la anàlisi visual de persones en imatges i vídeos. Per a tal efecte, analitzem diferents modalitats d'imatge com són les imatges de color RGB i les imatges de profunditat, i adrecem el problema a diferents nivells d'abstracció, des dels píxels fins als gestos: segmentació de persones, estimació de la pose humana i reconeixement de gestos. Primer, mostrem com la segmentació binària (objecte vs. fons) del cos humà en seqüències d'imatges ajuda a eliminar soroll pertanyent al fons de l'escena en qüestió. El mètode presentat, basat en optimització “Graph cuts”, imposa consistència espai-temporal a Ies màscares de segmentació obtingudes en “frames” consecutius. En segon lloc, presentem un marc metodològic per a la segmentació multi-classe, amb la qual podem obtenir una descripció més detallada del cos humà, en comptes d'obtenir una simple representació binària separant el cos humà del fons, podem obtenir màscares de segmentació més detallades, separant i categoritzant les diferents parts del cos. A un nivell d'abstraccíó més alt, tenim com a objectiu obtenir representacions del cos humà més simples, tot i ésser suficientment descriptives. Els mètodes d'estimació de la pose humana sovint es basen en models esqueletals del cos humà, formats per segments (o rectangles) que representen les extremitats del cos, connectades unes amb altres seguint les restriccions cinemàtiques del cos humà. A la pràctica, aquests models esqueletals han de complir certes restriccions per tal de poder aplicar mètodes d'inferència que permeten trobar la solució òptima de forma eficient, però a la vegada aquestes restriccions suposen una gran limitació en l'expressivitat que aques.ts models son capaços de capturar. Per tal de fer front a aquest problema, proposem un enfoc “top-down” per a predir la posició de les parts del cos del model esqueletal, introduïnt una representació de parts de mig nivell basada en “Poselets”. Finalment. proposem un marc metodològic per al reconeixement de gestos, basat en els “bag of visual words”. Aprofitem els avantatges de les imatges RGB i les imatges; de profunditat combinant vocabularis visuals específiques per a cada modalitat, emprant late fusion. Proposem un nou descriptor per a imatges de profunditat invariant a rotació, que millora l'estat de l'art, i fem servir piràmides espai-temporals per capturar certa estructura espaial i temporal dels gestos. Addicionalment, presentem una reformulació probabilística del mètode “Dynamic Time Warping” per al reconeixement de gestos en seqüències d'imatges. Més específicament, modelem els gestos amb un model probabilistic gaussià que implícitament codifica possibles deformacions tant en el domini espaial com en el temporal.
Sandoval, De Los Ríos Willy Andree. "Herramienta informática de locución automática como apoyo al proceso de aprendizaje basado en la lectoescritura en el área de comunicación de niños invidentes en un centro de educación básica especializada de la ciudad de Chiclayo." Bachelor's thesis, Universidad Católica Santo Toribio de Mogrovejo, 2020. http://hdl.handle.net/20.500.12423/2673.
Full textMoscoso, Rios Yves Igor, and Zanabria Henry Alcántara. "Propuesta para reducir reclamos en el abastecimiento de repuestos de productos de línea blanca." Bachelor's thesis, Universidad Ricardo Palma, 2015. http://cybertesis.urp.edu.pe/handle/urp/1303.
Full textBonaventura, Brugués Xavier. "Perceptual information-theoretic measures for viewpoint selection and object recognition." Doctoral thesis, Universitat de Girona, 2015. http://hdl.handle.net/10803/302540.
Full textLa selecció de punts de vista ha estat una àrea emergent en la computació gràfica des de fa alguns anys i ara està aconseguint la maduresa amb aplicacions en camps com la navegació d’una escena, la visualització de volums, el reconeixement d’objectes, la simplificació d’una malla i la col·locació de la càmera. Però per què és important la selecció del punt de vista? Per exemple, la automatització de la selecció de punts de vista podria tenir un paper important a l’hora de seleccionar un model representatiu mitjançant l’exploració d’una gran base de dades de models 3D en el menor temps possible. Aquesta aplicació podria mostrar la vista del model que permet el millor reconeixement o comprensió del model 3D. Un punt de vista ideal ha de captar la màxima informació del model 3D, com per exemple les seves principals característiques, parts, funcionalitats, etc. La qualitat d’aquest punt de vista pot afectar el nombre de models que l’artista pot explorar en un determinat període de temps. En aquesta tesi, es presenta un marc de teoria de la informació per a la selecció de punts de vista i el reconeixement d’objectes. Obtenim diverses mesures de qualitat de punt de vista a través de la descomposició de la informació mútua d’un canal de visibilitat entre un conjunt de punts de vista i els polígons d’un model 3D. També revisem i comparem en un marc comú les mesures més rellevants que s’han presentat a la literatura sobre la qualitat d’un punt de vista d’un model poligonal. A partir de la informació associada als polígons d’un model, obtenim diversos tipus de renderitzat per millorar el reconeixement d’objectes i la percepció de la forma. Utilitzem aquesta informació poligonal per seleccionar les millors vistes d’un model 3D i per la seva exploració. També usem aquestes mesures d’informació poligonal per millorar la visualització d’un model de terreny 3D amb textures generat a partir de dades reals. Finalment, s’analitza l’aplicació de les mesures de qualitat de punt de vista presentades en aquesta tesi per calcular la similitud entre dos models poligonals. La informació del conjunt de punts de vista és vista com un descriptor del model. Llavors, donats dos models poligonals, la seva similitud s’obté mitjançant la realització d’un procés de registre entre els conjunts de punts de vista corresponents
Albert, Gil Francisco Eugenio. "Análisis de motivos decorativos de tejidos y revestimientos cerámicos en el entorno de la visión artificial. Aplicación a la reconstrucción de motivos históricos y al diseño." Doctoral thesis, Universitat Politècnica de València, 2008. http://hdl.handle.net/10251/1936.
Full textAlbert Gil, FE. (2006). Análisis de motivos decorativos de tejidos y revestimientos cerámicos en el entorno de la visión artificial. Aplicación a la reconstrucción de motivos históricos y al diseño [Tesis doctoral no publicada]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/1936
Palancia
Cucchetti, Fabiana, and María Victoria Laborde. "Reconocimiento óptico de música impresa en un entorno visual." Tesis, 2002. http://hdl.handle.net/10915/3888.
Full textVásquez, Vargas Carla. "Rostros extraviados : en la búsqueda de una experiencia visual de reconocimiento y reacción sobre el extravío de personas en Chile." Tesis, 2017. http://repositorio.uchile.cl/handle/2250/152122.
Full textEl presente proyecto tiene como principal objetivo el generar una concientización respecto al extravío de personas en Chile. Por medio de una serie de experimentaciones visuales y la inclusión de un dispositivo interactivo, se busca crear una experiencia que integre el diseño y la tecnología con los recursos de investigación que poseen actualmente las Instituciones nacionales. Dentro del proceso fue fundamental, en primer lugar, formar de una base de datos e imágenes que pudiera aportar información sobre las personas extraviadas ¿Cuántas se pierden?, ¿Donde se pierden? y ¿Por qué?. En segundo lugar, fue necesario adoptar una metodología que permitiera filtrar y pasar de toda esa información a una visualización para finalmente, llegar al desarrollo de la experiencia, a través de la construcción de un primer prototipo y la creación de un registro visual que recoge todas las reflexiones y reacciones de quienes participaron.
Maina, Hernán Javier. "Visión artificial para el reconocimiento automático, en tiempo real, de líneas urbanas de autobuses." Bachelor's thesis, 2019. http://hdl.handle.net/11086/15560.
Full textEn el presente trabajo, se aborda el problema de la detección y el reconocimiento de números de líneas de autobuses del transporte público de pasajeros de la ciudad de Córdoba, empleando imágenes obtenidas mediante dispositivos móviles estándar. El objetivo del mismo es la exploración de técnicas de visión por computadoras y análisis de imágenes, para la generación de herramientas que permitan asistir a personas con algún tipo de impedimento visual. A tal fin, se presenta y evalúa una arquitectura modular basada en detectores de objetos y reconocimiento óptico de caracteres, especialmente adaptada a las particularidades del problema.
In the present work, the problem of the detection and the recognition of bus line numbers of public transport in the city of Córdoba is addressed, using images obtained by standard mobile devices. The goal of this project is the exploration of computer vision techniques and the analysis of images, for the generation of tools that allows people with some type of visual impairments to be assisted. To achieve this, a modular architecture based on object detectors and optical character recognizers is presented and evaluated, especially adapted to the particularities of the problem.
Fil: Maina, Hernán Javier. Universidad Nacional de Córdoba. Facultad de Matemática, Astronomía, Física y Computación; Argentina.