Academic literature on the topic 'Red neuronal convolucional (CNN)'

Create a spot-on reference in APA, MLA, Chicago, Harvard, and other styles

Select a source type:

Consult the lists of relevant articles, books, theses, conference reports, and other scholarly sources on the topic 'Red neuronal convolucional (CNN).'

Next to every source in the list of references, there is an 'Add to bibliography' button. Press on it, and we will generate automatically the bibliographic reference to the chosen work in the citation style you need: APA, MLA, Harvard, Chicago, Vancouver, etc.

You can also download the full text of the academic publication as pdf and read online its abstract whenever available in the metadata.

Journal articles on the topic "Red neuronal convolucional (CNN)"

1

Guerra Londono, Mateo, Luis Fernando Castano Londono, Cristian Camilo Alzate Anzola, David Andres Marquez Viloria, and Ricardo Andres Velasquez Velez. "An´alisis de desempe˜no de capas de CNN para arquitecturas heterog´eneas basadas en FPGAs usando HLS." Ingeniería 26, no. 1 (2020): 62–76. http://dx.doi.org/10.14483/23448393.15634.

Full text
Abstract:
Contexto: Las redes neuronales convolucionales (CNNs) son actualmente utilizadas en una amplia gama de aplicaciones de inteligencia artificial. En muchos casos, dichas aplicaciones requieren la ejecución de las redes en tiempo real en dispositivos integrados. Por esto, el interés en que estas aplicaciones puedan alcanzar un buen desempeño con bajo consumo de potencia. Las CNNs realizan operaciones entre los datos de entrada y los pesos de la red, con la particularidad de que no existe dependencia entre la mayoría de las operaciones. Por tal motivo, el paralelismo inherente de los FPGAs puede ser usado para realizar múltiples operaciones en paralelo, manteniendo el buen desempeño por vatio que caracteriza a estos dispositivos. Este artículo se enfoca en la evaluación del algoritmo de convolución para una capa convolucional de redes neuronales explorando directivas de paralelización usando VIVADO HLS, y su objetivo es evaluar el desempeño del algoritmo utilizando directivas de optimización. Método: La metodología consiste en una exploración del espacio de diseño de la implementación de una capa de una red neuronal convolucional usando VIVADO HLS. La verificación del funcionamiento del FPGA fue realizada comparando los datos de salida con el mismo algoritmo de convolución implementado en MATLAB. Una capa de la versión comercial Xilinx DNNK fue usada como referencia para las medidas de desempeño de las diferentes implementaciones obtenidas en la exploración del espacio de diseño. En este trabajo se utilizan múltiples variaciones de directivas de optimización, tales como pipeline, array partition, y unroll. Resultados: Este trabajo presenta los resultados de una implementación de referencia (sin directivas de optimización) del algoritmo de convolución con respecto a la latencia del algoritmo y los recursos de hardware utilizados por la FPGA. Los resultados se comparan con implementaciones del algoritmo, incluyendo diferentes combinaciones de dos directivas de optimización (pipeline y partition array). Conclusiones: Este trabajo explora el espacio de diseño de un algoritmo de convolución para una capa de red neuronal convolucional sobre FPGAs. La exploración incluye el efecto causado por la transferencia de los datos entre la memoria DDR y la memoria on-chip del FPGA. Además, dicho efecto es causado por las directivas de optimización en Vivado HLS sobre los diferentes ciclos del algoritmo.
APA, Harvard, Vancouver, ISO, and other styles
2

Gamarra Moreno, Abraham E., and José A. Dávalos Pinto. "Reconocimiento de Personas en Ambiente con Emisiones de Humo Usando Sensor Laser y Redes Neuronales Convolucionales desde Nube de Puntos 3D. Parte 1." BISTUA REVISTA DE LA FACULTAD DE CIENCIAS BASICAS 17, no. 1 (2018): 179. http://dx.doi.org/10.24054/01204211.v1.n1.2019.3146.

Full text
Abstract:
Cuando ocurren incendios en Plantas industriales, los materiales siniestrados y el humo dificultan la identificación del personal. Los Drones con sensores laser y redes CNN posibilitan el reconocimiento de personas en tales ambientes. El objetivo del proyecto es el estudio de un sistema neuronal convolucional para el reconocimiento de personas en un ambiente con emisiones de humo (parte1) y para su implementación usa un sensor laser, una tarjeta controladora y un dron (parte2). El método empleado consideró la realización de un reconocimiento de personas usando una red CNN previamente entrenada con nube de puntos 3D. La prueba se realizó con Alexnet e imágenes de personas. Los resultados (parte1) muestran que una matriz de confusión del 97.5 % ha sido alcanzada. Basado en el estudio, se concluye que el sistema neuronal de reconocimiento de personas usando CNN en ambientes siniestrados presenta un comportamiento muy aceptable para su aplicabilidad.Palabras clave: reconocimiento de personas, redes neuronales convolucionales, programación en entorno Matlab, sensor laser y dron.
APA, Harvard, Vancouver, ISO, and other styles
3

Gamarra Moreno, Abraham E., and José A. Dávalos Pinto. "Recognition of People in Environment with Smoke Emissions Using Laser Sensor and Convolutional Neural Networks from 3D Pointed Cloud." BISTUA REVISTA DE LA FACULTAD DE CIENCIAS BASICAS 17, no. 2 (2019): 03. http://dx.doi.org/10.24054/01204211.v2.n2.2019.3515.

Full text
Abstract:
Cuando ocurren incendios en Plantas industriales, los materiales siniestrados y el humo dificultan la identificación del personal. Los Drones con sensores laser y redes CNN posibilitan el reconocimiento de personas en tales ambientes. El objetivo del proyecto es el estudio de un sistema neuronal convolucional para el reconocimiento de personas en un ambiente con emisiones de humo (parte1) y para su implementación usa un sensor laser, una tarjeta controladora y un dron (parte2). El método empleado consideró la realización de un reconocimiento de personas usando una red CNN previamente entrenada con nube de puntos 3D. La prueba se realizó con Alexnet e imágenes de personas. Los resultados (parte1) muestran que una matriz de confusión del 97.5 % ha sido alcanzada. Basado en el estudio, se concluye que el sistema neuronal de reconocimiento de personas usando CNN en ambientes siniestrados presenta un comportamiento muy aceptable para su aplicabilidad. Palabras clave: reconocimiento de personas, redes neuronales convolucionales, programación en entorno Matlab, sensor laser y dron.
APA, Harvard, Vancouver, ISO, and other styles
4

Zapeta Hernández, Adriana, Gustavo Alejandro Galindo Rosales, Héctor Jesús Juan Santiago, and Maribel Martínez Lee. "Métricas de rendimiento para evaluar el aprendizaje automático en la clasificación de imágenes petroleras utilizando redes neuronales convolucionales." Ciencia Latina Revista Científica Multidisciplinar 6, no. 5 (2022): 4624–37. http://dx.doi.org/10.37811/cl_rcm.v6i5.3420.

Full text
Abstract:
Las redes neuronales entran en un campo extenso de la inteligencia artificial, sus funciones son: el aprendizaje relacionado con imágenes, reconocimiento de voz, detección de texto, detección de objetos, detección de idioma, reconocimiento facial, etc. Una red neuronal aprende tareas analizando grandes cantidades de datos, el aprendizaje puede ser supervisado, reforzado o no supervisado. La red neuronal convolucional (CNN) utilizan una jerarquía de características combinando las de bajo nivel con una estructura de capas para formar características de alto nivel. (Rashka & Mirjalili, 2019)Este trabajo se centra en el desarrollo de un software inteligente basado en una CNN, que clasifica imágenes, patrones y texto de fotos tomadas a pozos petroleros, las cuales son evaluadas por medio de métricas de rendimiento, que ayudan a detectar posibles errores, falsas predicciones, suba justes y sobreajustes que pueden llegar a surgir en el aprendizaje automático. El objetivo de este trabajo es mostrar cómo se aplica cada una de las métricas de rendimiento para obtener una mejor precisión y exactitud para la clasificación de imágenes utilizando redes neuronales convolucionales.
APA, Harvard, Vancouver, ISO, and other styles
5

Olguín-Rojas, Juan C., Juan I. Vasquez-Gomez, Gilberto de J. López-Canteñs, and Juan C. Herrera-Lozada. "CLASIFICACIÓN DE MANZANAS CON REDES NEURONALES CONVOLUCIONALES." Revista Fitotecnia Mexicana 45, no. 3 (2022): 369. http://dx.doi.org/10.35196/rfm.2022.3.369.

Full text
Abstract:
Actualmente, en puntos de venta y en empresas agroindustriales de México, la clasificación de manzanas (Malus domestica) la realizan personas de forma manual, lo que genera deficiencias en la calidad del producto. Estos problemas se pueden reducir con la implementación de equipos de visión en sitio equipados con algoritmos de aprendizaje automático. En este estudio se analizaron varias arquitecturas de red neuronal convolucional (CNN) y se seleccionó una que permite clasificar manzanas en sanas y dañadas en el proceso en postcosecha. Las variedades utilizadas fueron Red Delicious, Granny Smith, Golden Delicious y Gala. Se comparó la exactitud de las CNN LeNet5 y VGG16. Se realizó una serie de tratamientos (combinación de red con hiperparámetros) que se utilizaron para la clasificación del objeto de estudio. Al probarse cada tratamiento se midió su rendimiento. Al finalizar, el tratamiento con mejor rendimiento fue LeNet5 entrenada desde cero con el optimizador RMSProp, que obtuvo una exactitud del 97 %.
APA, Harvard, Vancouver, ISO, and other styles
6

Mota-Delfin, C., C. Juárez-González, and J. C. Olguín-Rojas. "Clasificación de manzanas utilizando visión artificial y redes neuronales artificiales." Ingeniería y Región 20 (December 28, 2018): 52–57. http://dx.doi.org/10.25054/22161325.1917.

Full text
Abstract:
El valor agregado en un fruto puede incrementarse con un buen manejo postcosecha. La clasificación en diferentes parámetros es de las operaciones más importantes. En las pequeñas empresas se realiza de forma manual obteniendo deficiencias en la calidad del producto. Estos problemas se podrían resolver o disminuir con la implementación de algoritmos inteligentes que en este caso incluyen visión artificial y redes neuronales artificiales. En este proyecto se presenta la clasificación de manzanas mediante un algoritmo inteligente, usando una red neuronal convolucional (CNN), la cual se desarrolla utilizando librerías de código abierto (OpenCV, Tensorflow y Keras) en Python con una estructura de diferentes capas convolucionales y MaxPooling, para un conjunto de 2,800 imágenes de 128x128 pixeles, de las cuales el 80% se utilizaron para entrenamiento y el 20% para hacer una prueba de la red, obteniendo una precisión del 98.3% y del 95.36%, respectivamente. Después del entrenamiento, se realizó una clasificación con un video en tiempo real, obteniendo una precisión del 92.25%. Asimismo, se explora la posibilidad de la utilización en la industria con la clasificación por otras características visuales del fruto como tamaño, color, forma, etc.
APA, Harvard, Vancouver, ISO, and other styles
7

Bertone, Sergio E., Gabriel D. Puccini, Carlos A. Bonetti, Melina Denardi, and Jezabel D. Bianchotti. "Reducción de la Dimensionalidad de un Sistema de Partículas en Movimiento Utilizando Redes Neuronales Convolucionales." Mecánica Computacional 41, no. 19 (2025): 1023–31. https://doi.org/10.70567/mc.v41i19.100.

Full text
Abstract:
En el campo del aprendizaje automático, en los últimos años se ha desarrollado un enfoque innovador para modelar sistemas complejos mediante la identificación de dimensiones intrínsecas y variables de estado neuronales (NSV) utilizando redes neuronales convolucionales (CNN). Esta técnica ha demostrado ser eficaz en la predicción estable a largo plazo de sistemas dinámicos complejos, como los encontrados en aplicaciones industriales de flujos de materia granular. El presente trabajo se centra en el modelado y simulación de sistemas bidimensionales de partículas discretas en un entorno dinámico. Se emplean simulaciones computacionales para generar secuencias de video que capturan la dinámica del sistema en diversas configuraciones y velocidades. Estos datos se utilizan posteriormente para entrenar una red neuronal convolucional que funciona como un autoencoder, descomponiendo y reconstruyendo la señal de video. El proceso de descomposición implica una reducción de la dimensionalidad del sistema, lo que es crucial para obtener una representación más eficiente y simplificada de su comportamiento dinámico. Esto facilita la comprensión y predicción del sistema en entornos industriales. Se espera que los resultados obtenidos contribuyan al desarrollo de futuros modelos simplificados del sistema.
APA, Harvard, Vancouver, ISO, and other styles
8

Sánchez, Jacqueline, and Miguel A. Campos. "Red neuronal artificial para detección de armas de fuego y armas blancas en video vigilancia." Revista de Iniciación Científica 7, no. 2 (2021): 83–88. http://dx.doi.org/10.33412/rev-ric.v7.2.3343.

Full text
Abstract:
Con el crecimiento de la población en América Latina, las ciudades incrementan el uso de video vigilancia para monitorear áreas con el objetivo de detectar incidentes de violencia y/o delictivos para tomar acción oportunamente. Actualmente el proceso de video vigilancia es desarrollado por personal humano revisando innumerables cantidades de señales de video al mismo tiempo, la actual solución es propensa a errores, no es escalable y plantea un desafío. En esta contribución se propone construir una red neuronal convolucional CNN para la detección de armas de fuego y armas blanca en imágenes con el objetivo de automatizar y optimizar el proceso de monitorización de señales de video. Se especificó una arquitectura de red neuronal artificial que fue entrenada con un conjunto de datos (construido a medida) y evaluada para dar solución a problemática. Se logra construir el conjunto de datos objetivo y la arquitectura SSD con red base Inception V3. La arquitectura logró la detección satisfactoria de las características propuestas luego de ser entrenada con el conjunto de datos, y se discuten ciertos elementos que podrían ser mejorados en futuras experiencias.
APA, Harvard, Vancouver, ISO, and other styles
9

Bermúdez-Rojas, Jesús Guillermo, Jorge Enrique Luna-Taylor, Fernando Daniel Von-Borstel-Luna, and Jesús Alberto Sandoval-Galarza. "Detección del nivel de estrés hídrico en plantas de lechuga romana a través de CNN." Pädi Boletín Científico de Ciencias Básicas e Ingenierías del ICBI 11, Especial2 (2023): 39–46. http://dx.doi.org/10.29057/icbi.v11iespecial2.10943.

Full text
Abstract:
La agricultura en México enfrenta importantes desafíos en el área del agua. Una alternativa para enfrentar este problema es la implementación de técnicas agrícolas modernas que permitan métodos de agricultura de precisión en invernaderos que puedan producir durante todas las estaciones del año y con un uso más eficiente del agua. Para ello son necesarios sistemas inteligentes que permitan monitorear y controlar los recursos para el crecimiento de las plantas de acuerdo a las condiciones que presenten. Este artículo describe el diseño y entrenamiento de una red neuronal convolucional (CNN) para detectar el grado de deshidratación de plantas de lechuga romana a través de imágenes. Los experimentos muestran una precisión y sensibilidad del modelo del 83% en la identificación del nivel de deshidratación y del 98,8% en ambas métricas, considerando una tolerancia de más/menos un nivel de diferencia con respecto al real.
APA, Harvard, Vancouver, ISO, and other styles
10

Guevara Cruz, Ronny Stalin, and Claudio Augusto Delrieux. "Aplicación de redes neuronales densas y convolucionales para detección de COVID_19 en imágenes de rayos X." Revista Conectividad 4, no. 2 (2023): 19–32. http://dx.doi.org/10.37431/conectividad.v4i2.78.

Full text
Abstract:
Las redes neuronales convolucionales (CNN) tienen gran potencial en resolver problemas de clasificación con imágenes. La presente investigación tiene como objetivo presentar modelos reducidos que permita identificar casos de neumonía y COVID-19 en imágenes de rayos X de tórax(anterior-posterior), ofreciendo una amplia perspectiva del interés de herramientas que brindan soporte y asistencia médica. La capacidad y tamaño de los modelos fueron reducidos hasta obtener una opción perfecta para ser desplegados localmente en dispositivos con recursos limitados. Los algoritmos propuestos se desarrollaron en Google Colab utilizando el lenguaje de programación Python, aplicando redes neuronales densas y convolucionales a diferentes capas hasta obtener un índice de error bajo, para posterior diagnosticar si el paciente presenta COVID-19. Para ello, se utiliza un conjunto de 603 imágenes de alta resolución de bases de datos públicos (ver en https://www.cell.com/cell/fulltext/S0092-8674(18)30154-5 y https://github.com/ieee8023/covid-chestxray-dataset),.divididas en 403 imágenes para entrenamiento, 200 imágenes para prueba y 12 imágenes para validación. La herramienta diseñada con una red neuronal convolucional de 13 capas propone la integración de aprendizaje de maquina (Machine Learning) como soporte en el proceso de diagnóstico médico, con una precisión del 94.73% puede convertirse en una herramienta que brinda mayor velocidad a la hora de dar un diagnóstico.
APA, Harvard, Vancouver, ISO, and other styles
More sources

Dissertations / Theses on the topic "Red neuronal convolucional (CNN)"

1

Kushibar, Kaisar. "Automatic segmentation of brain structures in magnetic resonance images using deep learning techniques." Doctoral thesis, Universitat de Girona, 2020. http://hdl.handle.net/10803/670766.

Full text
Abstract:
This PhD thesis focuses on the development of deep learning based methods for accurate segmentation of the sub-cortical brain structures from MRI. First, we have proposed a 2.5D CNN architecture that combines convolutional and 2/2 spatial features. Second, we proposed a supervised domain adaptation technique to improve the robustness and consistency of deep learning model. Third, an unsupervised domain adaptation method was proposed to eliminate the requirement of manual intervention to train a deep learning model that is robust to differences in the MRI images from multi-centre and multi-scanner datasets. The experimental results for all the proposals demonstrated the effectiveness of our approaches in accurately segmenting the sub-cortical brain structures and has shown state-of-the-art performance on well-known publicly available datasets<br>Esta tesis doctoral se centra en el desarrollo de métodos basados en el aprendizaje profundo para la segmentación precisa de las estructuras cerebrales subcorticales a partir de la resonancia magnética. En primer lugar, hemos propuesto una arquitectura 2.5D CNN que combina características convolucionales y espaciales. En segundo lugar, hemos propuesto una técnica de adaptación de dominio supervisada para mejorar la robustez y la consistencia del modelo de aprendizaje profundo. En tercer lugar, hemos propuesto un método de adaptación de dominio no supervisado para eliminar el requisito de intervención manual para entrenar un modelo de aprendizaje profundo que sea robusto a las diferencias en las imágenes de la resonancia magnética de los conjuntos de datos multicéntricos y multiescáner. Los resultados experimentales de todas las propuestas demostraron la eficacia de nuestros enfoques para segmentar con precisión las estructuras cerebrales subcorticales y han mostrado un rendimiento de vanguardia en los conocidos conjuntos de datos de acceso público
APA, Harvard, Vancouver, ISO, and other styles
2

Giménez, Fayos María Teresa. "Natural Language Processing using Deep Learning in Social Media." Doctoral thesis, Universitat Politècnica de València, 2021. http://hdl.handle.net/10251/172164.

Full text
Abstract:
[ES] En los últimos años, los modelos de aprendizaje automático profundo (AP) han revolucionado los sistemas de procesamiento de lenguaje natural (PLN). Hemos sido testigos de un avance formidable en las capacidades de estos sistemas y actualmente podemos encontrar sistemas que integran modelos PLN de manera ubicua. Algunos ejemplos de estos modelos con los que interaccionamos a diario incluyen modelos que determinan la intención de la persona que escribió un texto, el sentimiento que pretende comunicar un tweet o nuestra ideología política a partir de lo que compartimos en redes sociales. En esta tesis se han propuestos distintos modelos de PNL que abordan tareas que estudian el texto que se comparte en redes sociales. En concreto, este trabajo se centra en dos tareas fundamentalmente: el análisis de sentimientos y el reconocimiento de la personalidad de la persona autora de un texto. La tarea de analizar el sentimiento expresado en un texto es uno de los problemas principales en el PNL y consiste en determinar la polaridad que un texto pretende comunicar. Se trata por lo tanto de una tarea estudiada en profundidad de la cual disponemos de una vasta cantidad de recursos y modelos. Por el contrario, el problema del reconocimiento de personalidad es una tarea revolucionaria que tiene como objetivo determinar la personalidad de los usuarios considerando su estilo de escritura. El estudio de esta tarea es más marginal por lo que disponemos de menos recursos para abordarla pero que no obstante presenta un gran potencial. A pesar de que el enfoque principal de este trabajo fue el desarrollo de modelos de aprendizaje profundo, también hemos propuesto modelos basados en recursos lingüísticos y modelos clásicos del aprendizaje automático. Estos últimos modelos nos han permitido explorar las sutilezas de distintos elementos lingüísticos como por ejemplo el impacto que tienen las emociones en la clasificación correcta del sentimiento expresado en un texto. Posteriormente, tras estos trabajos iniciales se desarrollaron modelos AP, en particular, Redes neuronales convolucionales (RNC) que fueron aplicadas a las tareas previamente citadas. En el caso del reconocimiento de la personalidad, se han comparado modelos clásicos del aprendizaje automático con modelos de aprendizaje profundo, pudiendo establecer una comparativa bajo las mismas premisas. Cabe destacar que el PNL ha evolucionado drásticamente en los últimos años gracias al desarrollo de campañas de evaluación pública, donde múltiples equipos de investigación comparan las capacidades de los modelos que proponen en las mismas condiciones. La mayoría de los modelos presentados en esta tesis fueron o bien evaluados mediante campañas de evaluación públicas, o bien emplearon la configuración de una campaña pública previamente celebrada. Siendo conscientes, por lo tanto, de la importancia de estas campañas para el avance del PNL, desarrollamos una campaña de evaluación pública cuyo objetivo era clasificar el tema tratado en un tweet, para lo cual recogimos y etiquetamos un nuevo conjunto de datos. A medida que avanzabamos en el desarrollo del trabajo de esta tesis, decidimos estudiar en profundidad como las RNC se aplicaban a las tareas de PNL. En este sentido, se exploraron dos líneas de trabajo. En primer lugar, propusimos un método de relleno semántico para RNC, que plantea una nueva manera de representar el texto para resolver tareas de PNL. Y en segundo lugar, se introdujo un marco teórico para abordar una de las críticas más frecuentes del aprendizaje profundo, el cual es la falta de interpretabilidad. Este marco busca visualizar qué patrones léxicos, si los hay, han sido aprendidos por la red para clasificar un texto.<br>[CA] En els últims anys, els models d'aprenentatge automàtic profund (AP) han revolucionat els sistemes de processament de llenguatge natural (PLN). Hem estat testimonis d'un avanç formidable en les capacitats d'aquests sistemes i actualment podem trobar sistemes que integren models PLN de manera ubiqua. Alguns exemples d'aquests models amb els quals interaccionem diàriament inclouen models que determinen la intenció de la persona que va escriure un text, el sentiment que pretén comunicar un tweet o la nostra ideologia política a partir del que compartim en xarxes socials. En aquesta tesi s'han proposats diferents models de PNL que aborden tasques que estudien el text que es comparteix en xarxes socials. En concret, aquest treball se centra en dues tasques fonamentalment: l'anàlisi de sentiments i el reconeixement de la personalitat de la persona autora d'un text. La tasca d'analitzar el sentiment expressat en un text és un dels problemes principals en el PNL i consisteix a determinar la polaritat que un text pretén comunicar. Es tracta per tant d'una tasca estudiada en profunditat de la qual disposem d'una vasta quantitat de recursos i models. Per contra, el problema del reconeixement de la personalitat és una tasca revolucionària que té com a objectiu determinar la personalitat dels usuaris considerant el seu estil d'escriptura. L'estudi d'aquesta tasca és més marginal i en conseqüència disposem de menys recursos per abordar-la però no obstant i això presenta un gran potencial. Tot i que el fouc principal d'aquest treball va ser el desenvolupament de models d'aprenentatge profund, també hem proposat models basats en recursos lingüístics i models clàssics de l'aprenentatge automàtic. Aquests últims models ens han permès explorar les subtileses de diferents elements lingüístics com ara l'impacte que tenen les emocions en la classificació correcta del sentiment expressat en un text. Posteriorment, després d'aquests treballs inicials es van desenvolupar models AP, en particular, Xarxes neuronals convolucionals (XNC) que van ser aplicades a les tasques prèviament esmentades. En el cas de el reconeixement de la personalitat, s'han comparat models clàssics de l'aprenentatge automàtic amb models d'aprenentatge profund la qual cosa a permet establir una comparativa de les dos aproximacions sota les mateixes premisses. Cal remarcar que el PNL ha evolucionat dràsticament en els últims anys gràcies a el desenvolupament de campanyes d'avaluació pública on múltiples equips d'investigació comparen les capacitats dels models que proposen sota les mateixes condicions. La majoria dels models presentats en aquesta tesi van ser o bé avaluats mitjançant campanyes d'avaluació públiques, o bé s'ha emprat la configuració d'una campanya pública prèviament celebrada. Sent conscients, per tant, de la importància d'aquestes campanyes per a l'avanç del PNL, vam desenvolupar una campanya d'avaluació pública on l'objectiu era classificar el tema tractat en un tweet, per a la qual cosa vam recollir i etiquetar un nou conjunt de dades. A mesura que avançàvem en el desenvolupament del treball d'aquesta tesi, vam decidir estudiar en profunditat com les XNC s'apliquen a les tasques de PNL. En aquest sentit, es van explorar dues línies de treball.En primer lloc, vam proposar un mètode d'emplenament semàntic per RNC, que planteja una nova manera de representar el text per resoldre tasques de PNL. I en segon lloc, es va introduir un marc teòric per abordar una de les crítiques més freqüents de l'aprenentatge profund, el qual és la falta de interpretabilitat. Aquest marc cerca visualitzar quins patrons lèxics, si n'hi han, han estat apresos per la xarxa per classificar un text.<br>[EN] In the last years, Deep Learning (DL) has revolutionised the potential of automatic systems that handle Natural Language Processing (NLP) tasks. We have witnessed a tremendous advance in the performance of these systems. Nowadays, we found embedded systems ubiquitously, determining the intent of the text we write, the sentiment of our tweets or our political views, for citing some examples. In this thesis, we proposed several NLP models for addressing tasks that deal with social media text. Concretely, this work is focused mainly on Sentiment Analysis and Personality Recognition tasks. Sentiment Analysis is one of the leading problems in NLP, consists of determining the polarity of a text, and it is a well-known task where the number of resources and models proposed is vast. In contrast, Personality Recognition is a breakthrough task that aims to determine the users' personality using their writing style, but it is more a niche task with fewer resources designed ad-hoc but with great potential. Despite the fact that the principal focus of this work was on the development of Deep Learning models, we have also proposed models based on linguistic resources and classical Machine Learning models. Moreover, in this more straightforward setup, we have explored the nuances of different language devices, such as the impact of emotions in the correct classification of the sentiment expressed in a text. Afterwards, DL models were developed, particularly Convolutional Neural Networks (CNNs), to address previously described tasks. In the case of Personality Recognition, we explored the two approaches, which allowed us to compare the models under the same circumstances. Noteworthy, NLP has evolved dramatically in the last years through the development of public evaluation campaigns, where multiple research teams compare the performance of their approaches under the same conditions. Most of the models here presented were either assessed in an evaluation task or either used their setup. Recognising the importance of this effort, we curated and developed an evaluation campaign for classifying political tweets. In addition, as we advanced in the development of this work, we decided to study in-depth CNNs applied to NLP tasks. Two lines of work were explored in this regard. Firstly, we proposed a semantic-based padding method for CNNs, which addresses how to represent text more appropriately for solving NLP tasks. Secondly, a theoretical framework was introduced for tackling one of the most frequent critics of Deep Learning: interpretability. This framework seeks to visualise what lexical patterns, if any, the CNN is learning in order to classify a sentence. In summary, the main achievements presented in this thesis are: - The organisation of an evaluation campaign for Topic Classification from texts gathered from social media. - The proposal of several Machine Learning models tackling the Sentiment Analysis task from social media. Besides, a study of the impact of linguistic devices such as figurative language in the task is presented. - The development of a model for inferring the personality of a developer provided the source code that they have written. - The study of Personality Recognition tasks from social media following two different approaches, models based on machine learning algorithms and handcrafted features, and models based on CNNs were proposed and compared both approaches. - The introduction of new semantic-based paddings for optimising how the text was represented in CNNs. - The definition of a theoretical framework to provide interpretable information to what CNNs were learning internally.<br>Giménez Fayos, MT. (2021). Natural Language Processing using Deep Learning in Social Media [Tesis doctoral]. Universitat Politècnica de València. https://doi.org/10.4995/Thesis/10251/172164<br>TESIS
APA, Harvard, Vancouver, ISO, and other styles
3

Madadi, Meysam. "Human segmentation, pose estimation and applications." Doctoral thesis, Universitat Autònoma de Barcelona, 2017. http://hdl.handle.net/10803/457900.

Full text
Abstract:
El análisis automático de seres humanos en fotografías o videos tiene grandes aplicaciones dentro de la visión por computador, incluyendo diagnóstico médico, deportes, entretenimiento, edición de películas y vigilancia, por nombrar sólo algunos. El cuerpo, la cara y la mano son los componentes más estudiados de los seres humanos. El cuerpo tiene muchas variabilidades en la forma y la ropa junto con altos grados de libertad en pose. La cara está compuesta por multitud de músculos, causando muchas deformaciones visibles, diferentes formas, y variabilidad en cabello. La mano es un objeto pequeño, que se mueve rápido y tiene altos grados de libertad. La adición de características humanas a todas las variabilidades antes mencionadas hace que el análisis humano sea una tarea muy difícil. En esta tesis, desarrollamos la segmentación humana en diferentes modalidades. En un primer escenario, segmentamos el cuerpo humano y la mano en imágenes de profundidad utilizando la forma basada en la deformación de forma. Desarrollamos un descriptor de forma basado en el contexto de forma y las probabilidades de clase de regiones de forma para extraer vecinos más cercanos. Consideramos entonces la alineación afın rígida frente a la deformación de forma iterativa no rígida. En un segundo escenario, segmentamos la cara en imágenes RGB usando redes neuronales convolucionales (CNN). Modelamos los Conditional Random Field con redes neuronales recurrentes. En nuestro modelo, los núcleos de pares no son fijos y aprendidos durante el entrenamiento. Hemos entrenado la red de extremo-a-extremo utilizando redes adversarias que mejoraron la segmentación del pelo con un alto margen. También hemos trabajado en la estimación de pose de manos 3D en imágenes de profundidad. En un enfoque generativo, se ajustó un modelo de dedo por separado para cada dedo. Minimizamos una función de energía basada en el área de superposición, la discrepancia de profundidad y las colisiones de los dedos. También se aplican modelos lineales en el espacio de la trayectoria articular para refinar las articulaciones ocluidas basadas en el error de las articulaciones visibles y la suavidad de la trayectoria invisible de las articulaciones. En un enfoque basado en CNN, desarrollamos una red de estructura de árbol para entrenar características específicas para cada dedo y las fusionamos para la consistencia de la pose global. También formulamos restricciones físicas y de apariencia como funciones de pérdida de la red. Finalmente, desarrollamos una serie de aplicaciones que consisten en mediciones biométricas humanas y retextura de prendas de vestir. También hemos generado algunos conjuntos de datos en esta tesis sobre diferentes tópicos del análisis de personas, que incluyen problemas de segmentación, manos sintéticas, ropa para retextura, y reconocimiento de gestos.<br>Automatic analyzing humans in photographs or videos has great potential applications in computer vision containing medical diagnosis, sports, entertainment, movie editing and surveillance, just to name a few. Body, face and hand are the most studied components of humans. Body has many variabilities in shape and clothing along with high degrees of freedom in pose. Face has many muscles causing many visible deformity, beside variable shape and hair style. Hand is a small object, moving fast and has high degrees of freedom. Adding human characteristics to all aforementioned variabilities makes human analysis quite a challenging task.  In this thesis, we developed human segmentation in different modalities. In a first scenario, we segmented human body and hand in depth images using example-based shape warping. We developed a shape descriptor based on shape context and class probabilities of shape regions to extract nearest neighbors. We then considered rigid affine alignment vs. non-rigid iterative shape warping. In a second scenario, we segmented face in RGB images using convolutional neural networks (CNN). We modeled conditional random field with recurrent neural networks. In our model pair-wise kernels are not fixed and learned during training. We trained the network end-to-end using adversarial networks which improved hair segmentation by a high margin. We also worked on 3D hand pose estimation in depth images. In a generative approach, we fitted a finger model separately for each finger based on our example-based rigid hand segmentation. We minimized an energy function based on overlapping area, depth discrepancy and finger collisions. We also applied linear models in joint trajectory space to refine occluded joints based on visible joints error and invisible joints trajectory smoothness. In a CNN-based approach, we developed a tree-structure network to train specific features for each finger and fused them for global pose consistency. We also formulated physical and appearance constraints as loss functions. Finally, we developed a number of applications consisting of human soft biometrics measurement and garment retexturing. We also generated some datasets in this thesis consisting of human segmentation, synthetic hand pose, garment retexturing and Italian gestures.
APA, Harvard, Vancouver, ISO, and other styles
4

Albó, Canals Jordi. "Cellular Nonlinear Networks: optimized implementation on FPGA and applications to robotics." Doctoral thesis, Universitat Ramon Llull, 2012. http://hdl.handle.net/10803/82066.

Full text
Abstract:
L'objectiu principal d'aquesta tesi consisteix a estudiar la factibilitat d'implementar un sensor càmera CNN amb plena funcionalitat basat en FPGA de baix cost adequat per a aplicacions en robots mòbils. L'estudi dels fonaments de les xarxes cel•lulars no lineals (CNNs) i la seva aplicació eficaç en matrius de portes programables (FPGAs) s'ha complementat, d'una banda amb el paral•lelisme que s'estableix entre arquitectura multi-nucli de les CNNs i els eixams de robots mòbils, i per l'altre banda amb la correlació dinàmica de CNNs i arquitectures memristive. A més, els memristors es consideren els substituts dels futurs dispositius de memòria flash per la seva capacitat d'integració d'alta densitat i el seu consum d'energia prop de zero. En el nostre cas, hem estat interessats en el desenvolupament d’FPGAs que han deixat de ser simples dispositius per a la creació ràpida de prototips ASIC per esdevenir complets dispositius reconfigurables amb integració de la memòria i els elements de processament general. En particular, s'han explorat com les arquitectures implementades CNN en FPGAs poden ser optimitzades en termes d’àrea ocupada en el dispositiu i el seu consum de potència. El nostre objectiu final ens ah portat a implementar de manera eficient una CNN-UM amb complet funcionament a un baix cost i baix consum sobre una FPGA amb tecnología flash. Per tant, futurs estudis sobre l’arquitectura eficient de la CNN sobre la FPGA i la interconnexió amb els robots comercials disponibles és un dels objectius d'aquesta tesi que se seguiran en les línies de futur exposades en aquest treball.<br>El objetivo principal de esta tesis consiste en estudiar la factibilidad de implementar un sensor cámara CNN con plena funcionalidad basado en FPGA de bajo coste adecuado para aplicaciones en robots móviles. El estudio de los fundamentos de las redes celulares no lineales (CNNs) y su aplicación eficaz en matrices de puertas programables (FPGAs) se ha complementado, por un lado con el paralelismo que se establece entre arquitectura multi -núcleo de las CNNs y los enjambres de robots móviles, y por el otro lado con la correlación dinámica de CNNs y arquitecturas memristive. Además, los memristors se consideran los sustitutos de los futuros dispositivos de memoria flash por su capacidad de integración de alta densidad y su consumo de energía cerca de cero. En nuestro caso, hemos estado interesados en el desarrollo de FPGAs que han dejado de ser simples dispositivos para la creación rápida de prototipos ASIC para convertirse en completos dispositivos reconfigurables con integración de la memoria y los elementos de procesamiento general. En particular, se han explorado como las arquitecturas implementadas CNN en FPGAs pueden ser optimizadas en términos de área ocupada en el dispositivo y su consumo de potencia. Nuestro objetivo final nos ah llevado a implementar de manera eficiente una CNN-UM con completo funcionamiento a un bajo coste y bajo consumo sobre una FPGA con tecnología flash. Por lo tanto, futuros estudios sobre la arquitectura eficiente de la CNN sobre la FPGA y la interconexión con los robots comerciales disponibles es uno de los objetivos de esta tesis que se seguirán en las líneas de futuro expuestas en este trabajo.<br>The main goal of this thesis consists in studying the feasibility to implement a full-functionality CNN camera sensor based on low-cost FPGA device suitable for mobile robotic applications. The study of Cellular Nonlinear Networks (CNNs) fundamentals and its efficient implementation on Field Programmable Gate Arrays (FPGAs) has been complemented, on one side with the parallelism established between multi-core CNN architecture and swarm of mobile robots, and on the other side with the dynamics correlation of CNNs and memristive architectures. Furthermore, memristors are considered the future substitutes of flash memory devices because of its capability of high density integration and its close to zero power consumption. In our case, we have been interested in the development of FPGAs that have ceased to be simple devices for ASIC fast prototyping to become complete reconfigurable devices embedding memory and processing elements. In particular, we have explored how the CNN architectures implemented on FPGAs can be optimized in terms of area occupied on the device or power consumption. Our final accomplishment has been implementing efficiently a fully functional reconfigurable CNN-UM on a low-cost low-power FPGA based on flash technology. Therefore, further studies on an efficient CNN architecture on FPGA and interfacing it with commercially-available robots is one of the objectives of this thesis that will be followed in the future directions exposed in this work.
APA, Harvard, Vancouver, ISO, and other styles
5

Esteves, Sofia Pérsio Eugénio. "CNN-based eye pattern analysis and BER prediction in PAM4 inter-datacenter optical connections impaired by intercore crosstalk." Master's thesis, 2021. http://hdl.handle.net/10071/24298.

Full text
Abstract:
To meet the required future challenge of providing enough bandwidth to achieve high data traffic rates in datacenter links, four-level pulse amplitude modulation (PAM4) signals transmission in short-haul intensity modulation-direct detection datacenters connections supported by homogeneous weakly-coupled multicore fibers has been proposed. However, in such fibers, a physical effect known as inter-core crosstalk (ICXT) limits significantly the performance of short-reach connections by causing large bit error rate (BER) fluctuations that can lead undesirable system outages. In this work, a convolutional neural network (CNN) is proposed for eye-pattern analysis and BER prediction in PAM4 inter-datacenter optical connections impaired by ICXT, with the aim of optical performance monitoring. The performance of the CNN is assessed using the root mean square error (RMSE). Considering PAM4 interdatacenter links with one interfering core and for different skew-symbol rate products, extinction ratios and crosstalk levels, the results show that the implemented CNN is able to predict the BER without surpassing the RMSE limit. The CNNs trained with different optical parameters obtained the best performance in terms of generalization comparing to CNNs trained with specific optical parameters. These results confirm that the CNN-based models can be able to extract features from received eye patterns to predict the BER without prior knowledge of the transmitted signals.<br>De modo a colmatar a necessidade de fornecer largura de banda suficiente para atingir altas taxas de tráfego de dados em ligações entre centros de dados, foi proposta a transmissão de sinais com modulação de impulsos em amplitude com 4 níveis (PAM4) em ligações de curto alcance entre centro de dados com modulação de intensidade e deteção direta suportadas por fibras homogéneas multinúcleo fracamente acopladas. No entanto, neste tipo de fibras, a diafonia entre núcleos (ICXT) limita significativamente o desempenho das ligações, causando grandes flutuações da taxa de erros binários (BER), o que pode conduzir à indisponibilidade da ligação. Neste trabalho, através da análise de diagramas de olho usando uma rede neuronal convolucional (CNN) é estimada a BER em ligações ópticas entre centros de dados PAM4 degradadas por ICXT com o objetivo de monitorização do desempenho. Para avaliar o desempenho da CNN é usada como métrica a raiz do erro quadrático médio (RMSE). Para diferentes atrasos de propagação entre núcleos, razões de extinção e níveis de diafonia, a CNN é capaz de prever BERs sem ultrapassar o limite estabelecido para o RMSE. As CNNs treinadas com diferentes parâmetros ópticos obtiveram o melhor desempenho em termos de generalização em comparação com CNNs treinadas com parâmetros ópticos específicos. Estes resultados confirmam que os modelos baseados em CNN são capazes de extrair informação a partir de imagens de diagramas de olhos, prevendo a BER sem conhecimento prévio dos sinais transmitidos.
APA, Harvard, Vancouver, ISO, and other styles

Book chapters on the topic "Red neuronal convolucional (CNN)"

1

Cabrera, Juan José, Sergio Cebollada, Mónica Ballesta, Luis M. Jiménez, Luis Payá, and Óscar Reinoso. "Entrenamiento, optimización y validación de una CNN para localización jerárquica mediante imágenes omnidireccionales." In XLII JORNADAS DE AUTOMÁTICA : LIBRO DE ACTAS. Servizo de Publicacións da UDC, 2021. http://dx.doi.org/10.17979/spudc.9788497498043.640.

Full text
Abstract:
El objetivo del presente trabajo es abordar la localización de un robot móvil mediante el entrenamiento de una Red Neuronal Convolucional (CNN) de manera que se obtengan unos resultados óptimos. El problema de localización se aborda de forma jerárquica empleando un sistema catadióptrico omnidireccional y se trabaja directamente con las imágenes capturadas sin pasar a panorámicas, ahorrando así el tiempo de cálculo asociado a este proceso. La localización se lleva a cabo en dos pasos y en ambos se emplea la arquitectura de la CNN con diferentes objetivos. Primero se lleva a cabo una localización gruesa que consiste en identificar la estancia en la que se encuentra el robot por medio de la CNN. Después se realiza una localización fina en dicha estancia, en la cual la CNN es empleada para la obtención de descriptores holísticos a partir de las capas intermedias de la red. Estos descriptores globales permiten encontrar la posición donde se encuentra el robot de manera más precisa por medio de una búsqueda del vecino más cercano, comparando el descriptor correspondiente de la imagen test con los descriptores de las imágenes capturadas en la estancia seleccionada en el primer paso. Con el fin de mejorar el desempeño de la red se recurre a un aumento de datos y a una optimización bayesiana de hiperparámetros. Estas técnicas demuestran ser una solución eficiente y robusta para afrontar el problema de localización tal y como se muestra en la sección de experimentos.
APA, Harvard, Vancouver, ISO, and other styles
2

Bustos Castelblanco, Andrés Julián, and Sonia Jaramillo Valbuena. "Capítulo 12: Comparación del rendimiento de CPU, CUDA y MPS para el entrenamiento de modelos de aprendizaje profundo: un análisis empírico." In Gestión del conocimiento. Perspectiva multidisciplinaria (libro 75). Fondo Editorial de la Universidad Nacional Experimental Sur del Lago, Jesús María Semprum (UNESUR), 2025. https://doi.org/10.59899/ges-cono-75-c12.

Full text
Abstract:
Este estudio presenta un análisis empírico sobre el rendimiento de dispositivos computacionales: CPU, NVIDIA CUDA® y Metal Performance Shaders (MPS) de Apple, en el entrenamiento de modelos de aprendizaje profundo. Utilizando el conjunto de datos FashionMNIST. Se entrenó una red neuronal convolucional (CNN) en cada dispositivo, midiendo el tiempo de entrenamiento y la precisión del modelo. Las pruebas estadísticas, incluyendo Shapiro-Wilk, Levene y Kruskal-Wallis, determinaron la normalidad, igualdad de varianzas y diferencias significativas en los métricos de rendimiento. Los resultados indican que CUDA y MPS reducen el tiempo de entrenamiento en un 54,05% y 66,75%, respectivamente, en comparación con CPU, y que MPS supera a CUDA en un 27,63%. No se observaron diferencias significativas en la precisión. Estos hallazgos subrayan el potencial de MPS para democratizar el acceso al aprendizaje profundo en dispositivos móviles y domésticos.
APA, Harvard, Vancouver, ISO, and other styles
3

Jaramillo Valbuena, Sonia, Jorge Iván Triviño, and Jorge Iván Marín Hurtado. "Capítulo 18: Reconocimiento de Melanoma y Nevus Melanocítico mediante la aplicación de ResNet50." In Gestión del conocimiento. Perspectiva multidisciplinaria (libro 75). Fondo Editorial de la Universidad Nacional Experimental Sur del Lago, Jesús María Semprum (UNESUR), 2025. https://doi.org/10.59899/ges-cono-75-c18.

Full text
Abstract:
El reconocimiento de imágenes mediante redes neuronales convolucionales (CNN) ha transformado el análisis de datos en la medicina, ofreciendo nuevas herramientas para la detección temprana de enfermedades de la piel a partir del procesamiento automatizado de imágenes. En los últimos años, los modelos de aprendizaje profundo han demostrado una notable capacidad para clasificar imágenes dermatoscópicas, con un alto nivel de exactitud. Es por ello, que su uso se ha extendido para apoyar procesos de diagnóstico de enfermedades, tales como el melanoma, siendo este un reto crucial debido a la alta tasa de mortalidad cuando no se detecta a tiempo. Este estudio explora la aplicación de una red neuronal residual, denominada ResNet50, en la clasificación de lesiones cutáneas utilizando el dataset HAM10000. Para optimizar el desempeño del modelo, se implementan técnicas de preprocesamiento, como normalización de imágenes, imputación de valores faltantes y el uso de técnicas de Data augmentation. Ademas, se toman medidas para evitar el sobreajuste. Los resultados permiten evidenciar que el modelo ResNet50 el modelo clasifica correctamente aproximadamente el 76% de los casos, con una alta tasa de aciertos en lesiones benignas, aunque con algunos falsos negativos en melanoma.
APA, Harvard, Vancouver, ISO, and other styles
4

Loaiza Pérez, Daniel Alejandro, Cristian Giovanny Sánchez Pineda, and Sonia Jaramillo Valbuena. "Capítulo 5: Análisis de Sentimientos sobre choques culturales en contextos deportivos." In Gestión del conocimiento. Perspectiva multidisciplinaria (libro 65). Fondo Editorial de la Universidad Nacional Experimental Sur del Lago, Jesús María Semprum (UNESUR), 2024. http://dx.doi.org/10.59899/ges-cono-65-c5.

Full text
Abstract:
En este artículo se realiza un análisis de sentimientos en datos recopilados de redes sociales, con un enfoque particular en eventos deportivos relevantes. Debido a la vasta cantidad de información disponible en plataformas en línea, se señala el desafío inherente al procesar datos no estructurados, como texto, imágenes y videos. A través de una revisión de estudios relacionados, se examinan diferentes enfoques y técnicas utilizadas para comprender las actitudes y percepciones de las personas en contextos diversos. Además, se realiza una experimentación con dos modelos, una red neuronal convolucional y un árbol de decisión. Los resultados obtenidos muestran permiten evidenciar que la red neuronal obtuvo una exactitud superior sobre el árbol de decisión.
APA, Harvard, Vancouver, ISO, and other styles
5

Sánchez Pineda, Cristian Giovanny, Sonia Jaramillo Valbuena, and Jorge Iván Triviño. "Capítulo 4: Aplicación de Redes Neuronales para clasificación de texto sobre entrevistas médicas del corpus DAIC-WoZ." In Gestión del conocimiento. Perspectiva multidisciplinaria (libro 65). Fondo Editorial de la Universidad Nacional Experimental Sur del Lago, Jesús María Semprum (UNESUR), 2024. http://dx.doi.org/10.59899/ges-cono-65-c4.

Full text
Abstract:
La depresión, uno de los trastornos mentales más prevalentes en la sociedad actual, ejerce un impacto negativo significativo en la calidad de vida de las personas que la padecen. La Organización Mundial de la Salud (OMS) la reconoce como una causa fundamental de discapacidad a nivel global. Los afectados experimentan una gama de emociones desafiantes, tales como soledad, tristeza, desesperanza y pensamientos suicidas, entre otros. En la investigación de problemas de salud mental, se han empleado técnicas de aprendizaje de máquina tanto supervisadas como no supervisadas para discernir tendencias y patrones a partir de conjuntos de datos y corpus relacionados. Este artículo presenta la aplicación de dos enfoques de Redes Neuronales: una Red Neuronal Convolucional Profunda y una Red Neuronal Recurrente. Estas se valen de BERT y TextVectorization, respectivamente, como métodos de tokenización. Los resultados derivados del proceso de modelado revelaron una exactitud cercana al 70% al emplear la Red Neuronal Recurrente.
APA, Harvard, Vancouver, ISO, and other styles
6

Galán-Cuenca, Álvaro, Ricardo Vázquez-Martín, Anthony Mandow, Jesús Morales, and Alfonso García-Cerezo. "Análisis de técnicas de aumento de datos y entrenamiento en YOLOv3 para detección de objetos en imágenes RGB y TIR del UMA-SAR Dataset." In XLII JORNADAS DE AUTOMÁTICA : LIBRO DE ACTAS. Servizo de Publicacións da UDC, 2021. http://dx.doi.org/10.17979/spudc.9788497498043.686.

Full text
Abstract:
El uso de imágenes de los espectros visible (RGB) e infrarrojo térmico (TIR) para la detección de objetos puede resultar crucial en aplicaciones donde las condiciones de visibilidad están limitadas, como la robótica para búsqueda y rescate en catástrofes. Para ello resulta beneficioso analizar cómo las técnicas de aprendizaje profundo basadas en redes neuronales convolucionales (CNN) pueden aplicarse a ambas modalidades. En este artículo se analizan diferentes configuraciones y parámetros para el entrenamiento de CNN tanto para imágenes térmicas como para imágenes equivalentes del espectro visible. En concreto, se aborda el problema del sobre-entrenamiento para determinar una configuración eficaz de técnicas de aumento de datos y parada temprana. El caso de estudio se ha realizado con la red de código abierto YOLOv3, pre-entrenada con el dataset RGB COCO y optimizada (o re-entrenada) con el conjunto público de datos UMA-SAR dataset, que incluye pares de imágenes RGB y TIR obtenidas en ejercicios realistas de rescate.
APA, Harvard, Vancouver, ISO, and other styles
7

Flores, María, David Valiente, Arturo Gil, Oscar Reinoso, and Luis Payá. "Creación y análisis de vistas 360 a partir de un par de imágenes fisheye." In XLIII Jornadas de Automática: libro de actas: 7, 8 y 9 de septiembre de 2022, Logroño (La Rioja), 2022nd ed. Servizo de Publicacións da UDC, 2022. http://dx.doi.org/10.17979/spudc.9788497498418.0985.

Full text
Abstract:
Los sistemas de visión conformados por dos lentes fisheye posicionadas de forma que cubran un campo de visión de 360° presentan grandes ventajas, como la posibilidad de obtener una vista 360 de alta calidad, que puede ser usada en otras tareas de alto nivel. Haciendo uso de una cámara comercial de este tipo, el principal objetivo del trabajo consiste en el desarrollo de métodos para la obtención de una vista 360 y la evaluación de la calidad de la misma, comparándola con la vista 360 generada por la propia cámara. Inicialmente, el algoritmo realiza una proyección de cada imagen fisheye a formato equirectangular, lo cual facilita el posterior stitching necesario para componer la vista 360. Para ello, se han implementado dos procedimientos que permiten realizar la proyección sobre la esfera unidad. Con objeto de determinar automáticamente la calidad de la vista 360 obtenida, y así poder compararla con la generada por la propia cámara, se propone un algoritmo basado en una red neuronal convolucional que extrae descriptores de apariencia global de las escenas. La comparación entre descriptores permitirá determinar la calidad relativa de la vista obtenida. Los resultados muestran que, en aquellos casos en los que la zona de solape es rica en información visual, una de las imágenes que generamos es mejor que la proporcionada por la cámara.
APA, Harvard, Vancouver, ISO, and other styles

Conference papers on the topic "Red neuronal convolucional (CNN)"

1

León León, Ryan A., Carol A. Barrantes Vargas, and Fernando D. Bacilio De La Cruz. "Desarrollo de un Sistema de Visión Artificial con la Red Neuronal Convolucional (YOLO v8) para Clasificar el Arándano por su Grado de Madurez." In Vigésima Tercera Conferencia Iberoamericana en Sistemas, Cibernética e Informática. International Institute of Informatics and Cybernetics, 2024. http://dx.doi.org/10.54808/cisci2024.01.475.

Full text
APA, Harvard, Vancouver, ISO, and other styles
2

Pincay Lozada, Jorge, Luis Fernando Mulcue Nieto, and Jesús Alfonso López Sotelo. "Red neuronal convolucional para el diagnóstico de módulos fotovoltaicos." In Nuevas realidades para la educación en ingeniería: currículo, tecnología, medio ambiente y desarrollo. Asociación Colombiana de Facultades de Ingeniería - ACOFI, 2022. http://dx.doi.org/10.26507/paper.2563.

Full text
Abstract:
A través de este documento se presenta el marco de trabajo y los avances parciales de la investigación que pretende acondicionar el uso de técnicas de aprendizaje profundo, para diagnosticar fallas de los módulos fotovoltaicos en operación, con base en las termografías como principal insumo de entrada para una red neuronal convolucional, y así obtener una guía en el diagnóstico y detección de fallos por cada módulo fotovoltaico – PV en funcionamiento. Bajo un método de investigación deductivo con enfoque mixto que aborda aspectos tanto cuantitativos como cualitativos, donde posteriormente se evalúa la eficiencia lograda del algoritmo de inteligencia artificial – IA, mediante rangos porcentuales de aciertos de falsos positivos y falsos negativos, siendo así de tipo exploratoria en el uso de redes neuronales convolucionales, este proyecto concluye en la viabilidad de hacer uso de herramientas de IA para diagnosticar sistemas de generación fotovoltaica en sitio, y con sugerencia diagnostica del posible fallo que cada módulo de captación pueda estar sobrellevando en el momento de ser captado por medio de una imagen de espectro infrarrojo. Con lo anterior se puede mejorar la interconexión de los módulos para corregir su proceso de conversión energético, creando así una mejora en eficiencia general del sistema, así como los tiempos de retorno de inversión, lo que se espera redunde un impacto en el uso de masivo de este tipo de sistemas para la obtención de energía eléctrica haciendo uso de fuentes alternativas.
APA, Harvard, Vancouver, ISO, and other styles
3

Massiris, Manlio, Claudio Delrieux, and J. Álvaro Fernández. "Detección de equipos de protección personal mediante red neuronal convolucional YOLO." In XXXIX Jornadas de Automática. Universidade da Coruña. Servizo de Publicacións, 2020. http://dx.doi.org/10.17979/spudc.9788497497565.1022.

Full text
APA, Harvard, Vancouver, ISO, and other styles
4

Narváez, Guillermo Eduardo. "Red neuronal convolucional para la detección de aves exóticas en peligro de extinción." In Congreso Internacional de Ingeniería de Sistemas. Universidad de Lima, 2020. http://dx.doi.org/10.26439/ciis2019.5513.

Full text
Abstract:
En los últimos años, los índices de comercialización ilegal de animales se han incrementado debido a la falta de conciencia sobre el cuidado y la preservación de nuestro ecosistema. Entre los años 2000 y 2015, 67 749 animales silvestres fueron extraídos del Perú de manera ilegal. Entre ellos 29 591 eran aves exóticas (43 %), 26 951 anfibios (40 %), 8600 reptiles (13 %) y 2607 mamíferos (4 %); valorizados en mil dólares, aproximadamente. La propuesta para reducir significativamente estos actos ilícitos se basa en contar con un aplicativo que pueda identificar a las especies que se intentan comercializar ilegalmente. Dicho aplicativo hará uso de las arquitecturas de las redes neuronales convolucionales denominada VGGnet16, la cual permitirá identificar correctamente al animal. Se ha trabajado con una base de datos de animales reales obteniéndose una efectividad del 89 %.
APA, Harvard, Vancouver, ISO, and other styles
5

Sánchez- González, F. J., M. O. Rodríguez - López, D. U. Campos- Delgado, and Javier A. Jo. "Clasificación Automática de Imágenes m-FLIM por Redes Convolucionales." In XLI Congreso Nacional de Ingeniería Biomédica. Sociedad Mexicana de Ingeniería Biomédica, 2018. http://dx.doi.org/10.24254/cnib.18.14.

Full text
Abstract:
En este trabajo se explora el uso de imágenes multi-espectrales microscópicas de tiempo de vida fluorescente (m-FLIM), pertenecientes a segmentos de arteria coronaria postmortem con arteriosclerosis, para detectar trescomportamientos en los componentes orgánicos: alto contenido de colágeno (HC), alto contenido de lípidos (HL) y bajo contenido de colágeno y lípidos (LCL). El objetivo de este trabajo es la clasificación automática de las muestras m-FLIM mediante una red neuronal convolucional cuyos parámetros se ajustan a través de la información proporcionada por las muestras puras de estos componentes bajo una filosofía supervisada. Enseguida se realiza un estudio comparativo con un algoritmo basado en separación lineal y optimización cuadrática para la clasificación de las muestras. Los resultados muestran que la red neuronal convolucional puede generar una clasificación precisa y con baja complejidad
APA, Harvard, Vancouver, ISO, and other styles
6

Rodríguez Ortega, Nuria, Javier De la Rosa, Gabriel Ruiz Gonzálvez, María Ortiz Tello, and Leticia Crespillo Marí. "Poscatálogo." In Congreso CIMED - I Congreso Internacional de Museos y Estrategias Digitales. Universitat Politècnica de València, 2021. http://dx.doi.org/10.4995/cimed21.2021.12487.

Full text
Abstract:
La instalación inmersiva Postcatálogo (https://youtu.be/nuc-LUW2W3s), realizada ad hoc para la exposición Catálogos desencadenados organizada por el Vicerrectorado de Cultura de la Universidad de Málaga (17-12-2020, 29-01-2021), aborda dos líneas de indagación. En primer lugar, trata de responder a la pregunta: ¿cómo hacer físicamente experimentables los espacios de alta dimensión, ininteligibles para la cognición humana, asociados (entre otras cosas) al procesamiento computacional de imágenes? En segundo lugar, se plantea: ¿de qué modo la función ordenadora constitutiva de los catálogos tomará forma en una ecología medial donde la centralidad que hasta hace poco ocupaba el artefacto libro se está desplazando hacia nuevos contextos configurados por realidades mixtas que incluyen al sujeto como entidad activa en su polívoca dimensión cognitivo-emocional? Para materializar de una manera concreta esta indagación, tomamos como base el conocido diagrama que Alfred J. Barr publicó con la cubierta del catálogo de la exposición Cubism and Abstract Art organizada por el MOMA en 1936. Como es bien sabido, en este diagrama Alfred J. Barr representó el devenir de las poéticas artísticas que habían ido surgiendo durante las primeras décadas del siglo XX, estableciendo relaciones genealógicas entre ellas de acuerdo con su concepción teleológica del arte. En una primera fase, transformamos este diagrama en un espacio de alta dimensión en el que las obras correspondientes a los ismos y poéticas presentes en el diagrama se distribuyen en clústeres según las similitudes visuales detectadas por una red neuronal convolucional Inception. De este modo, la distancia entre las imágenes, transformadas en vectores numéricos, es significativa de su mayor o menor grado de similitud visual, matemáticamente computada. El resultado de este primer experimento fue el proyecto Barr X Inception CNN (http://barrxcnn.hdplus.es/), el cual nos permitió reflexionar sobre las similitudes y diferencias existentes entre la visión humana –con sus capas de modelación cultural, disciplinar, epistemológica y subjetiva- y la visión artificial, que opera mediante modelos matemáticos y cálculo probabilístico. En una segunda fase, nos propusimos reformular el espacio bidimensional que genera el algoritmo de distribución UMAP en una instalación inmersiva que hace posible el que podamos deambular por el campo visual generado por la Inception CNN y experimentar físicamente la distancia entre las imágenes. La instalación permite pasear de manera aleatoria por el campo visual; seleccionar visitar un clúster determinado; o comprobar cómo se distribuyen en este espacio computacional los ismos y poéticas representados en el diagrama de Barr, lo cual hace visible y físicamente experimentable las diferencias que existen entre los agrupamientos estilísticos propios de la epistemología histórico-artística y los agrupamientos computacionales de la cognición maquínica. Consideramos que Poscatálogo es un ejemplo de cómo se pueden emplear las tecnologías de desarrollo virtual e inmersivo para plantear argumentos complejos más allá de su uso como reproducción-recreación-simulación de realidad. Poscatálogo es una producción de Opossum Studios y el grupo de investigación iArtHis_Lab para el Vicerrectorado de Cultura de la Universidad de Málaga.
APA, Harvard, Vancouver, ISO, and other styles
7

Sotelo, Jason Zavaleta. "Implementación de una Red Neuronal Convolucional para la clasificación de ruido sísmico y señales sísmicas." In 2021 IEEE Congreso Estudiantil de Electrónica y Electricidad (INGELECTRA). IEEE, 2021. http://dx.doi.org/10.1109/ingelectra54297.2021.9748071.

Full text
APA, Harvard, Vancouver, ISO, and other styles
8

López Muñoz, María Lizette, David Asael Gutiérrez Hernández, Víctor Manuel Zamudio Rodríguez, and Carlos Lino Ramírez. "Reconocimiento y parametrización de estomas de muérdago en imágenes de microscopía en RGB." In Ingeniería: una transición hacia el futuro. Asociación Colombiana de Facultades de Ingeniería - ACOFI, 2024. http://dx.doi.org/10.26507/paper.3900.

Full text
Abstract:
Los estomas son poros formados por un par de células oclusivas ubicadas en la epidermis de la planta, los cuáles intervienen en el proceso de transpiración y fotosíntesis. Por otra parte, la obtención manual de características celulares mediante el análisis de imágenes de microscopia resulta ser un trabajo extenuante y prolongado. El presente artículo presenta una metodología para el reconocimiento y obtención de características de los estomas en hojas de muérdago mediante un procesamiento digital de imágenes y la implementación de una red neuronal convolucional conocida como YOLO (You Only Look Once). Se realizó una segmentación semántica de las imágenes y para ello se utilizó el modelo YOLOv8n-seg. Asimismo, se realizó el etiquetado de 510 imágenes aumentadas a través de diversas transformaciones en Roboflow para lograr un total de 779 instancias divididas en tres subconjuntos: 80% para entrenamiento, 13% para validación y 7% para prueba. Los índices de precisión y sensibilidad para la fase de entrenamiento fueron 89.32% y 96.53% respectivamente. Las características estomáticas obtenidas se calcularon con la ayuda de la librería Scikit-Image e incluyen conteo, área, perímetro, excentricidad, ancho y alto del estoma. Finalmente, luego del entrenar el modelo se llevó a cabo una prueba sobre cada uno de canales RGB de la imagen para posteriormente analizar las predicciones hechas por el algoritmo y compararlas entre sí para conocer las diferencias en los resultados obtenidos utilizando los mejores pesos encontrados en la fase de entrenamiento de la red neuronal.
APA, Harvard, Vancouver, ISO, and other styles
9

Forero Vargas, Manuel Guillermo, and José Miguel Santos Naranjo. "EVALUACIÓN DE APROXIMACIONES DE APRENDIZAJE PROFUNDO PARA LA DETECCIÓN DE NÓDULOS PULMONARES EN TC." In Mujeres en ingeniería: empoderamiento, liderazgo y compromiso. Asociacion Colombiana de Facultades de Ingeniería - ACOFI, 2021. http://dx.doi.org/10.26507/ponencia.1820.

Full text
Abstract:
En 2020, según el Observatorio Mundial del Cáncer (GLOBOCAN), 1.796.144 personas murieron de cáncer de pulmón, convirtiéndolo en el cáncer con mayor tasa de mortalidad en todo el mundo. A pesar de que la tasa de supervivencia relativa a 5 años es del 63% cuando el cáncer de pulmón se detecta en un estado temprano (localizado), su diagnóstico prematuro ha sido un gran inconveniente a lo largo de la historia, principalmente porque se realiza a través de la detección de nódulos, que son difíciles de reconocer incluso para radiólogos experimentados. Por esta razón, recientemente se han propuesto retos académicos para los investigadores, donde se proporciona una base de imágenes anotadas por especialistas para desarrollar métodos más eficientes basados en aprendizaje profundo para detectar estos nódulos. Este trabajo presenta la implementación, análisis y evaluación de una técnica que emplea como entradas imágenes 3D, que se utilizan para entrenar una red neuronal convolucional VGG19, la cual fue diseñada para recibir imágenes 2D, logrando una precisión superior al 94%.
APA, Harvard, Vancouver, ISO, and other styles
10

Bardález-Trigoso, Gonzalo, Jean Pablo Bazán-Arzapalo, Junior Fabián, and Pedro Montenegro-Montori. "Detección del SARS-CoV-2 en radiografías de tórax por medio de descriptores intermedios y técnicas de machine learning." In Congreso Internacional de Ingeniería de Sistemas. Universidad de Lima, 2021. http://dx.doi.org/10.26439/ciis2020.5505.

Full text
Abstract:
El SARS-CoV-2, que causa la enfermedad del COVID-19, es un virus que se ha expandido rápidamente por el mundo, teniendo como lugar de inicio la ciudad de Wuhan, en China. A la fecha se han detectado más de 36 738 525 casos a nivel mundial. La tasa de infectados aumenta diariamente y la capacidad sanitaria no se da abasto. Por estas razones, se ha venido proponiendo una variedad de métodos para identificar el novel coronavirus con mayor rapidez y a menor costo. Un ejemplo de estos métodos para identificar la enfermedad es el COVID-Net, una red convolucional que identifica el COVID-19, neumonía o pulmones en condición normal. En este trabajo se propone una metodología para identificar y clasifi car imágenes de radiografías de tórax que tienen el COVID-19, neumonía o sin condición. Para esto se utilizaron extractores de características intermedias: HOG+PCA, SIFT+K-means y SURF+K-means, combinados con un SVM como clasificador; además, se emplearon tres estructuras CNN: VGG19, Densenet121 y MobilnetV2. Se utilizó la base de datos COVIDx3 que consta de 15 476 imágenes radiográficas de pulmón. Se obtuvieron buenos resultados, y se determinó que la mejor de las combinaciones fue la que utilizó MobilnetV2 con aumento de datos obteniendo una sensitividad por clase COVID-19 de 0,97 y en promedio una precisión y sensitividad de 0,92 y 0,91. Debido al contexto de la crisis sanitaria generada por el COVID-19, este trabajo se presenta como un apoyo para la detección de esta enfermedad y como marco de referencia para futuras investigaciones.
APA, Harvard, Vancouver, ISO, and other styles
We offer discounts on all premium plans for authors whose works are included in thematic literature selections. Contact us to get a unique promo code!