Увійти

Готові списки джерел за темами / Codage audio multicanal

Добірка наукової літератури з теми "Codage audio multicanal"

Автор: Grafiati

Опубліковано: 18 листопада 2022

Оформте джерело за APA, MLA, Chicago, Harvard та іншими стилями

Оберіть тип джерела:

Ознайомтеся зі списками актуальних статей, книг, дисертацій, тез та інших наукових джерел на тему "Codage audio multicanal".

Біля кожної праці в переліку літератури доступна кнопка «Додати до бібліографії». Скористайтеся нею – і ми автоматично оформимо бібліографічне посилання на обрану працю в потрібному вам стилі цитування: APA, MLA, «Гарвард», «Чикаго», «Ванкувер» тощо.

Також ви можете завантажити повний текст наукової публікації у форматі «.pdf» та прочитати онлайн анотацію до роботи, якщо відповідні параметри наявні в метаданих.

Зміст

Дисертації

Дисертації з теми "Codage audio multicanal":

1

Lapierre, Jimmy. "Approches paramétriques pour le codage audio multicanal." Mémoire, Université de Sherbrooke, 2007. http://savoirs.usherbrooke.ca/handle/11143/1355.

Повний текст джерела

Стилі APA, Harvard, Vancouver, ISO та ін.

Анотація:

Résumé : Afin de répondre aux besoins de communication et de divertissement, il ne fait aucun doute que la parole et l’audio doivent être encodés sous forme numérique. En qualité CD, cela nécessite un débit numérique de 1411.2 kb/s pour un signal stéréo-phonique. Une telle quantité de données devient rapidement prohibitive pour le stockage de longues durées d’audio ou pour la transmission sur certains réseaux, particulièrement en temps réel (d’où l’adhésion universelle au format MP3). De plus, ces dernières années, la quantité de productions musicales et cinématographiques disponibles en cinq canaux et plus ne cesse d’augmenter. Afin de maintenir le débit numérique à un niveau acceptable pour une application donnée, il est donc naturel pour un codeur audio à bas débit d’exploiter la redondance entre les canaux et la psychoacoustique binaurale. Le codage perceptuel et plus particulièrement le codage paramétrique permet d’atteindre des débits manifestement inférieurs en exploitant les limites de l’audition humaine (étudiées en psychoacoustique). Cette recherche se concentre donc sur le codage paramétrique à bas débit de plus d’un canal audio. // Abstract : In order to fulfill our communications and entertainment needs, there is no doubt that speech and audio must be encoded in digital format. In"CD" quality, this requires a bit-rate of 1411.2 kb/s for a stereo signal. Such a large amount of data quickly becomes prohibitive for long-term storage of audio or for transmitting on some networks, especially in real-time (leading to a universal adhesion to the MP3 format). Moreover, throughout the course of these last years, the number of musical and cinematographic productions available in five channels or more continually increased.In order to maintain an acceptable bit-rate for any given application, it is obvious that a low bit-rate audio coder must exploit the redundancies between audio channels and binaural psychoacoustics. Perceptual audio coding, and more specifically parametric audio coding, offers the possibility of achieving much lower bit-rates by taking into account the limits of human hearing (psychoacoustics). Therefore, this research concentrates on parametric audio coding of more than one audio channel.

2

Lapierre, Jimmy. "Approches paramétriques pour le codage audio multicanal." [S.l. : s.n.], 2007.

Знайти повний текст джерела

Стилі APA, Harvard, Vancouver, ISO та ін.

3

Daniel, Adrien. "Spatial Auditory Blurring and Applications to Multichannel Audio Coding." Phd thesis, Université Pierre et Marie Curie - Paris VI, 2011. http://tel.archives-ouvertes.fr/tel-00623670.

Повний текст джерела

Стилі APA, Harvard, Vancouver, ISO та ін.

Анотація:

Ce travail se place en contexte de télécommunications, et concerne plus particulièrement la transmission de signaux audio multicanaux. Quatre expériences psychoacoustiques ont été menées de façon à étudier la résolution spatiale du système auditif - également appelée flou de localisation - en présence de sons distracteurs. Il en résulte que le flou de localisation augmente quand ces distracteurs sont présents, mettant en évidence ce que nous appellerons le phénomène de "floutage spatial" auditif. Ces expériences estiment l'effet de plusieurs variables sur le floutage spatial : la fréquence de la source sonore considérée ainsi que celles des sources distractrices, leur niveau sonore, leur position spatiale, et le nombre de sources distractrices. Exceptée la position des sources distractrices, toutes ces variables ont montré un effet significatif sur le floutage spatial. Cette thèse aborde également la modélisation de ce phénomène, de sorte que la résolution spatiale auditive puisse être prédite en fonction des caractéristiques de la scène sonore (nombre de sources présentes, leur fréquence, et leur niveau). Enfin, deux schémas de codage audio multicanaux exploitant ce modèle à des fins de réduction de l'information à transmettre sont proposés : l'un basé sur une représentation paramétrique (downmix + paramètres spatiaux) du signal multicanal, et l'autre sur la représentation Higher-Order Ambisonics (HOA). Ces schémas sont tous deux basés sur l'idée originale d'ajuster dynamiquement la précision de la représentation spatiale du signal multicanal de façon à maintenir les distorsions spatiales résultantes dans le flou de localisation, afin que celles-ci restent indétectables.

4

Mahé, Pierre. "Codage ambisonique pour les communications immersives." Thesis, La Rochelle, 2022. http://www.theses.fr/2022LAROS011.

Повний текст джерела

Стилі APA, Harvard, Vancouver, ISO та ін.

Анотація:

Cette thèse s’inscrit dans le contexte de l’essor des contenus immersifs. Depuis quelques années, les technologies de captation et de restitution sonore immersive se sont développées de manière importante. Ce nouveau contenu a fait naître le besoin de créer de nouvelles méthodes dédiées à la compression audio spatialisée, notamment dans le domaine de la téléphonie et des services conversationnels. Il existe plusieurs manières de représenter l’audio spatialisé, dans cette thèse nous sommes intéressés à l’ambisonie d’ordre 1. Dans un premier temps, nos travaux ont porté sur la recherche d’une solution pour améliorer le codage multimono. Cette solution consiste en un traitement en amont du codec multimono pour décorréler les signaux des composantes ambisoniques. Une attention particulière a été portée à la garantie de continuité du signal entre les trames et à la quantification des métadonnées spatiales. Dans un second temps, nous avons étudié comment utiliser la connaissance de la répartition de l’énergie du signal dans l’espace, aussi appelée image spatiale, pour créer de nouvelles méthodes de codage. L’utilisation de cette image spatiale a permis d’élaborer deux méthodes de compression. La première approche proposée est basée sur la correction spatiale du signal décodé. Cette correction se base sur la différence entre les images spatiales du signal d’origine et du signal décodés pour atténuer les altérations spatiales. Ce principe a été étendu dans une seconde approche à une méthode de codage paramétrique. Dans une dernière partie de cette thèse, plus exploratoire, nous avons étudié une approche de compression par réseaux de neurones en nous inspirant de modèles de compression d’images par auto-encodeur variationnel
This thesis takes place in the context of the spread of immersive content. For the last couple of years, immersive audio recording and playback technologies have gained momentum and have become more and more popular. New codecs are needed to handle those spatial audio formats, especially for communication applications. There are several ways to represent spatial audio scenes. In this thesis, we focused on First Order Ambisonic. The first part of our research focused on improving multi-monocoding by decorrelated each ambisonic signal component before the multi-mono coding. To guarantee signal continuity between frames, efficient quantization new mechanisms are proposed. In the second part of this thesis, we proposed a new coding concept using a power map to recreate the original spatial image. With this concept, we proposed two compressing methods. The first one is a post-processing focused on limiting the spatial distortion of the decoded signal. The spatial correction is based on the difference between the original and the decoded spatial image. This post-processing is later extended to a parametric coding method. The last part of this thesis presents a more exploratory method. This method studied audio signal compression by neural networks inspired by image compression models using variational autoencoders

5

Briand, Manuel. "Études d'algorithmes d'extraction des informations de spatialisation sonore : application aux formats multicanaux." Grenoble INPG, 2007. http://www.theses.fr/2007INPG0027.

Повний текст джерела

Стилі APA, Harvard, Vancouver, ISO та ін.

Анотація:

La première orientation de ce travail de thèse vise à améliorer les performances des méthodes de codage audio paramétrique basées sur les indices de la localisation auditive. Nous avons cherché à adapter l'extraction des paramètres au contenu fréquentiel des signaux. La seconde orientation des travaux établie une modélisation des signaux multicanaux pour proposer une alternative au schéma de codage paramétrique actuel. Nous présentons une interprétation et l'évaluation des performances de l'Analyse en Composante Principale, réalisée en temps et en sous-bandes de fréquences avec une approche paramétrique. Finalement, nous utilisons cette décomposition au sein d'une nouvelle méthode de codage paramétrique qui repose à la fois sur la concentration de l'information dominante et sur l'extraction de paramètres pertinents. Les performances de notre méthode de codage paramétrique sont évaluées pour le cas stéréophonique et une extension au codage de signaux au format 5. 1 est proposée
The first axis of this thesis aims at improving the performances of parametric coding methods based on the auditory localization cues. We have looked further into adapt the parameter extraction to the spectral components of audio signals. The second axis of this work established a multichannel audio model in order to propose an alternative to existing parametric coding schemes. We present an interpretation and the performance evaluation of the Principal Component Analysis, carried out both in time and frequency subbands with a parametric approach. Finally, we use this decomposition within a new parametric coding method which relies on the concentration of dominant sound sources and the extraction of relevant parameters. The performances of our parametric coding method are evaluated for the stereophonic case and an extension for parametric coding of 5. 1 signals is proposed

6

Briand, Manuel. "Etudes d'algorithmes d'extraction des informations de spatialisation sonore : application aux formats multicanaux." Phd thesis, 2007. http://tel.archives-ouvertes.fr/tel-00141862.

Повний текст джерела

Стилі APA, Harvard, Vancouver, ISO та ін.

Анотація:

--
La première orientation de ce travail de thèse vise à améliorer les performances des méthodes de codage audio paramétrique basées sur les indices de la localisation auditive. Nous avons cherché à adapter l'extraction des paramètres au contenu fréquentiel des signaux. La seconde orientation des travaux établie une modélisation des signaux multicanaux pour proposer une alternative au schéma de codage paramétrique actuel. Nous présentons une interprétation et l'évaluation des performances de l'Analyse en Composante Principale, réalisée en temps et en sous-bandes de fréquences avec une approche paramétrique. Finalement, nous utilisons cette décomposition au sein d'une nouvelle méthode de codage paramétrique qui repose à la fois sur la concentration de l'information dominante et sur l'extraction de paramètres pertinents. Les performances de notre méthode de codage paramétrique sont évaluées pour le cas stéréophonique et une extension au codage de signaux au format 5.1 est proposée.
--