Objets Sonores: Une Représentation Bio-Inspirée Hiérarchique Parcimonieuse À Très Grandes Dimensions Utilisable En Reconnaissance; Auditory Objects: Bio-Inspired Hierarchical Sparse High Dimensional Representation for Recognition
نویسندگان
چکیده
The emphasis is put on the hierarchical structure, independence and sparseness aspects of auditory signal representations in high-dimensional spaces, so as to define the components of auditory objects. The concept of an auditory object and its neural representation is introduced. An illustrative application then follows, consisting in the analysis of various auditory signals : speech, music and natural outdoor environments. A new automatic speech recognition (ASR) system is then proposed and compared to a conventional statistical system. The proposed system clearly shows that an object-based analysis introduces a great flexibility and robustness for the task of speech recognition. The integration of knowledge from neuroscience and acoustic signal processing brings new ways of thinking to the field of classification of acoustic signals.
منابع مشابه
Traitement continu des requêtes dépendantes de la localisation dans les environnements intérieurs
This paper develops a data and knowledge representation of an indoor environment that takes into account user-centred contextual dimensions and mobile data management issues. We introduce a hierarchical, context-dependent, and feature-based indoor spatial data model in which location information is represented at different levels of abstraction. A query language supporting continuous location-d...
متن کاملPlongement incrémental dans un contexte de dissimilarité
RÉSUMÉ. Le domaine de la reconnaissance statistique de formes est basé sur la représentation numérique des objets et peut donc être facilement combiné avec des méthodes d’apprentissage automatique. D’autre part, la reconnaissance structurelle de formes utilise un ensemble limité de méthodes d’apprentissage automatique mais encode une riche description des objets via les chaînes de caractères ou...
متن کاملOn Segments and Syllables in the Sound Structure of Language: Curve-based Approaches to Phonology and the Auditory Representation of Speech.1
RÉSUMÉ — SUR LES NOTIONS DE SEGMENT ET DE SYLLABE DANS LA FORME SONORE DU LANGAGE : LES COURBES EN PHONOLOGIE ET LA REPRÉSENTATION AUDITIVE DE LA PAROLE. Les approches récentes de la syllabe réintroduisent une description continue et descriptible mathématiquement des objets sonores : les « courbes ». Les recherches psycholinguistiques sur la perception du langage parlé ont plutôt recours à des ...
متن کاملEigenvoices: A compact representation of speakers in model space
Titre francais: Voix propres: Vers une représentation compacte des locuteurs dans l'espace des modèles Traduction du titre des figures: Figure 1: Schéma bloc d'un système de reconnaissance de la parole Figure 2: Schéma général du système de voix propres 1 Summary: In this article, we present a new approach to modeling speaker-dependent systems. The approach was inspired by the eigenfaces techni...
متن کاملLocal Features and Kernels for Classification of Texture and Object Categories: An In-Depth Study
Recently, methods based on local image features have shown promise for texture and object recognition tasks. This paper presents a large-scale evaluation of an approach that represents images as distributions (signatures or histograms) of features extracted from a sparse set of keypoint locations and learns a Support Vector Machine classifier with kernels based on two effective measures for com...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
- CoRR
دوره abs/1311.5924 شماره
صفحات -
تاریخ انتشار 2013