نتایج جستجو برای: ضرایب mfcc

تعداد نتایج: 15840  

Journal: :CoRR 2010
Pawan Kumar Astik Biswas A. N. Mishra Mahesh Chandra

This paper introduces and motivates the use of hybrid robust feature extraction technique for spoken language identification (LID) sys tem. The speech recognizers use a parametric form of a signal to get the most important distinguishable features of speech signal for recognition task. In this paper Mel-frequency cepstral coefficients (MFCC), Perceptual linear prediction coefficients (PLP) alon...

2001
Dongqing Zhang

The report proposes a method for detecting the sound events in a basketball game with focusing on detecting cheering sound. MFCC (Mel-frequency cepstral coefficient) features are used to identify the cheering sounds from speeches and other confusing sounds. The mfcc features are fed into a neural network and classified into three classes (cheering, speech, and others). To improve the MFCC-NN pe...

2001
Conrad Sanderson Kuldip K. Paliwal

In this paper we have studied two information fusion approaches, namely feature vector concatenation and decision fusion, for the task of reducing error rates in a speaker verification system used in mismatched conditions. Three types of features are fused: Mel Frequency Cepstral Coefficients (MFCC), MFCC with Cepstral Mean Subtraction (CMS) and Maximum Auto-Correlation Values (MACV). We have u...

در این مقاله بازشناسی مقاوم به نویز گوینده در حالت مستقل از متن مورد توجه قرار گرفته است. روش پیشنهادی بر مبنای حذف سکوت از جملات و تقطیع آنها به واحدهای کوچک‌تر شامل چند آوا و حداقل یک واکه برای استخراج ویژگی‌های زمان‌بلند از جمله آنتروپی عمل می‌کند. یک واکه پرانرژی در هر قطعه گفتاری برای استخراج فرکانس پایه و فرمنت‌ها شناسایی می‌شود. با اعمال یک روش خوشه‌بندی، ویژگی‌های زمان‌کوتاه یعنی ضرایبِ ...

Journal: :Applied Computer Science 2023

Parkinson's disease is a recognizable clinical syndrome with variety of causes and presentations; it represents rapidly growing neurodegenerative disorder. Since about 90 percent sufferers have some form early speech impairment, recent studies on tele diagnosis focused the recognition voice impairments from vowel phonations or subjects' discourse. In this paper, we present new approach for dete...

Journal: :J. Inf. Sci. Eng. 2008
Gin-Der Wu Ying Lei

Fast Fourier Transform (FFT) plays an important role in the field of digital signal processing. High performance FFT processors are widely used in different application, such as speech processing, image processing, and communication system. In this paper, we proposed a novel register array based low power FFT processor for Mel Frequency Cepstral Coefficient (MFCC). Compared with [9-12], this no...

پایان نامه :وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی خواجه نصیرالدین طوسی - دانشکده صنایع 1390

شناسایی هویت مطمئن یک اصل اساسی برای شروع یک تراکنش تجاری می باشد. استفاده از بیومتریک ها می تواند باعث بالارفتن امنیت، سرعت و سادگی سیستم های شناسایی هویت شود. صدا به عنوان یک بیومتریک با دقت نسبتا بالا، سادگی استفاده و پیاده سازی بالا، هزینه کم و پذیرش بالای کاربر، یک گزینه مناسب برای این منظور می باشد که تا کنون به شکل گسترده ای مورد استفاده قرار گرفته است. یکی از مشکلات سیستم های شناسایی گو...

Journal: :journal of ai and data mining 2015
d. darabian h. marvi m. sharif noughabi

the mel frequency cepstral coefficients are the most widely used feature in speech recognition but they are very sensitive to noise. in this paper to achieve a satisfactorily performance in automatic speech recognition (asr) applications we introduce a noise robust new set of mfcc vector estimated through following steps. first, spectral mean normalization is a pre-processing which applies to t...

نمودار تعداد نتایج جستجو در هر سال

با کلیک روی نمودار نتایج را به سال انتشار فیلتر کنید