مسعود گراوانچی زاده

عضو هیئت علمی دانشگاه تبریز

[ 1 ] - بهبود سیستم جداسازی منبع مبتنی بر آنالیز ترکیب شنیداری در زبان فارسی

چکیده: در این مقاله، سیستم­های جدیدی به­منظور بهبود عملکرد سیستم جداکننده گفتار دوگوشی با نام MESSL ارائه می­شود. در سیستم جداساز سیگنال، ابتدا، با استفاده از الگوریتم EM، مدل­های گوسی پارامترهای اختلاف فاز درون­گوشی (IPD) و اختلاف شدت درون­گوشی (ILD) به ­دست می­آیند. سپس، با استفاده از مدل به­دست­آمده برای هر منبع، ماسک نرمی استخراج شده که با ضرب آن در تبدیل فوریه زمان­کوتاه (STFT) سیگنال مخلو...

[ 2 ] - تخمین SNR ورودی با استفاده از ماسک باینری در سیستم‌های مبتنی بر آنالیز ترکیب شنیداری محاسباتی

در این مقاله، روش جدیدی برای تخمین نسبت سیگنال به نویز (SNR) سیگنال ترکیب ارائه شده است که بر پایه روش آنالیز ترکیب شنیداری محاسباتی (CASA) است. در روش ارائه‌شده، ماسک باینری ایده‌آل (IBM) که به طور معمول هدف محاسباتی سیستم‌های مبتنی بر CASA است، برای تخمین SNR سیگنال گفتار نویزی به کار گرفته می‌شود. روش پیشنهادی با استفاده از IBM و چندین ماسک شبه IBM ارزیابی شده است. این روش، ساده و از نظر محا...

[ 3 ] - A New Shuffled Sub-swarm Particle Swarm Optimization Algorithm for Speech Enhancement

In this paper, we propose a novel algorithm to enhance the noisy speech in the framework of dual-channel speech enhancement. The new method is a hybrid optimization algorithm, which employs the  combination of  the  conventional θ-PSO and the shuffled sub-swarms particle optimization (SSPSO) technique. It is known that the θ-PSO algorithm has better optimization performance than standard PSO al...

[ 4 ] - Speech Emotion Recognition Based on Power Normalized Cepstral Coefficients in Noisy Conditions

Automatic recognition of speech emotional states in noisy conditions has become an important research topic in the emotional speech recognition area, in recent years. This paper considers the recognition of emotional states via speech in real environments. For this task, we employ the power normalized cepstral coefficients (PNCC) in a speech emotion recognition system. We investigate its perfor...

[ 5 ] - Speech Enhancement by Modified Convex Combination of Fractional Adaptive Filtering

This paper presents new adaptive filtering techniques used in speech enhancement system. Adaptive filtering schemes are subjected to different trade-offs regarding their steady-state misadjustment, speed of convergence, and tracking performance. Fractional Least-Mean-Square (FLMS) is a new adaptive algorithm which has better performance than the conventional LMS algorithm. Normalization of LMS ...

[ 6 ] - مدل میکروسکوپی دوگوشی مبتنی بر فیلتر بانک مدولاسیون برای پیش گویی قابلیت فهم گفتار در افراد دارای شنوایی عادی

In this study, a binaural microscopic model for the prediction of speech intelligibility based on the modulation filter bank is introduced. So far, the spectral criteria such as the STI and SII or other analytical methods have been used in the binaural models to determine the binaural intelligibility. In the proposed model, unlike all models of binaural intelligibility prediction, an automatic ...

[ 7 ] - Classification of Iranian Traditional Music Dastgahs Using Features Based on Pitch Frequency

The Iranian traditional music is composed of seven majors Dastgahs: Chahargah, Homayoun, Mahour, Segah, Shour, Nava, and Rast-Panjgah. In this paper, a new algorithm for the classification of the Iranian traditional music Dastgahs based on pitch frequency is proposed. In this algorithm, the features of Lagrange coefficients of pitch logarithm (LCPL), Fuzzy similarity sets type 2 (FSST2), and th...