نام پژوهشگر: پانته آ زردشتی

تنظیمات خودکار الگوریتم های موازی سطح داده بر روی پردازنده های گرافیکی fermi
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده برق و کامپیوتر 1391
  پانته آ زردشتی   فرشاد خونجوش

ضرب برداری ماتریس تنک یکی از مهمترین عملیات در محاسبات ماتریس های تنک می باشد که در بسیاری از زمینه های علمی همچون پردازش تصویر، پردازش سیگنال دیجیتال، و معادلات مشتقات جزئی استفاده می شود. فرمت های مختلفی برای ذخیره سازی عناصر غیر صفر در ماتریس های تنک وجود دارد و پیاده سازی های موجود، برای پردازش ماتریس های مختلف تنها از یک فرمت ثابت استفاده می کنند که این عمل منجر به ناکارآمدی عملیات ضرب برداری ماتریس های تنک خواهد شد. چرا که ماتریس های مختلف با توجه به توزیع عناصر صفر در آنها ، ساختارهای متفاوتی دارند.از طرف دیگر، پردازنده های گرافیکی ثابت کرده اند که با استفاده از قدرت محاسباتی خود توانسته اند حجم بالایی از موازات را در بسیاری از برنامه ها فراهم آورند. پیاده سازی هایی که بر پایه این نوع پردازنده ها می باشند بیش از پیاده سازی های دیگر رنج می برند چرا که این نوع پردازنده ها نسبت به تنظیم خودکار حساس تر می باشند . آذرخش نام سیستم ضرب برداری ماتریس های تنک بر پایه پردازنده های گرافیکی ست که ما آن را طراحی و پیاده سازی کردیم.این سیستم با در نظر گرفتن تنظیمات و ویژگی های این پردازنده ها و ماتریس ورودی ، فرمت مناسب را انتخاب خواهد کرد. ما تاثیر پارامترهای متفاوت و تنظیمات آنها را در فرمت های مختلف بر روی کارایی ضرب برداری ماتریس تنک بررسی کردیم و با توجه به اطلاعات بدست آمده محیط انطباقی برای اجرای موثر ضرب برداری ماتریس تنک را طراحی کردیم که برای ماتریس ورودی مناسب ترین فرمت را انتخاب می کند. با توجه به شکل های نشان داده شده ، روش ما، پیاده سازی nvidia را برای ماتریس های یکسان بهبود داده است. همانطورکه از نتایج بدست آمده است، ما توانستیم به طور متوسط کارایی ضرب برداری ماتریس های تنک را در دقت ساده 2.1 برابر و در دقت مضاعف 1.6 برابر بهبود بخشیم.