نام پژوهشگر: حامد هزاوه

طراحی و ارزیابی مکانیزم تشخیص خطا و بازیابی سیستم روی یک پردازنده تحمل پذیر خطای مبتنی بر ip-core
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه رازی - پژوهشکده فنی و مهندسی 1390
  حامد هزاوه   امیر رجب زاده

بروز خرابی در پردازنده های نهفته با توجه به کاربرد گسترده آنها در سیستم های بحرانی-امن، مانند تجهیزات پزشکی، الکترونیک خودروها، سیستم های ارتباطی و تجهیزات کنترل صنعتی، می تواند عواقب جبران ناپذیری را به همراه داشته باشد. برای جلوگیری از بروز خرابی در این سیستم ها، روش های تحمل پذیری اشکال مانند کشف و بازگشت از خطا به صورت گسترده ای مورد استفاده قرار می گیرند. شیوه غالب بازگشت از خطا در سیستم های مبتنی بر تک پردازنده، بازگشت از خطای عقب گرد می باشد. روش های بازگشت از خطای عقب گرد مبتنی بر اجرای دوباره دستوراتی هستند که در اجرای عادی برنامه خطایی در آنها اتفاق افتاده است. دو واحد مهم و حساس در هر پردازنده شمارنده برنامه و فایل ثبات می باشد. اهمیت این دو واحد از آن جهت است که وقوع خطا در آنها می تواند به سرعت در پردازنده منتشر شود و منجر به بروز خرابی در سیستم شود. بر این اساس، در این پایان نامه به منظور افزایش قابلیت اطمینان پردازنده های نهفته، طرحی برای محافظت از شمارنده برنامه و فایل ثبات ارائه شده است. در این طرح ابتدا خطا توسط مکانیزم های پیشنهادی کشف خطای pced و rfed تشخیص داده می شود. مکانیزم pced به منظور کشف خطای روند اجرا در شمارنده برنامه و مکانیزم rfed به منظور کشف خطای داده در فایل ثبات ارائه شده است. در گام بعدی برای جلوگیری از بروز خرابی در سیستم، پردازنده توسط مکانیزم بازگشت از خطا، به حالتی معتبر در گذشته بازگردانده می شود. مهمترین ویژگی طرح ارائه شده، صفر بودن سربار زمانی ذخیره حالت پردازنده در مکانیزم بازگشت از خطا است. عدم تاخیر در ذخیره حالت پردازنده موجب افزایش احتمال اجرای به موقع برنامه در کاربردهای بی درنگ می شود. برای ارزیابی، طرح ارائه شده بر روی کد وریلاگ پردازنده openrisc 1200 پیاده سازی شده است و با تزریق خطای نرم افزاری (مبتنی بر شبیه سازی) مورد ارزیابی قرار گرفته است. نتایج ارزیابی نشان می دهد که مکانیزم pced قادر به کشف 8/97 % از خطاهای روند اجرای تزریق شده در شمارنده برنامه می باشد. سربار سخت افزار و میانگین سربار توان مصرفی این مکانیزم برای 3 برنامه محک، به ترتیب 05/0% و 09/0% می باشد. مکانیزم rfed قادر به کشف کامل خطاهای رخداده در فایل ثبات می باشد. سربار سخت افزار و توان مصرفی این مکانیزم نیز در حدود 1/0% و 14/0% اندازه گیری شده است. متوسط سربار کارایی مکانیزم بازگشت از خطا ارائه شده، در حدود 1/1 % بدست آمده است. در حالی که سربار سخت افزار طرح بازگشت از خطا تنها 3/5% می باشد و میانگین سربارتوان مصرفی این طرح در حدود 41/5% است. آزمایش ها با استفاده از ابزارهای شبیه سازی modelsim 6.5 se و icarus انجام شده است و ابزار synopsys design compiler برای سنتز و اندازه گیری توان مصرفی طرح ارائه شده، مورد استفاده قرار گرفته است.