زهرا مددی

نام پژوهشگر: زهرا مددی

بازشناسی برون خطی کلمات دست نویس فارسی مبتنی بر ویژگی های آماری و ساختاری با استفاده از طبقه بند های knn وmlp و اجرای الگوریتم fcnn

پایان نامه دانشگاه آزاد اسلامی - دانشگاه آزاد اسلامی واحد تهران مرکزی - دانشکده مهندسی برق و الکترونیک 1391
زهرا مددی فرداد فرخی

هدف این پژوهش ارائه روشی نوین با بازدهی مطلوب، مبتنی بر به کارگیری الگوریتم های موثر برای بازشناسی برون خط و مستقل از تفکیک کلمات دست نویس فارسی است. بدین منظور سه راهکار متمایز متشکل از مراحل دریافت تصاویر ورودی، پیش پردازش، استخراج ویژگی و طبقه بندی پیشنهاد شده است. عملیات آستانه گیری، حذف نویز، استخراج اسکلت به منظور حذف اثر عرض قلم، محدود سازی کلمات یا زیرکلمات در پنجره های محدود کننده و تغییر اندازه مجدد تصاویر به منظور کاهش اثر ناهمگونی ابعاد نگارش، حذف تغییرات چرخشی، بازکردن و بستن متوالی مبتنی بر عناصر مورفولوژی برای حذف ناپیوستگی و حفره های ناخواسته، از جمله عملیات پیش پردازشی است که پس از اسکن و دریافت قالب های دیجیتال تصاویر کلمات دست نویس، به منظور کاهش اثر تغییرات نگارشی ناخواسته و نامطلوب در عملیات بازشناسی بر روی تمامی تصاویر اعمال گردیده و اجرای صحیح این مرحله از سیستم بازشناسی در بهبود نتایج مراحل بعدی تأثیر چشم گیری را ارائه داده است. اولین راهکار پیشنهاد شده در این پژوهش، مبتنی بر مدلسازی گاوسین تصاویر کلمات نمونه و طبقه بندی آنها با بهره گیری از عملیات تطبیق الگو است. در این شیوه به منظور بازشناسی 10 کلاس از کلمات دست نویس فارسی، ابتدا مدل های گاوسین 240 تصویر (24 نمونه از هر کلاس) بعنوان نمونه های آموزش در نظر گرفته می شود. سپس برای بازشناسی 80 نمونه باقیمانده از اندازه گیری فواصل اقلیدسی مدل های گاوسین هر نمونه آزمون تا 240 نمونه آموزش استفاده می گردد. نهایتاً با شناسایی سه نمونه آموزش نزدیکتر به هر نمونه آزمون، و اجتماع گیری از میزان بازشناسی صحیح در این سه سطح تشابه نزدیکتر، نرخ 80.25% حاصل گردیده است. همانطور که از نتیجه این بازشناسی مشخص است، شیوه استخراج ویژگی بر مبنای مدلسازی گاوسین برای توصیف کلمات دست نویس چندان مناسب به نظر نمی رسد، علت اصلی این امر تأثیر منفی دو عامل، یکسان نبودن ابعاد نگارشی اجزا مختلف تشکیل دهنده بدنه کلمات دست نویس (بدنه زیرکلمات، حروف و نقاط) و همچنین تغییرات نگارشی ناخواسته در شیوه های نگارشی افراد مختلف (زوایای نقاط تقاطع و شیب بدنه)، در تولید مدل های مخلوطی گاوسین مشابه برای کلمات نظیر هر کلاس است.به عبارتی نتیجه بازشناسی این شیوه فقدان توانایی لازم آن را برای تولید مدل های موثر در بازشناسی کلمات دست نویس به روش تطبیق الگو نشان داده است. در حقیقت اجرای الگوریتم بازشناسی بر مبنای مدلسازی و عملیات تطبیق الگو بیشتر برای کاراکترهای گسسته ( حروف و اعداد) مناسب بوده و استفاده آن برای کلمات پیوسته چندان نتایج مطلوبی را ارائه نمی دهد. دومین راهکار ارائه شده در این پایان نامه، مبتنی بر استخراج بردارهای ویژگی ترکیبی و طبقه بندی با استفاده از طبقه بندهای knn و mlp است. در این شیوه پس از اسکن و ارائه قالب دیجیتالی تصاویر کلمات دست نویس به رایانه، ابتدا به منظور حذف همپوشی های عمودی احتمالی زیرکلمات، عملیات برچسب گذاری و تفکیک آنها در ماتریس های تصویری مجزا اجرا شده، سپس کلیه مراحل پیش پردازشی که قبلاً اشاره گردید بر روی تمامی تصاویر زیرکلمات اعمال می شود. در مرحله استخراج ویژگی، به منظور فراهم نمودن بردارهای ویژگی توانمندی که بتوانند به خوبی از عهده توصیف دقیق مشخصات ظاهری و ساختاری کلمات دست نویس برآیند از ترکیب شیوه های آماری، ساختاری و اعمال تبدیل موجک استفاده شده است. بطوریکه ابتدا پارامترهای آماری میانگین، واریانس و انرژی مرتبط با نمودارهای هیستوگرام افکنش عمودی تصاویر زیرکلمات محاسبه شده، سپس با بکارگیری الگوریتم تجزیه تحلیل تطابقی ca، مقادیر ویژه سازنده ماتریس های تصویری زیرکلمات نیز بعنوان پارامترهای ساختاری بردارهای ویژگی استخراج می گردند. پس از آن با اعمال تبدیل موجک یک بعدی گسسته مبتنی بر موجک پایه ی هار بر توابع هیستوگرام افکنش عمودی تصاویر زیرکلمات، ضرایب موجک نماینده جزئیات فرکانس بالا و کلیات فرکانس پایین هر تصویر نیز فراهم گردیده و نهایتاً این سه دسته ویژگی حاصل از محاسبات آماری، ساختاری و تبدیل موجک برای هر تصویر نمونه در یک بردار ویژگی ترکیب می شوند تا بتوانند توصیفگرهای مناسبی را ارائه دهند. در مرحله بعد، پیش از اجرای عملیات طبقه بندی، از الگوریتمfcnn برای انتخاب مثال های موثر در آموزش استفاده می شود تا بدین ترتیب عملیات طبقه بندی بتواند با بازده مندی بیشتر و به طور دقیق تر اجرا گردد. نهایتاً ماتریس حاصل از اجرای الگوریتمfcnn به عنوان ماتریس آموزش و مابقی داده ها به عنوان ماتریس آزمون، در مراحلی جداگانه برای بازشناسی به طبقه بندهای mlp و knn ارسال می شوند. پس از آن، یک مرحله اعمال الگوریتم بهینه سازی uta برای حذف ویژگی های غیر موثر و مخرب به منظور کاهش ابعاد بردارهای ویژگی، افزایش بازدهی شبکه، بهبود دقت و سرعت بازشناسی اجرا می گردد. بعنوان مزیت این شیوه پیشنهادی، می توان به ساده بودن مرحله استخراج ویژگی، و اینکه فراهم سازی بردارهای ویژگی ترکیبی (ویژگی های آماری، ساختاری و ضرایب موجک) می تواند نقش به سزایی را در افزایش دقت طبقه بندی ایفا کند، اشاره نمود. همچنین افزایش دقت بازشناسی با اعمال الگوریتم fcnn در مرحله طبقه بندی به منظور بهره گیری از مشابهت ما بین نمونه های هم کلاس در روند تشکیل ماتریس موثر آموزش، و دستیابی به ابعاد بهینه و سرعت مطلوب سیستم بازشناسی با اجرای الگوریتم uta، از دیگر مزایای این شیوه هستند. اعتبار اجرای روش پیشنهادی بر روی بخشی از پایگاه داده ایرانشهر(متشکل از 640 تصویر کلمه دست نویس)، با دقت طبقه بندی 97.9% به اثبات رسیده است. در سومین راهکار پیشنهاد شده در این تحقیق، از تبدیل موجک دو بعدی گسسته بر مبنای تشکیل بانکی از موجک های پایه، الگوریتم تجزیه تحلیل تطابقی ca و اعمال طبقه بندmlp برای بازشناسی استفاده شده است. در این شیوه نیز، پس از اسکن و ارائه قالب دیجیتالی تصاویر کلمات دست نویس به رایانه، کلیه مراحل پیش پردازشی که قبلاً اشاره گردید بر روی تمامی تصاویر کلمات اجرا می شود. سپس در مرحله استخراج ویژگی، به منظور استخراج ویژگی های موثر برای بازشناسی کلمات دست نویس فارسی، در ابتدا قصد داشتیم برای هر کدام از کلاس های بازشناسی، یک موجک پایه را متناظر با شکل ساختاری آنها تعریف نماییم. اما از آنجایی که تعریف موجک های پایه نظیر تمام کلاس ها، به گونهای که اعمال تبدیل موجک بر مبنای آنها بتواند ویژگی های مشابه ای را برای نمونه های هر کلاس و ویژگی های متمایزی را برای نمونه های نظیر کلاس های مختلف تولید نماید، در صورت گسترده بودن تعداد کلاس ها امری غیر ممکن است، از شیوه تشکیل بانکی از موجک های پایه استفاده کردیم. بدین ترتیب توانستیم با به کارگیری هر یک از اعضا این بانک در هر بار اعمال تبدیل موجک، شباهت مابین کلمات هم کلاس و تفاوت مابین کلمات غیر هم کلاس را به نحوی جدید به نمایش در آوریم. همانطور که می دانیم، ساختار نگارشی کلمات در زبان فارسی از شکلی غیر تقارنی و نوسانات ارتفاعی زیادی برخوردار است، و خانواده موجک های پایه دابیچز به دلیل داشتن ساختاری غیر متقارن و تغییر ارتفاع نوسانات در شکل موج مربوطه شان، دارای شباهت ساختاری زیادی با نحوه نگارشی کلمات در زبان فارسی هستند. از این رو برای تولید ویژگی های توصیفی موثر، بانکی از موجک های پایه این خانواده تشکیل شده است. هر چند، به منظور تأیید صحت موثر بودن کارایی بانک موجک پایه خانواده دابیچز، ابتدا بانکی از موجک های پایه مختلف تشکیل گردیده و با اعمال ویژگی های آماری (میانگین و واریانس) ضرایب تبدیل موجک دو بعدی گسسته بر مبنای تک تک اعضا بانک، به یک طبقه بند شبکه عصبی، کارایی هرکدام از موجک های پایه در دستیابی به یک نرخ بازشناسی مطلوب بررسی گردیده و نهایتاً خانواده موجک پایه دابیچز برای بازشناسی کلمات دست نویس فارسی مناسب تر از سایر موجک های پایه تشخیص داده شده است. بنابراین بانکی از خانواده موجک پایه دابیچز (db1 تا db10) تشکیل گردیده، سپس تبدیل موجک دو بعدی گسسته تا چهار مرحله بر مبنای تک تک اعضا این خانواده، بر تمامی تصاویر نمونه اعمال شده است. آنگاه از تمامی ضرایب موجک نماینده کلیات فرکانس پایین و جزئیات فرکانس بالا در مرحله چهارم تبدیل، ویژگی های آماری میانگین و واریانس استخراج شده و این ویژگی ها به همراه ضرایب ساختاری حاصل از اعمال الگوریتم تجزیه تحلیل تطابقی ca، در یک بردار ویژگی برای هر تصویر نمونه ذخیره می گردد. در مرحله بعد، پیش از اجرای عملیات طبقه بندی از الگوریتمfcnn برای انتخاب مثال های موثر در آموزش استفاده شده و نهایتاً ماتریس حاصل از اجرای این الگوریتم به عنوان ماتریس آموزش و مابقی داده ها به عنوان ماتریس آزمون برای بازشناسی به طبقه بند mlp ارسال می شود. پس از آن، یک مرحله اعمال الگوریتم بهینه سازی uta برای حذف ویژگی های غیر موثر و مخرب به منظور کاهش ابعاد بردارهای ویژگی، افزایش بازدهی شبکه، بهبود دقت و سرعت بازشناسی اجرا می گردد. بعنوان مزیت این شیوه پیشنهادی، می توان به توانمندی ویژگی های آماری مرتبط با ضرایب موجک دوبعدی گسسته مبتنی بر موجک های پایه خانواده دابیچز، در کنار ضرایب الگوریتم تجزیه تحلیل تطابقی ca به منظور تولید ویژگی های دقیق و موثر برای توصیف کلمات دست نویس فارسی اشاره نمود. همچنین افزایش دقت طبقه بندی با اعمال الگوریتم fcnn و دستیابی به ابعاد بهینه و سرعت مطلوب سیستم بازشناسی با اجرای الگوریتم uta، از دیگر مزایای این روش هستند. اعتبار اجرای شیوه ی پیشنهادی بر روی بخشی از پایگاه داده ایرانشهر(متشکل از 640 تصویر کلمه دست نویس)، با دقت طبقه بندی 99.33% به اثبات رسیده است.

۱۵ صفحه ی اول

بررسی تأثیر مدیریت دانش بر کارائی کارکنان اداره کل تعاون، کار و رفاه اجتماعی استان تهران

پایان نامه دانشگاه آزاد اسلامی - دانشگاه آزاد اسلامی واحد تهران مرکزی - دانشکده مدیریت 1393
زهرا مددی ناصرعلی رمضانی

در دهه‏ اخیر دانش و مدیریت آن به طور گسترده ای مورد کنکاش و تدقیق قرار گرفته اند و در همین راستا زمینه کاری گسترده‏ای هم برای تحقیقات آکادمیک و هم برای کاربردهای عملی ایجاد شده است. در این مقاله سعی شده است تا مقوله مدیریت دانش و ابعاد آن به صورت اجمالی بررسی شود.