نام پژوهشگر: غلامرضا حسامیان

استنباط آماری ناپارامتری بر اساس اطلاعات نادقیق
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی اصفهان - دانشکده ریاضی 1391
  غلامرضا حسامیان   سید محمود طاهری

روش های ناپارامتری کلاسیک، مبتنی بر اطلاعات دقیق (غیر ‏مبهم) اعم از داده ی دقیق، فرضیه های مشخص، سطح معنی داری دقیق و مانند آن است. ولی در عمل ما با حالت هایی سر و کار داریم که حداقل یکی از این مو?لفه ها نادقیق هستند یا نادقیق گزارش می شوند. برای مثال ممکن است علاقمند به بررسی رابطه ی بین درآمد ماهانه و میزان مصرف برق در بین خانوارها در قالب جداول توافقی باشیم. در حالت کلاسیک، رده های جدول توافقی، رده های دقیق هستند و مشاهدات نیز، مقادیر دقیق می باشند و لذا هر مشاهده دقیقاً در یک خانه ی جدول قرار می گیرد. اما در این مثال طبیعی تر آن است که رده های درآمد و رده های میزان مصرف برق را رده هایی تقریبی (با مرز های منعطف) در نظر بگیریم. مثلاً می توان ‎?‎ رده خیلی کم، کم، متوسط، زیاد و خیلی زیاد برای درآمد و ‎?‎ رده کم، متوسط و زیاد برای میزان مصرف برق تصور کرد. واضح است که در این حالت، رده های درآمد و میزان مصرف برق رده های نادقیق هستند و در حقیقت تداعی کننده مقادیر متغیرهای زبانی در مبحث نظریه مجموعه های فازی هستند. از این رو اختصاص بعضی از مشاهدات به یک رده خاص‏، به علت داشتن مرز نادقیق با رده های دیگر‏، به طور دقیق امکان پذیر نیست. همچنین توجه کنید که روش های آزمون فرضیه ناپارامتری کلاسیک مبتنی بر داده های دقیق است. اما در عمل با موارد زیادی روبرو هستیم که داده ها دقیق نیستند. برای مثال در روانشناسی خانواده، تحقیقات نشان می دهند که خانم ها بیشتر از آقایان در طول هفته به امور خانه می پردازند. فرض کنید بخواهیم این ادعا را در یک سطح معنی داری مشخص آزمون کنیم. در این مورد معمولاً داده ها دقیق گزارش نمی شوند بلکه به صورت متغیر های زبانی مانند ‎‎ حدوداً ‎?‎ ساعت‎``‎ یا‎‎ اساساً بیشتر از دو ساعت‎``‎ و غیره بیان می شوند. به عنوان مثالی دیگر فرض کنید می خواهیم بررسی کنیم که آیا طول عمر لاستیک هایی که به تازگی توسط یک شرکت به بازار عرضه شده است از توزیع نرمال پیروی می کند یا خیر؟ در چنین موردی به علت عدم قطعیت در اندازه گیری طول عمر، ممکن است داده ها نادقیق گزارش شوند. به عنوان مثال دیگر‏، فرض کنید بخواهیم یک بررسی در مورد رابطه ی بین درآمد و رضایت شغلی بین افراد یک قشر از جامعه انجام دهیم. توجه کنید که در اینجا علاوه بر رده ها مشاهدات نیز می توانند به صورت مجموعه های نادقیق گزارش شوند. به این دلیل که معمولاً وقتی درآمد ماهانه ی یک فرد را جویا می شویم، پاسخی که دریافت می کنیم یک مقدار تقریبی است مانند ‎‎‏حدوداً دو میلیون و پانصد هزار تومان``، ‎‎ تقریباً بین دو تا سه میلیون تومان‎``‎ و مانند اینها. در مورد میزان رضایت شغلی هم وضع چنین است. هنگامی که از یک فرد رضایت شغلی را جویا شویم، معمولاً پاسخ های نادقیق دریافت می کنیم مانند: کم، زیاد، خیلی زیاد، تقریباً کامل، متوسط و مانند اینها. از طرف دیگر یکی از مسایل بسیار مهم در آزمون فرضیه های آماری، تنظیم فرضیه های مورد آزمون است. به علل مختلفی ممکن است نتوانیم فرضیه ها را به طور دقیق صورت بندی و/یا بررسی نماییم. بنابراین نیاز داریم که آزمون را بر اساس فرضیه های نادقیق انجام دهیم. در چنین مواردی‏، برای انجام آزمون فرضیه نیاز به تعمیم روش های کلاسیک بر پایه ی نظریه مجموعه های فازی داریم. پس‏،‎ به طور خلاصه‏، ما در سه زمینه ممکن است با اطلاعات نادقیق روبرو باشیم: رده بندی های نادقیق‏، داده های نادقیق و فرضیه های نادقیق. برای داشتن ابزارهای لازم جهت تحلیل های آماری در سه زمینه ی فوق باید روش های موجود را به طور مناسب گسترش داد. برای این کار‎‎‏، در این رساله چهار موضوع مرتبط با استنباط آماری ناپارامتری، در محیط فازی بررسی گردیده ا‎‏ست. در ادامه این چهار موضوع را به کوتاهی شرح می دهیم و در فصل های آینده رویکرد پیشنهادی را به گستردگی بیان خواهیم نمود. ‎?) تحلیل جداول توافقی ‏بر اساس اطلاعات نادقیق: ‏ بدین منظور، در فصل دوم ‎?‎ دیدگاه جدیدی برای تحلیل رابطه ی دو متغیر به صورت زیر بررسی شده است‎. الف) ‎حالتی که داده ها دقیق و رده ها نادقیق هستند. در این حالت‏، ابتدا با معرفی معیاری که مبین درجه ی تعلق یک عدد معمولی به یک مجموعه ی فازی است، یک روش برای تعمیم مفهوم فراوانی معرفی می شود. سپس بر اساس روش های ‎آلفا-برش، آماره ی گامای گودمن-کروسکال و p-مقدار به محیط فازی تعمیم داده شد. در نهایت، با استفاده از شاخص های امکان و لزوم، یک روش برای رد یا پذیرش فرضیه استقلال دو متغیر در سطح معنی داری دقیق یا فازی ارائه می شود. با ارائه یک مثال کاربردی در زمینه علوم اجتماعی کارایی روش پیشنهادی را تشریح می کنیم. ‎ ب) ‎حالتی که علاوه بر رده ها، مشاهدات نیز نادقیق هستند‎. در این حالت‏، به منظور تعمیم مفهوم فراوانی، از یک شاخص وزنی که مبین درجه ی تعلق یک عدد فازی به یک مجموعه ی معمولی است، استفاده می نماییم. همچنین، با در نظر گرفتن مفهوم سطح اعتبار، یک روش جدید برای رتبه بندی اعداد فازی پیشنهاد می شود و با استفاده از آن یک روش برای تصمیم گیری در مورد رد یا پذیرش فرضیه صفر فازی بر اساس سطح معنی داری دقیق یا فازی مطرح می گردد. در انتهای این فصل، یک مثال کاربردی در زمینه علوم اجتماعی ارائه نموده ایم.‎ ?) ‎ آزمون رتبه ی علامتدار ویلکاکسون بر اساس داده های نادقیق در پژوهشی‎ دیگر‏‏، آزمون رتبه ی علامت دار ویلکاکسون به حالتی که داده ها به طور نادقیق گزارش می شوند، تعمیم داده می شود. در رویکردی پیشنهادی، ابتدا مفهوم آماره ی آزمون فازی تعریف می شود. این تعریف، شامل حجم نمونه ی کوچک و حجم نمونه ی بزرگ در حالت یک نمونه ای و نمونه های زوجی است. سپس، در یک سطح معنی داری دقیق یا فازی، به شیوه ای مناسب مفهوم مقدار بحرانی فازی تعمیم داده می شود. سرانجام، بر اساس یک شاخص ارجحیت، شیوه ای برای آزمون فرضیه در مورد میانه ی جامعه معرفی می گردد. سرانجام روش پیشنهادی را‏، با ارائه ی دو مثال کاربردی در زمینه ها ی مدیریت و روانشناسی، تشریح می کنیم.‎‎ ‎ ‎?) آزمون کلموگروف-اسمیرنوف بر اساس مشاهدات و فرضیه های نادقیق: در سومین نوآوری‎، آزمون کلموگروف-اسمیرنوف (یک نمونه ای) را به محیط تماماً فازی تعمیم می دهیم و ویژگی های این تعمیم را بررسی می کنیم. منظور از محیط فازی تماماً فازی، در اینجا، بدین معنی است که مشاهدات نادقیق هستند، فرضیه های مورد آزمون به صورت فازی بیان شده اند، و سطح معنی داری نیز می تواند فازی (یا دقیق) باشد. بدین ترتیب کلی ترین حالت ممکن را در نظر می گیریم. در رویکردی که معرفی می شود، ابتدا تابع توزیع فازی یک متغیر تصادفی فازی به صورت مناسب تعریف می شود. همچنین، یک روش برای محاسبه تابع توزیع تجربی فازی در یک نقطه ی حقیقی یا یک نقطه فازی (عدد فازی) معرفی می گردد. این کار، یعنی تعریف تابع توزیع تجربی در نقاط فازی و بررسی ویژگی های آن نیز برای نخستین بار در این تحقیق انجام شده است. آنگاه، با فراهم آمدن ابزار های لازم، قضیه های حدی مرتبط با تابع توزیع تجربی فازی‏‏، بیان و اثبات می شوند. سپس‏، در حالتی که فرضیه های آزمون به صورت واژه های کلامی ‎(زبانی)‎ باشند و داده های مشاهده شده نیز نادقیق باشند، شیوه ای برای آزمون کلموگروف-اسمیرنوف یک-طرفه‏، بر اساس یک سطح معنی داری فازی یا دقیق پیشنهاد می شود. در پایان‏، کاربرد آزمونی را که معرفی نموده ایم در قالب یک مثال عملی در زمینه بررسی طول عمر تشریح می کنیم.‎ ‎?) آزمون های رتبه ای خطی دو نمونه ای با مشاهدات نادقیق: به عنوان چهارمین پژوهش‎، آزمون های رتبه ای خطی دو نمونه ای را‏، که از آزمون های رایج و کاربردی در آمار ناپارامتری است‏، مورد توجه قرار می دهیم و شیوه ای را برای تعمیم آنها به حالتی که مشاهدات، مقادیر نادقیق باشند ارائه می دهیم. در رویکردی که معرفی می شود، ابتدا بر اساس یک روش پیشنهادی برای رتبه بندی مشاهدات فازی، آماره ی آزمون به شیوه ای مناسب تعریف می شود و سپس بر اساس آن، -p-‎مقدار به صورت یک فاصله تعریف می شود. سرانجام، در یک سطح معنی داری دقیق، درجه ای برای رد یا پذیرش فرضیه صفر در مسئله ی آزمون فرضیه مکانی یا مقیاسی پیشنهاد می شود. در نهایت دو مثال کاربردی در زمینه‏ های جامعه شناسی و طول عمر مورد بررسی و مطالعه قرار گرفته است.