نام پژوهشگر: نسترن فروغی

تحلیل داده های سرشماری عمومی سال 1385 کشور بر اساس روشهای داده کاوی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - دانشکده فنی 1389
  نسترن فروغی   حسن ابوالحسنی

در طول دهه گذشته حجم زیادی از داده ها در پایگاه داده ها انباشته و ذخیره شده اند و نتیجه این انباشتگی این است که سازمان ها در داده غنی، ولی در کسب دانش بسیار ضعیف می باشند. دانش داده کاوی سازمانها را قادر می سازد تا از سرمایه داده هایشان بهره برداری نمایند. داده کاوی با پردازش جامع داده و انجام فرایند تصمیم سازی از طریق استخراج دانش با ارزش از داده، تصمیم گیری را برای مدیران سازمان تسهیل می نماید. از طرفی سازمان ها و موسسه های آماری دارای داده انباره های حجیمی از اطلاعات هستند که از منابع مختلف و موضوع های متفاوت نشأت گرفته و جمع آوری شده اند. دراین خصوص داده کاوی به عنوان ابزاری توانمند نه تنها دسترسی به اطلاعات را تسهیل می سازد بلکه باعث می شود تا از دل این داده انباره ها اطلاعات مفید و قابل اعتمادی که تا کنون نهفته بوده را به دست آورد. هدف از این تحقیق بررسی روشهای داده کاوی در استخراج الگوهای مناسب از داده های سرشماری عمومی نفوس و مسکن سال 1385 ایران می باشد. برای این منظور با توجه به نوع داده های موجود در سرشماری، تعدادی سناریو برای استخراج الگوها پیشنهاد گردید. برای هر سناریو، استفاده از روشهای خوشه بندی، قواعد وابستگی و طبقه بندی بررسی شد و روش مناسب انتخاب و بکار گرفته شد تا الگوهایی استخراج گردد. نتایج حاصل از این تحقیق نشان می دهد که در صورت تعریف مناسب سناریوها می توان از هر یک از تکنیک های خوشه بندی، قواعد وابستگی و طبقه بندی استفاده کرد. برای بکارگیری هر یک از این تکنیک ها نوع پیش پردازش داده ها و الگوریتم مورد استفاده در نتایج حاصله تأثیر بسزایی خواهد داشت که در این تحقیق مورد بررسی و تجزیه و تحلیل قرار گرفته است. مدل های تولید شده در این تحقیق، الگوهایی در زمینه های خانواده های تک والده، معلولیت، مهاجرت، دختران و پسران مجرد بالاتر از متوسط سن ازدواج، کارآفرینان و مزدبگیران، و قدمت بناها و مصالح ساختمانی بکار رفته شده در آنها را فراهم می سازد. کلمات کلیدی داده کاوی، خوشه بندی، قواعد وابستگی، طبقه بندی، تحلیل داده های سرشماری عمومی