نام پژوهشگر: فریبرز نحوی

ارائه روش بهبود یافته شناسایی اجتماعات معنادار همپوشان در شبکه های اجتماعی
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه شیخ بهایی - دانشکده مهندسی کامپیوتر 1392
  فریبرز نحوی   محمدرضا خیام باشی

با توجه به گسترش شبکه های اجتماعی، شناسایی اجتماعات که به عنوان بستر پنهان شبکه های پیچیده ‏بشمار می آیند، از اهمیت خاصی برخوردار شده است. اکثر روش های کلاسیک، با دید ماکروسکوپی، کل ساختار ‏گراف را در نظر گرفته و اقدام به شناسایی اجتماعات می نمایند. این روش ها، علیرغم دقت بالا، زمان اجرا بسیار ‏بالایی نیز داشته و در شبکه های بزرگ در دنیای واقعی، قابل استفاده نمی باشند. بمنظور رفع این مشکل، ‏الگوریتم های شناسایی محلی اجتماعات توسعه یافتند. از آنجایی که الگوریتم های محلی، تک تک گره های گراف را ‏در نظر گرفته و ارتباطات بین آن ها را بررسی می نمایند، پیچیدگی زمانی پایین تری نسبت به روش های سراسری ‏دارند. لیکن، پایین بودن کیفیت این روش ها، علیرغم سرعت بالا، آن ها را به سمت استفاده از معیارهای سراسری ‏گراف جهت افزایش دقت سوق داده است که تهدیدی برای ماهیت الگوریتم های محلی بشمار می آید.‏ در این پژوهش، ابتدا الگوریتمی بمنظور شناسایی محلی اجتماعات همپوشان با ایده گرفتن از روش های ‏بهینه سازی حریصانه محلی معرفی گردیده است. شروع الگوریتم از یک هسته اولیه متراکم، عدم امکان انحراف ‏فرآیند شناسایی اجتماعات محلی حول یک گره، قابلیت شناسایی گره های دورافتاده و قطب، کاهش تعداد ‏چرخه های الگوریتم و در نتیجه کاهش پیچیدگی زمانی آن، شناسایی گره های مشترک و اجتماعات همپوشان ‏بروش سراسری و عدم نیاز به تعیین مقادیر، پیش از شروع الگوریتم، از جمله قابلیت های الگوریتم معرفی شده ‏می باشد. ‏ همچنین، الگوریتم پیشنهادی، با استفاده از خاصیت هموفیلی شبکه های پیچیده، ایده استفاده از ویژگی ‏چگالی همسایگان مشترک دو گره در شبکه های اجتماعی را مطرح نموده است. این ایده که بر مبنای خاصیت ‏هموفیلی شبکه های پیچیده بنا نهاده شده و توسط معیار مشابهت ساختاری جاکارد قابل محاسبه است، دو فرد در ‏یک شبکه اجتماعی را هر چقدر دارای دوستان مشترک بیشتری باشند، به لحاظ شخصیتی شبیه تر می پندارد. از ‏دیدگاه الگوریتم پیشنهادی، مشابهت گره های گراف، نه به عنوان معیاری مجزا، بلکه به عنوان بستر و زیرساخت ‏ارتباط بین گره ها می باشد. به همین دلیل، الگوریتم پیشنهادی، با وزن دار نمودن یال های گراف، در شناسایی ‏اجتماعاتی که نه تنها به لحاظ ساختاری با یکدیگر ارتباط قوی دارند، بلکه به لحاظ معنایی نیز با یکدیگر مرتبطند ‏اقدام می کند.‏ نتایج حاصل از مقایسه زمان اجرای الگوریتم پیشنهای و روش های مشابه بر روی مجموعه داده های ‏آزمایشی دنیای واقعی و نیز محک تحلیلی، حاکی از بهبود زمان اجرای الگوریتم می باشد. همچنین، استفاده از ‏مشابهت ویژگی های گره ها در شناسایی اجتماعات، منجر به کاهش آنتروپی و همگن تر شدن اجتماعات شناسایی ‏شده نسبت به روش های مشابه و نیز نسبت به الگوریتم پیشنهادی، بدون استفاده از ویژگی ها می باشد. ‏