عنوان : خوشهبندی مبتنی بر انتخاب بر اساس نظریه خرد جمعی
استاد راهنما : جناب آقای دکتر بهروز مینایی
استاد مشاور : جناب آقای دکتر حسین علیزاده
تابستان 1392
برای رعایت حریم خصوصی نام نگارنده پایان نامه درج نمی شود
(در فایل دانلودی نام نویسنده موجود است)
تکه هایی از متن پایان نامه به عنوان نمونه :
(ممکن است هنگام انتقال از فایل اصلی به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود ولی در فایل دانلودی همه چیز مرتب و کامل است)
چکیده
خوشهبندی وظیفه کاوش الگوهای پنهان در دادههای بدون برچسب را بر عهده دارد. به خاطر پیچیدگی مسئله و ضعف روشهای خوشهبندی پایه، امروزه روشهای خوشهبندی ترکیبی مورد استفاده قرار میگیرند. به روشی از خوشهبندی ترکیبی که در آن از زیرمجموعهای منتخب از نتایج اولیه برای ترکیب و ساخت نتیجه نهایی استفاده میشود خوشهبندی ترکیبی مبتنی بر انتخاب زیرمجموعه نتایج اولیه میگویند. در سالهای اخیر تمرکز بر روی ارزیابی نتایج اولیه برای انتخاب خوشه در خوشهبندی ترکیبی مورد توجه محققین زیادی قرار گرفته است. اما پاسخ به بعضی از سؤالات در این زمینه همچنان با ابهامات زیادی روبروست. از طرفی دیگر، نظریه خرد جمعی که اولین بار توسط سورویکی منتشر شده است، نشان میدهد که قضاوتهای جمعی و دموکراتیک از اعتبار بیشتری نسبت به آنچه که ما انتظار داشتیم برخوردار هستند. این نظریه چهار شرط پراکندگی، استقلال، عدم تمرکز و روش ترکیب مناسب آراء را برای هر جمعیت خردمند لازم و کافی میداند. هدف این تحقیق پیشنهاد فرآیندی جهت نگاشت و بهکارگیری نظریه خرد جمعی در انتخاب زیرمجموعه مناسب در خوشهبندی ترکیبی مبتنی بر انتخاب میباشد. از این روی در این تحقیق ابتدا با استفاده از تعاریف مطرحشده در نظریه خرد جمعی باز تعریفی متناسب با خوشهبندی ترکیبی مبتنی بر انتخاب ارائه میشود و بر اساس آن دو روش برای ترکیب این دو مفهوم پیشنهاد میشود. در روش پیشنهادی اول الگوریتمهای خوشهبندی اولیه غیر هم نام کاملاً مستقل فرض خواهند شد و برای ارزیابی استقلال الگوریتمهای هم نام نیاز به آستانهگیری میباشد. در روش دوم، سعی شده است تا دو بخش از روش اول بهبود یابد. از این روی جهت مدلسازی الگوریتمها و ارزیابی استقلال آنها نسبت به هم یک روش مبتنی بر گراف کد الگوریتم ارائه میشود و میزان استقلال به دست آمده در این روش به عنوان وزنی برای ارزیابی پراکندگی در تشکیل جواب نهایی مورد استفاده قرار میگیرد. جهت بررسی ادعاهای این تحقیق در بخش ارزیابی دقت و اطلاعات متقابل نرمال شدهی روشهای پیشنهادی بر روی دادهّهای استاندارد با روشهای پایه، روش ترکیب کامل و چند روش معروف خوشهبندی ترکیبی مبتنی بر انتخاب مقایسه میشوند که این مقایسه کاراریی بالای روشهای پیشنهادی این تحقیق در اکثر موارد نسبت به سایر روشهای مطرح شده را نشان میدهد. همچنین در بخش نتیجهگیری چندین روش توسعه جهت کارهای آتی پیشنهاد میشود.
واژههای کلیدی: خوشهبندی ترکیبی، خرد جمعی، استقلال الگوریتمهای خوشهبندی، پراکندگی نتایج خوشهبندی اولیه، عدم تمرکز در چهارچوب خوشهبندی ترکیبی
شکل4-25. رابطه میان آستانه استقلال و زمان اجرای الگوریتم در روش پیشنهادی اول …………………………………. 133
شکل4-26. رابطه میان آستانه پراکندگی و زمان اجرای الگوریتم در روش پیشنهادی اول ………………………………. 133
شکل4-27. رابطه میان آستانه استقلال و دقت نتیجه نهایی در روش پیشنهادی اول ………………………………………. 134
شکل4-28. رابطه میان آستانه پراکندگی و دقت نتیجه نهایی در روش پیشنهادی اول …………………………………….. 134
شکل4-29. رابطه میان آستانه عدم تمرکز و دقت نتیجه نهایی در روش پیشنهادی اول ………………………………….. 135
شکل4-30. رابطه میان آستانه پراکندگی و زمان اجرای الگوریتم در روش پیشنهادی دوم ………………………………. 135
شکل4-31. رابطه میان آستانه پراکندگی و دقت نتایج نهایی در روش پیشنهادی دوم …………………………………….. 136
شکل4-32. رابطه میان آستانه عدم تمرکز و دقت نتایج نهایی در روش پیشنهادی دوم ………………………………….. 137
شکل4-33. مقایسه زمان اجرای الگوریتم ………………………………………………………………………………………………… 138
مقدمه
1-1. خوشهبندی
به عنوان یکی از شاخههای وسیع و پرکاربرد هوش مصنوعی[1]، یادگیری ماشین[2] به تنظیم و اکتشاف شیوهها و الگوریتمهایی میپردازد که بر اساس آنها رایانهها و سامانههای اطلاعاتی توانایی تعلم و یادگیری پیدا میکنند. طیف پژوهشهایی که در مورد یادگیری ماشینی صورت میگیرد گسترده است. در سوی نظری آن پژوهشگران بر آناند که روشهای یادگیری تازهای به وجود بیاورند و امکانپذیری و کیفیت یادگیری را برای روشهایشان مطالعه کنند و در سوی دیگر عدهای از پژوهشگران سعی میکنند روشهای یادگیری ماشینی را بر مسائل تازهای اعمال کنند. البته این طیف گسسته نیست و پژوهشهای انجامشده دارای مؤلفههایی از هر دو رویکرد هستند. امروزه، دادهکاوی[3] به عنوان یک ابزار قوی برای تولید اطلاعات و دانش از دادههای خام، در یادگیری ماشین شناختهشده و همچنان با سرعت در حال رشد و تکامل است. به طور کلی میتوان تکنیکهای دادهکاوی را به دو دسته بانظارت[4] و بدون نظارت[5] تقسیم کرد [29, 46].