دانشگاه شیراز
پایان نامه دوره کارشناسی ارشد مهندسی کامپیوتر(هوش مصنوعی)
استفاده ازکاربرانی با دقت پیشگویی بالا در سیستمهای فیلترینگ اشتراکی
استاد راهنما:
جناب آقای دکتر منصور ذوالقدری جهرمی
تابستان92
برای رعایت حریم خصوصی نام نگارنده پایان نامه درج نمی شود
(در فایل دانلودی نام نویسنده موجود است)
تکه هایی از متن پایان نامه به عنوان نمونه :
(ممکن است هنگام انتقال از فایل اصلی به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود ولی در فایل دانلودی همه چیز مرتب و کامل است)
چکیده
سیستمهای پیشنهادگر ابزارهای نرم افزاری و تکنیکهایی هستند که اقلام را مطابق با نیاز کاربر به او معرفی میکنند. روشهای محتوا محور و فیلترینگ اشتراکی از راهکارهای موفق در سیستمهای پیشنهادگر میباشند. روش محتوا محور بر اساس ویژگیهای اقلام تعریف میشود. این روش بررسی میکند که اقلام مورد علاقه کاربر دارای چه ویژگیهایی بودهاند، سپس اقلام دارای ویژگیهای مشابه را به او پیشنهاد میکند. روش فیلترینگ اشتراکی بر اساس تعیین اقلام مشابه یا کاربران مشابه کار میکند که به ترتیب فیلترینگ اشتراکی مبتنی بر اقلام و مبتنی بر کاربران نامیده میشود. در این پایان نامه یک روش تلفیقی از روشهای فیلترینگ اشتراکی و محتوا محور ارائه شده است. این روش میتواند به عنوان روش فیلترینگ اشتراکی مبتنی بر کاربر در نظر گرفته شود. به این صورت که به منظور یافتن کاربرانی با سلیقه مشابه با کاربر فعال به عنوان کاربرانی با دقت پیشگویی بالا از ویژگیهای مربوط به محتوای اقلام برای افزایش تاثیر امتیازهایی که توسط کاربران به اقلام مشابه تخصیص داده شده است استفاده میکند. به بیان دیگر دو کاربر مشابه هستند در صورتی که امتیازهایی که به اقلامی که از نظر محتوا مشابه هستند نسبت دادهاند، همسان باشند. برای این منظور در هنگام سنجیدن شباهت دو کاربر، به امتیاز نسبت داده شده به هر قلم، با توجه به میزان شباهت آن به قلم هدف، وزن تخصیص مییابد.
فهرست مطالب
عنوان صفحه
فصل 1 : مقدمه……………………………………………………………………………………………………………………………1
1-1- پیشگفتار…………………………………………………………………………………………………………………………….2
1-2- موتورهای جستجوگر…………………………………………………………………………………………………………2
1-2-1- موتورهای جستجوگر پیمایشی……………………………………………………………………………………..3
1-2- 2- فهرستهای تکمیل دستی…………………………………………………………………………………………..3
1-2-3- موتورهای جستجوگر ترکیبی………………………………………………………………………………………..4
1-2-4- ابرجستجوگرها……………………………………………………………………………………………………………….4
1-3- سیستمهای پیشنهادگر……………………………………………………………………………………………………..5
1-3-1- سیستم پیشنهادگر بر اساس فیلترینگ اشتراکی…………………………………………………………7
1-3-2- سیستم پیشنهادگر بر اساس محتوا………………………………………………………………………………8
1-3-3- سیستم پیشنهادگر بر اساس آمار گیری……………………………………………………………………….8
1-3-4- سیستم پیشنهادگر بر اساس سود…………………………………………………………………………………9
1-3-5- سیستم پیشنهادگر بر اساس دانش………………………………………………………………………………9
1-3-6- سیستم پیشنهادگر ترکیبی…………………………………………………………………………………………..9
1-4- بررسی سایت MovieLens…………………………………………………………………………………………..10
1-5- اهداف پایان نامه……………………………………………………………………………………………………………..13
1-6- ساختار پایان نامه…………………………………………………………………………………………………………….14
فصل 2 : روش فیلترینگ اشتراکی……………………………………………………………………………………………15
2-1- پیشگفتار………………………………………………………………………………………………………………………….16
2-2- مروری بر کارهای انجام شده در این راستا……………………………………………………………………..16
2-3- مبانی فیلترینگ اشتراکی………………………………………………………………………………………………..21
2-4- وظایف فیلترینگ اشتراکی…………………………………………………………………………………………….22
2-4-1- پیشنهاد……………………………………………………………………………………………………………………….23
2-4-2- پیشبینی…………………………………………………………………………………………………………………….23
2-5- دسته بندی متدهای فیلترینگ اشتراکی……………………………………………………………………….23
2-5-1- فیلترینگ اشتراکی مبتنی بر حافظه…………………………………………………………………………24
2-5-1-1- فیلترینگ اشتراکی مبتنی بر حافظه با پیشبینی بر اساس کاربران…………………….25
2-5-1-2- فیلترینگ اشتراکی مبتنی بر حافظه با پیشبینی بر اساس اقلام…………………………25
2-5-1- 3- تفاوت فیلترینگ اشتراکی بر اساس کاربران و بر اساس اقلام……………………………..26
2-5-2- فیلترینگ اشتراکی مبتنی بر مدل……………………………………………………………………………..26
2-6- نحوه تشخیص علائق کاربران………………………………………………………………………………………….27
2-6-1- تشخیص علائق به صورت صریح…………………………………………………………………………………27
2-6-2- تشخیص علائق به صورت ضمنی……………………………………………………………………………….27
2-7- محاسبه شباهت……………………………………………………………………………………………………………….28
2-7-1- معیار همبستگی پیرسون……………………………………………………………………………………………28
2-7-2- معیار اندازهگیری کسینوس………………………………………………………………………………………..29
2-8- انتخاب همسایه……………………………………………………………………………………………………………….30
2-8-1- استفاده از حد آستانه………………………………………………………………………………………………….30
2-8-2- انتخاب تعداد ثابتی از همسایگان……………………………………………………………………………….30
2-9- پیشبینی و تخمین رتبه…………………………………………………………………………………………………31
2-9-1- استفاده از امتیازهای خام……………………………………………………………………………………………31
2-9-2- استفاده از امتیازهای نرمال شده………………………………………………………………………………..31
2-10- مشکلات فیلترینگ اشتراکی………………………………………………………………………………………..32
2-10-1- پراکنده بودن داده…………………………………………………………………………………………………….32
2-10-2- مقیاس پذیری………………………………………………………………………………………………………….32
2-10-3- اقلام مشابه……………………………………………………………………………………………………………….33
2-10-4- گریشیپ…………………………………………………………………………………………………………………33
2-11- بررسی چگونگی کارکرد سایت آمازون…………………………………………………………………………33
فصل 3 : روش محتوا محور………………………………………………………………………………………………………36
3-1- پیشگفتار………………………………………………………………………………………………………………………….37
3-2- روند کار روش محتوا محور……………………………………………………………………………………………..37
3-2-1- تحلیلگر محتوا…………………………………………………………………………………………………………..38
3-2-2- یادگیرنده نمایه …………………………………………………………………………………………………..39
3-2-3- جزء فیلترینگ…………………………………………………………………………………………………………….42
3-3- مزایای روش محتوا محور………………………………………………………………………………………………..42
3-3-1- استقلال کاربر……………………………………………………………………………………………………………..42
3-3-2- شفافیت……………………………………………………………………………………………………………………….42
3-3-3- قلم جدید…………………………………………………………………………………………………………………….43
3-4- معایب روش محتوا محور…………………………………………………………………………………………………43
3-4-1- کمبود محتوا……………………………………………………………………………………………………………….43
3-4-2- خصوصی سازی افزون…………………………………………………………………………………………………43
3-4-3- کاربر جدید………………………………………………………………………………………………………………….44
فصل 4 : روش پیشنهادی………………………………………………………………………………………………………….45
4-1- پیشگفتار………………………………………………………………………………………………………………………….46
4-2- مروری بر کارهای انجام شده در این راستا……………………………………………………………………..46
4-3- مقدمهای بر روش پیشنهادی…………………………………………………………………………………………..48
4-4- روش پیشنهادی………………………………………………………………………………………………………………48
4-4-1- پیش پردازش………………………………………………………………………………………………………………49
4-4-1-1- پیش پردازش بر روی پایگاه داده MovieLens………………………………………………..49
4-4-1-2- پیش پردازش بر روی پایگاه داده EachMovie………………………………………………..50
4-4-2- وزندهی به اقلام…………………………………………………………………………………………………………51
4-4-3- انتخابهمسایگی…………………………………………………………………………………………………………53
4-4-4- پیشبینی……………………………………………………………………………………………………………………54
فصل 5 : آزمایشها و نتایج……………………………………………………………………………………………………….56
5-1- پایگاه دادههای مورد استفاده…………………………………………………………………………………………..57
5-2- نحوه اجرای روش پیشنهادی روی پایگاه داده MovieLens……………………………………….57
5-3- نحوه اجرای روش پیشنهادی روی پایگاه داده ٍEachMovie……………………………………….58
5-4- معیارهایارزیابی………………………………………………………………………………………………………………58
5-4-1- میانگین خطای مطلق…………………………………………………………………………………………………58
5-4-2- دقت و فراخوانی………………………………………………………………………………………………………….59
5-4-3- معیار ارزیابیF1…………………………………………………………………………………………………………60
5-5- ارزیابی روش پیشنهادی توسط معیارهای معرفی شده…………………………………………………..61
فصل 6 : بحث و نتیجهگیری…………………………………………………………………………………………………….66
6-1- بحث…………………………………………………………………………………………………………………………………67
6-2- نتیجهگیری……………………………………………………………………………………………………………………..67
6-4- پیشنهادات……………………………………………………………………………………………………………………….68
مراجع………………………………………………………………………………………………………………………………………..69
فهرست جدول ها
عنوان و شماره صفحه
جدول شماره 1 : نمونههایی از سیستمهای پیشنهادگر و اقلام پیشنهادی آنها…………………………7
جدول شماره 2 : مقایسه میانگین خطای مطلق روش پایه و روش پیشنهادی، اعمال شده بر MovieLens……………………………………………………………………………………………………………………………61
جدول شماره 3 : مقایسه میانگین خطای مطلق روش پایه و روش پیشنهادی، اعمال شده بر EachMovie……………………………………………………………………………………………………………………………61
جدول شماره 4 : مقایسه معیار دقت روش پایه و روش پیشنهادی، اعمال شده بر
MovieLens……………………………………………………………………………………………………………………………61
جدول شماره 5 : مقایسه معیار دقت روش پایه و روش پیشنهادی، اعمال شده بر
EachMovie …………………………………………………………………………………………………………………………..62
جدول شماره 6 : مقایسه معیار فراخوانی روش پایه و روش پیشنهادی، اعمال شده بر MovieLens……………………………………………………………………………………………………………………………62
جدول شماره 7 : مقایسه معیار فراخوانی روش پایه و روش پیشنهادی، اعمال شده بر EachMovie………………...…………………………………………………………………………………………………………62
جدول شماره 8 : مقایسه معیارF1 روش پایه و روش پیشنهادی، اعمال شده بر MovieLens……………………………………………………………………………………………………………………………62
جدول شماره 9 : مقایسه معیارF1 روش پایه و روش پیشنهادی، اعمال شده بر
EachMovie……………………………………………………………………………………………………………………………62
جدول شماره 10 : مقایسه میانگین خطای مطلق روش پیشنهادی با روشهای[19] و [20]…………………………………………………………………………………………………………………………………………..65
فهرست تصاویر
عنوان و شماره صفحه
شکل شماره 1: نمونههایی از موتورهای جستجوگر………………………………………………………………….5
شکل شماره 2 : نمونه صفحهای از سایت Movielens………………………………………………………….11
شکل شماره 3 : نمونه صفحه درخواست امتیازدهی Movielens از کاربر…………………………….12
شکل شماره 4 : نمونه صفحه فیلمهای پیشنهادی از سوی Movielens به کاربر………………13
شکل شماره 5 : نمونه ماتریس امتیازدهی کاربران – اقلام………………………………………………………22
شکل شماره 6: فیلترینگ اشتراکی مبتنی بر اقلام………………………………………………………………..25
شکل شماره 7 : فیلترینگ اشتراکی مبتنی بر کاربران…………………………………………………………….25
شکل شماره 8 : روند تولید پیشنهاد در آمازون……………………………………………………………………….34
شکل شماره 9 : نمونه صفحهای از سایت آمازون…………………………………………………………………….35
شکل شماره 10 : ارائه پیشنهاد بر اساس کارت خرید مشتری……………………………………………….35
شکل شماره 11 : روند کار روش محتوا محور………………………………………………………………………….38
شکل شماره 12 : نمونه صفحهای از سایت آمازون…………………………………………………………………40
شکل شماره 13 :استفاده از روش محتوا محور در سایت آمازون…………………………………………..41
شکل شماره 14 : نمایش مفاهیم دقت و فراخوانی در حوزه بازیابی اطلاعات………………………..59
شکل شماره 15: رابطه معیار فراخوانی با معیار دقت……………………………………………………………..60
شکل شماره 16: مقایسه میانگین خطای مطلق روش پایه و روش پیشنهادی، اعمال شده بر
MovieLens……………………………………………………………………………………………………………………………63شکل شماره 17: مقایسه میانگین خطای مطلق روش پایه و روش پیشنهادی، اعمال شده بر
EachMovie…………………………………………………………………………………………………………………………...63
شکل شماره 18: مقایسه معیار دقت، فراخوانی و F روش پایه و روش پیشنهادی، اعمال شده بر EachMovie……………………………………………………………………………………………………………………...64
شکل شماره 19: مقایسه معیار دقت، فراخوانی و F روش پایه و روش پیشنهادی، اعمال شده بر MovieLens………………………………………………………………………………………………………………………..64
مقدمه
1-1- پیشگفتار
پیدایش اینترنت و وب جهان گستر[1] موجب شده است که در رابطه با هر موضوع قابل تصور، حجم بسیار زیادی از اطلاعات وجود داشته باشد که کاربران[2] بتوانند با استفاده از آن نیاز اطلاعاتی خود را برطرف سازند. افزایش روز افزون اطلاعات باعث شد که مشکل سربار اطلاعات[3] به وجود آید و کاربران به تنهایی قادر به برطرف کردن نیازهای خود نباشند. . زیرا کاربران مجبور بودند به صورت بر خط[4] تمامی صفحات را جستجو کنند تا بتوانند آن قسمتی را که مورد نیازشان است پیدا کنند. به همین دلیل موتورهای جستجوگر[5] به وجود آمدند تا کاربران بتوانند با استفاده از آنها بدون نیاز به بررسی تعداد زیادی از صفحات به اطلاعات مورد نظرشان دسترسی پیدا کنند.
برای دانلود متن کامل پایان نامه اینجا کلیک کنید
لینک بالا اشتباه است
:: بازدید از این مطلب : 613
|
امتیاز مطلب : 0
|
تعداد امتیازدهندگان : 0
|
مجموع امتیاز : 0