دانلود پایان نامه رهیافتی برای نظرکاوی در متون خبری فارسی
نوشته شده توسط : admin

وزارت علوم، تحقیقات و فناوری

دانشگاه علوم و فنون مازندران

 

پایان نامه

مقطع کارشناسی ارشد

 

رشته : فناوری اطلاعات

عنوان : رهیافتی برای نظرکاوی در متون خبری فارسی

استاد راهنما : آقای دکتر مینایی

 

تابستان 1391

برای رعایت حریم خصوصی نام نگارنده پایان نامه درج نمی شود

(در فایل دانلودی نام نویسنده موجود است)

تکه هایی از متن پایان نامه به عنوان نمونه :

(ممکن است هنگام انتقال از فایل اصلی به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود ولی در فایل دانلودی همه چیز مرتب و کامل است)

چکیده :

در این پایان‌نامه به رده‌بندی و تعیین گرایش یا قطبیت احساس در نظرات کاربران از نقطه‌نظر مثبت یا منفی بودن نظرات بیان‌شده، در یکی از پربازدیدترین سایت‌های خبری ایران پرداخته‌ایم. برای این‌کار مشخصه‌های جدیدی را معرفی کرده‌ایم. پس از جمع‌آوری و پیش‌پردازش متن نظرات و استخراج این مشخصه‌ها، آن‌ها را با استفاده از رده‌بند‌های مختلف در حالات و ترکیب‌های گوناگون مورد بررسی قرار داده‌ایم. نتایج بدست آمده نشان از کارایی مناسب مشخصه‌های معرفی شده و رده‌بند‌های مورد استفاده دارند به‌طوری‌که بالاترین دقت (نود و سه درصد) در حالتی بدست آمده است که از تمام مشخصه‌ها برای آموزش رده‌بند استفاده شده است.

علاوه بر کار رده‌بندی مذکور، با نگاهی به انواع دیگر چالش‌ها، تحقیقات انجام‌شده، و مسائل متنوع مرتبط با کاوش در نظرات متنی کاربران (مانند تشخیص شخص بیان کننده‌ی نظر، تشخیص درجه‌ی شدت گرایش، شناسایی نظرات نامطلوب، و…)، ایده‌ی جدید ایجاد یک موتور جستجوی نظرات مطرح و معماری پیشنهادی برای آن ارائه شده است.

 

کلمات کلیدی : کاوش در نظرات، تجزیه‌وتحلیل احساس، تعیین قطبیت احساس، رده‌بندی احساس، شناسایی گرایش احساس، موتور جستجوی نظرات.

فهرست مطالب

فصل1 مقدمه…………………………………………………………………………………………. 1

1-1. مقدمه و ضرورت تحقیق …………………………………………………………………………………….2

1-2. اهداف تحقیق ………………………………………………………………………………………………..5

فصل2 پیشینه‌ی تحقیق……………………………………………………………………………… 7

2-1. مقدمه……………………………………………………………………………………………. 8

2-2. چالش‌ها و کار‌های مرتبط با حوزه‌ی کاوش در نظرات …………………………………………………..8

2-2-1. شناسایی شخص صاحب نظر…………………………………………………………………. 8

2-2-2. تشخیص هدف نظر اظهار‌شده………………………………………………………………… 9

2-2-3. درجه‌بندی نظر……………………………………………………………………………….. 9

2-2-4. جستجو و یافتن متون هدف…………………………………………………………………. 10

2-2-4-1. تشخیص موضوع………………………………………………………………………. 10

2-2-4-2. تشخیص زبان…………………………………………………………………………. 10

2-2-4-3. تشخیص وجود نظر…………………………………………………………………… 11

2-2-5. سطح مطالعه‌ی گرایش احساس……………………………………………………………… 11

2-2-6. منابع لغوی………………………………………………………………………………….. 11

2-2-7. مشخصه‌های استفاده‌شده در مطالعات قبلی………………………………………………….. 12

2-2-8. خلاصه‌سازی………………………………………………………………………………… 12

2-2-9. وزن‌دهی…………………………………………………………………………………….. 12

2-2-10. شناسایی نظرات نامطلوب………………………………………………………………….. 13

2-2-11. پیش‌پردازش‌های لازم بر روی متن………………………………………………………… 13

2-3. ضعف‌هایی در مطالعات قبل که در راستای رفع آن‌ها تلاش شده است ………………………………. 14

فصل3 معماری پیشنهادی برای یک موتور جستجوی نظرات…………………………………. 15

3-1. مقدمه………………………………………………………………………………………….. 16

3-2. واسط کاربر……………………………………………………………………………………. 16

3-3. مدیریت‌کننده‌ی جستجو………………………………………………………………………… 17

3-4. خلاصه‌ساز نتایج……………………………………………………………………………….. 17

3-5. رتبه‌بند…………………………………………………………………………………………. 17

3-6. گسترش‌دهنده‌ی پرس‌و‌جو……………………………………………………………………… 18

3-7. پایگاه‌داده‌ی اطلاعات تحلیل‌شده……………………………………………………………….. 18

3-8. خزش‌گر متمرکز……………………………………………………………………………….. 18

3-8-1. شناسایی وجود احساس………………………………………………………………….. 19

3-8-2. تشخیص موضوع…………………………………………………………………………. 19

3-8-3. تشخیص زبان……………………………………………………………………………. 19

3-9. پایگاه‌داده‌ی اسناد خام………………………………………………………………………….. 19

3-10. تجزیه‌و‌تحلیل داده‌ها………………………………………………………………………….. 19

3-10-1. تشخیص هدف عقیده…………………………………………………………………… 20

3-10-2. تشخیص شخص بیان کننده‌ی اظهار‌نظر…………………………………………………. 20

3-10-3. رده‌بندی احساس……………………………………………………………………….. 20

3-10-4. تشخیص نظرات نا‌مطلوب………………………………………………………………. 20

3-10-5. وزن‌گذاری نظر…………………………………………………………………………. 20

3-10-6. تجزیه‌و‌تحلیل شبکه‌های اجتماعی……………………………………………………….. 21

3-11. پیش‌پردازش اسناد و متون……………………………………………………………………. 21

3-11-1. استخراج جملات……………………………………………………………………….. 21

3-11-2. قطعه‌بندی……………………………………………………………………………….. 22

3-11-3. بررسی املا……………………………………………………………………………… 22

3-11-4. ریشه‌یابی……………………………………………………………………………….. 22

3-11-5. نرمال‌سازی……………………………………………………………………………… 22

3-11-6. تجزیه…………………………………………………………………………………… 23

3-11-7. برچسب‌گذاری اجزاء گفتار……………………………………………………………… 23

3-12. پایگاه داده‌ی اطلاعات پیش‌پردازش‌شده………………………………………………………. 23

فصل4 روش تحقیق، آزمایش‌ها، و نتایج……………………………………………………….. 25

4-1. مقدمه………………………………………………………………………………………….. 26

4-2. انتخاب زمینه…………………………………………………………………………………… 26

4-3. انتخاب و استخراج نظرات……………………………………………………………………… 27

4-4. مشخصه‌های مورد استفاده……………………………………………………………………… 28

4-5. پیش‌پردازش‌های انجام‌شده و استخراج بردار‌های مشخصه……………………………………… 30

4-6. انتخاب رده‌بند‌ها……………………………………………………………………………….. 31

4-7. آزمایش‌های انجام‌شده………………………………………………………………………….. 32

4-8. تحلیل نتایج……………………………………………………………………………………. 41

4-8-1. بهترین نتایج……………………………………………………………………………… 41

4-8-2. بررسی ترکیب دو مشخصه‌ی “گرایش آغازگر”، و “نشانه‌های سؤال”………………………. 41

4-8-3. بررسی افزودن مشخصه‌ی “صفات و قیود استخراج شده به صورت خود‌کار” به دو مشخصه‌ی قبل            42

4-8-4. بررسی تک‌تک مشخصه‌ها……………………………………………………………….. 43

4-8-5. بررسی لحاظ و عدم لحاظ “نرمال‌سازی” و “تعداد رخداد” مشخصه‌ها…………………….. 44

4-8-6. بررسی رده‌بندهای مورد استفاده…………………………………………………………… 45

4-8-7. بررسی تاثیر حذف برخی از صفات و قیود وابسته به زمینه……………………………….. 46

4-8-8. بررسی برخی از رده‌بند‌های مهم و شناخته‌شده‌ی دیگر……………………………………. 46

فصل5 نتیجه‌گیری و کار‌های آتی……………………………………………………………….. 48

5-1. نتیجه‌گیری……………………………………………………………………………………… 49

5-2. کار‌های آتی……………………………………………………………………………………. 50

مراجع و ماخذ……………………………………………………………………………………….. 51

پیوست الف: 50 اظهار‌نظر استفاده شده (از 30 خبر)، به‌همراه مشخصه‌های استخراج‌شده از داخل آن‌ها. 55

واژه‌نامه‌ فارسی- انگلیسی……………………………………………………………………………. 86

واژه‌نامه‌ انگلیسی- فارسی……………………………………………………………………………. 88

چکیده‌ی انگلیسی………………………………………………………………………………………………….. 90

 

فهرست جداول

جدول4-1. نتایج بدست‌آمده با لحاظ تعداد رخداد و بدون نرمال‌سازی توسط رده‌بند Naïve Bayesian 34

جدول4-2. نتایج بدست‌آمده با لحاظ تعداد رخداد و بدون نرمال‌سازی توسط رده‌بند SVM…………. 35

جدول4-3. نتایج بدست‌آمده با لحاظ تعداد رخداد و بصورت نرمال‌‌شده توسط رده‌بند Naïve Bayesian 36

جدول4-4. نتایج بدست‌آمده با لحاظ تعداد رخداد و بصورت نرمال‌‌شده توسط رد‌بند SVM…………. 37

جدول4-5. نتایج بدست‌آمده بدون لحاظ تعداد رخداد توسط رده‌بند Naïve Bayesian………………. 38

جدول4-6. نتایج بدست‌آمده بدون لحاظ تعداد رخداد توسط رده‌بند SVM………………………….. 39

جدول4-7. نتایج آزمایش مجدد 3 حالت منتخب پس از افزودن صفات و قیود وابسته به زمینه در کنار نتایج قبل       40

جدول4-8. نتایج استفاده از رده‌بند‌های دیگر در کنار نتایج قبل برای 4 حالت منتخب……………….. 40

 

فهرست اشکال

شکل3-1. معماری پیشنهادی برای یک “موتور جستجوی نظرات”……………………………………. 24

فصل‌1

مقدمه

1-1. مقدمه و ضرورت تحقیق

اطلاع از نظر دیگران از نقطه‌نظرات گوناگون دارای اهمیت فراوانی است. تصور کنید که قصد دارید کالا یا خدماتی را خریداری کنید. آگاهی از نظر مثبت یا منفی افرادی که قبلا آن کالا یا خدمات را خریداری کرده‌اند چقدر برای شما اهمیت دارد؟ آیا نظر آن‌ها می‌تواند بر تصمیم شما تاثیر‌گذار باشد؟ اگر یک شرکت خدماتی داشتید به چه میزان علاقه‌مند به اطلاع از نظر مخاطبین خود در رابطه با مطلوبیت یا عدم مطلوبیت خدمات خود بودید؟ آیا اطلاع از نظر آن‌ها در اتخاذ تصمیمات بهتر به شما کمک می‌کرد؟ اگر یک کاندیدای انتخاباتی بودید تمایل داشتید تا از اقبال یا عدم اقبال رای‌دهندگان نسبت به خود خبر داشته باشید؟

اگر به اطرافمان نگاه کن

برای دانلود متن کامل پایان نامه اینجا کلیک کنید





لینک بالا اشتباه است

برای دانلود متن کامل اینجا کلیک کنید

       
:: بازدید از این مطلب : 608
|
امتیاز مطلب : 0
|
تعداد امتیازدهندگان : 0
|
مجموع امتیاز : 0
تاریخ انتشار : دو شنبه 7 تير 1395 | نظرات ()
مطالب مرتبط با این پست
لیست
می توانید دیدگاه خود را بنویسید


نام
آدرس ایمیل
وب سایت/بلاگ
:) :( ;) :D
;)) :X :? :P
:* =(( :O };-
:B /:) =DD :S
-) :-(( :-| :-))
نظر خصوصی

 کد را وارد نمایید:

آپلود عکس دلخواه: