فصل دوم: 122

2-1- مقدمه. 133

2-2-انگیزه‌های کاوش داده 13

2-3-نیاز به داده‌کاوی.. 15

2-4- چالش‌های داده‌کاوی.. 16

2-4-1- چالش‌های اولیه. 17

2-4-2- چالش‌های ثانویه. 18

2-5-معرفی داده‌کاوی.. 19

2-5-1-منشاُ علمی.. 21

2-5-2- معماری سیستم داده‌کاوی.. 21

2-5-3- مراحل عملیات داده‌کاوی.. 23

2-5-3-1-آماده‌سازی داده 23

2-5-3-2-یادگیری مدل. 24

2-5-3-3-ارزیابی و تفسیر مدل. 25

2-6- محدودیت‌های داده‌کاوی.. 25

2-7- قابلیت‌های داده‌کاوی.. 26

2-8- روش‌های یادگیری مدل در داده‌کاوی.. 26

2-8-1- روش‌های پیش‌بینی.. 26

2-8-1-1- دسته‌بندی.. 27

2-8-1-2- رگرسیون. 27

2-8-1-3-تشخیص انحراف.. 28

2-8-2- روش‌های توصیفی.. 29

2-8-2-1- خوشه‌بندی.. 30

2-8-2-2- کشف قوانین انجمنی.. 32

2-8-2-3- کشف الگوهای ترتیبی.. 32

2-9- فنون داده‌کاوی.. 32

2-9-1- یافتن خودکارخوشه‌ها 34

2-9-1-1-نقاط قدرت این روش… 34

2-9-1-2-نقاط ضعف… 34

2-9-1-3- کاربرد. 34

2-9-2- درخت‌های تصمیم‌گیری و استقرا قاعده‌ای.. 35

2-9-2-1-نقاط قوت.. 35

2-9-2-2-نقاط ضعف روش درخت‌تصمیم‌گیری.. 35

2-9-2-3-کاربرد. 36

2-9-3- شبکه‌های عصبی.. 36

2-9-3-1- نقاط قوت شبکه‌های عصبی مصنوعی.. 36

2-9-3-2- نقاط ضعف شبکه‌عصبی.. 37

2-9-3-3-کاربرد. 37

2-10- درجه‌بندی فنون مختلف داده‌کاوی از جهت سختی و آسانی.. 37

2-11-تعریف داشبورد. 38

2-12- سابقه تحقیق. 43

2-12-1- سابقه داده‌کاوی.. 43

2-12-2- سابقه داشبورد. 47

2-13 بررسی مراحل داشبورد در چند نمونه. 49

2-14-نتیجه گیری.. 50

فصل سوم: 51

3-1- مقدمه. 52

3-2- چارچوب تحقیق. 53

3-3- روش تحقیق. 54

3-3-1- طبقه‌بندی تحقیق برمبنای هدف.. 54

3-3-2- طبقه بندی تحقیق بر مبنای روش… 54

3-3-3- طبقه‌بندی تحقیق بر مبنای نوع داده‌ها 55

3-4- جامعه آماری.. 55

3-5- نمونه‌گیری.. 56

3-5-1- روش نمونه‌گیری.. 56

3-6- روش ها و ابزار گردآوری و تحلیل داده‌ها 56

3-7- ساختار اجرایی تحقیق. 57

3-7-1- ساختار اجرایی بخش اول تحقیق. 58

3-7-1-1- درک مساله. 59

3-7-1-2- شناخت داده‌ها 60

3-7-1-3- آماده سازی داده‌ها 61

3-7-1-4- مدل‌سازی.. 61

3-7-1-5- ارزیابی نتایج. 62

3-7-1-6- بکارگیری مدل. 62

3-8- تحلیل خوشه‌ای.. 63

3-9- الگوریتم  k-means. 64

3-10-شبکه‌عصبی.. 65

3-10-1- معماری شبکه. 66

3-11-درخت‌تصمیم. 67

3-12- شاخص مقایسه نتایج خوشه‌بندی با رویکردهای مختلف… 69

3-12-1- شاخص مجموع خطای مربعی.. 69

3-13- ابزار‌های داده‌کاوی.. 69

3-14- بخش دوم ساختار اجرایی تحقیق. 70

3-14-1- شناسایی شاخص… 70

3-14-2- پیاده‌سازی داشبورد. 70

3-15- ابزار پیاده‌سازی داشبورد. 71

3-16- نتیجه‌گیری.. 71

فصل چهارم: 73

4-1-مقدمه. 74

4-2-فرایند داده‌کاوی.. 74

4-2-1-درک مساله. 74

4-2-2-شناخت داده‌ها 75

4-2-2-1- داده‌ها 75

4-2-2-2- انتخاب داده‌ها 75

4-2-3- آماده سازی و پیش پردازش داده‌ها 76

4-2-3-1- آماده سازی داده‌ها 76

4-2-3-2-پیش پردازش داده‌ها 77

4-2-4-مدل‌سازی.. 82

4-2-4-1-خوشه‌بندی.. 83

4-2-4-2- خوشه‌بندی k-means. 83

4-2-4-3- پیش‌بینی خوشه‌ها 84

4-2-4-4- پیش‌بینی با شبکه‌عصبی.. 85

4-2-4-5- پیش‌بینی با درخت‌تصمیم C5. 85

4-2-5- ارزیابی.. 88

4-2-6- به‌کارگیری مدل. 89

4-3- فرایند طراحی و پیاده‌سازی داشبورد. 89

4-3-1- شناسایی شاخص… 89

4-4- نتیجه‌گیری.. 93

فصل پنجم: 94

5-1- مقدمه. 95

5-2- مروری برفصل‌های گذشته. 95

5-3- دستاوردها و نوآوری‌های تحقیق. 96

5-4- پیشنهادات برای تحقیق‌های آتی.. 97

5-5- محدودیت‌های تحقیق. 98

فهرست منابع. 99

 

 

فهرست جداول

جدول2-1 درجه‌بندی فنون مختلف داده‌کاوی.. 38

جدول 2-2 تعاریف داشبورد در مرور ادبیات.. 38

جدول 2-3 مراحل طراحی داشبورد. 49

جدول3-1 الگوریتم خوشه‌بندی.. 65

جدول 4-1 اقلام اطلاعات فردی دانشجویان. 78

جدول 4-2 اقلام اطلاعاتی معدل دانشجویان. 79

جدول 4-3 اقلام اطلاعاتی دانشگاهی دانشجویان. 79

جدول 4-4 نرخ پارامتر SSE به ازای تعداد خوشه‌ها در k-means. 84

جدول 4-5 پیش بینی با بهره گرفتن از روش شبکه‌عصبی.. 85

جدول 4-6 دسته‌بندی معدل‌‌ها 86

جدول 4-7 پیش بینی با بهره گرفتن از روش درخت تصمیمC5. 87

جدول 5-1 دقت پیش‌بینی‌های انجام شده 97

 

 

فهرست شکل‌ها و نمودارها

شکل 1-1-ساختار تحقیق.. 9

شکل2-1: قیاس رشد حجم داده با رشد تعداد تحلیل‌گران داده 15

شکل 2-2 سلسله مراتب داده تا خرد. 20

شکل 2-3 معماری یک سیستم داده‌کاوی.. 22

شکل 2-4 ساختار داده‌کاوی آموزشی.. 44

شکل 3-1 مراحل اصلی پیشنهادی برای اجرای تحقیق. 53

شکل 3-2  استاندارد جهانی CRISP. 59

شکل 4-1 بخشی از ارتباط داده‌ای جداول. 77

نمودار 4-1 میزان استفاده تکنیک‌های پیش‌پردازش داده 81

شکل 4-2بخشی از داده‌ها در نرم‌افزار Excel 82

شکل 4-3 تعداد رکوردها در هر خوشه. 84

شکل 4-5 اهمیت فیلدها در پیش‌بینی معدل ترم شش دانشجویان. 88

شکل4-6 پیشرفت تحصیلی دانشجویان ورودی سال 1371. 91

شکل4-7 پیشرفت تحصیلی دانشجویان ورودی سال 1381. 91

شکل 4-8 پیش بینی پیشرفت تحصیلی دانشجویان فاقد شغل ورودی سال 1381. 92

شکل 4-9 پیش‌بینی پیشرفت تحصیلی دانشجویان شاغل در سازمان‌های دولتی ورودی سال 1381  93

 

 

خرید فایل متن کامل در سایت zusa.ir

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *