مقدماتی
- ورود داده و پیش پردازش
- نصب برنامه
- شناخت داده ها( تعریف، انواع داده، انواع مجموعه داده)
- پاکسازی داده( داده پرت و نویز،
- داده از دست رفته
- و روش های برخورد، داده تکراری
- روش های تشخیص داده پرت: مبتنی بر فاصله Knn ،LOF
- جمع آوری داده(Integration)
- تجمیع(aggregation)
- نمونه برداری(sampling)
- کاهش ابعاد
- انتخاب ویژگی
- تولید ویژگی
- گسسته سازی
دسته بندی (مدل های با ناظر)
- ارزیابی مدل ها( پارامترها، ماتریس درهم ریختگی، نمودار (ROC
- رده بندی و پیش بینی( درخت تصمیم، شبکه عصبی، بیز ساده، نزدیکترین همسایه، بردار پشتیبان، به خاطرسپاری، رگرسیون، روشهای جمعی بگینگ و بوستینگ و ...
مدل های بدون ناظر(خوشه بندی و قوانین انجمنی)
- خوشه بندی( روشهای معمول k-means- k-mediods
- روش های ارزیابی خوشه بندی
- تعریف روش های موجود رپیدماینر(apriori، fp- growth)
- ارزیابی
پیشرفته
روش های دیگر تشخیص داده پرت( LIbSVM ، خوشه بندی)
- الگوریتم ژنتیک
- الگوریتم ازدحام ذرات
- Relief
- رده نامتوازن( روش های برخورد با حل مشکل رده نامتوازن)
- SOM
- تبدیل متغیر هدف چند مقداری به دو مقداری
- حل مثال RFM در نرم افزار و تحلیل خوشه بندی
- نمودار Pareto
- Compare Roc
- مشاوره پایان نامه و نوآوری
دیدگاه ها (0)