Data preprocessing
ال
data preprocessing بتتضمن :
1. Handling missing data
وده بيتم بطريقتين اما انك تعوض عن ال missing values دي بال mean او ال median او ال mode يا اما ت drop ال row كله
2. Encoding categorical variables
ودي بتيم فيها تحويل ال catigories ل numerical values عن طريق ال label encoding او ال one hot encoding
3. Scaling/ Normalization
ودي بيتم فيها توحيد المدى بتاع كل ال features عشان الموديل ميهتمش ب Feature على حساب التانية
4. Outlier Detection
ودي بيتم فيها تحديد ال outliers وازالتها سواء بال Z scores او ال IQR method
5. Data Splitting
وهنا بتقسم الداتا ل training set و testing set
6. Feature Engineering
ودي بتعمل فيها features جديدة او بت select important features من ال features اللي already موجودة
7. Handling Imbalanced Data
لو الداتا عندك غير متوازنة بتستخدم SMOTE عشان تعيد توازن الداتا
من خلال ال steps اللي قولنا عليهم دول هتضمن ان عندك clean data جاهزة عشان ت train عليها ال model
Comments
Post a Comment