Data preprocessing

 ال


data preprocessing
بتتضمن :

1. Handling missing data

وده بيتم بطريقتين اما انك تعوض عن ال missing values دي بال mean او ال median او ال mode يا اما ت drop ال row كله 


 2. Encoding categorical variables

ودي بتيم فيها تحويل ال catigories ل numerical values عن طريق ال label encoding او ال one hot encoding


3. Scaling/ Normalization

ودي بيتم فيها توحيد المدى بتاع كل ال features عشان الموديل ميهتمش ب Feature على حساب التانية


4. Outlier Detection

ودي بيتم فيها تحديد ال outliers وازالتها سواء بال Z scores او ال IQR method


5. Data Splitting

وهنا بتقسم الداتا ل training set و testing set


6. Feature Engineering 

ودي بتعمل فيها features جديدة او بت select important features من ال features اللي already موجودة 


7. Handling Imbalanced Data 

لو الداتا عندك غير متوازنة بتستخدم SMOTE عشان تعيد توازن الداتا 


من خلال ال steps اللي قولنا عليهم دول هتضمن ان عندك clean data جاهزة عشان ت train عليها ال model

Comments

Popular posts from this blog

Transfer Learning

K-fold cross-validation

From Data to Insights: The Journey of a Machine Learning Model