Exercice 4 : Analyse des salaires
Table des matières
- Initialisation des variables
 - Distribution des salaires par genre
 - Histogramme des salaires moyens par niveau d'études
 - Statistiques descriptives des salaires
 - Répartition des salaires par genre
 
Initialisation des variables
Pour cette exercice, veuillez initaliser les variables suivantes :
D = csvRead('data.csv');
DD = csvRead('data.csv',',','.','string');
genre = DD(:,3);
Question 1 : Distribution des salaires par genre
Donnez, sous forme d'histogramme, la distribution des salaires suivant le genre.
D_homme = D(genre == 'Male',:);
D_femme = D(genre == 'Female',:);
salaire_homme = D_homme(:,7);
salaire_femme = D_femme(:,7);
num_bins = 50;
subplot(2, 1, 1);
histplot(num_bins, salaire_homme);
title("Distribution des salaires pour les hommes");
xlabel("Salaire");
ylabel("Fréquence");
subplot(2, 1, 2); 
histplot(num_bins, salaire_femme);
title("Distribution des salaires pour les femmes");
xlabel("Salaire");
ylabel("Fréquence");
Résultat :
Question 2 : Histogramme des salaires moyens par niveau d'études
Tracez un histogramme des salaires moyens suivant le niveau d'études.
niveau_etudes = D(:, 4);
salaires = D(:, 7);
unique_niveaux = unique(niveau_etudes);
moy_salaire_par_niveau = zeros(size(unique_niveaux));
for i = 1:length(unique_niveaux)
    moy_salaire_par_niveau(i) = mean(salaires(niveau_etudes == unique_niveaux(i)));
end
bar(unique_niveaux, moy_salaire_par_niveau);
xlabel("Niveau d''études");
ylabel("Salaire moyen");
title("Salaire moyen par niveau d''études");
Résultat :
Question 3 : Statistiques descriptives des salaires
Donnez les quartiles, interquartiles, minimum, maximum, moyenne, médiane, et écart-type des salaires. Tracez une boîte à moustaches.
Q = quart(salaires)
IQR = Q(3) - Q(1);
min_salaire = min(salaires)
max_salaire = max(salaires)
mean(salaires)
median(salaires)
stdev(salaires)
boxplot(salaires)
Résultat :
- Quartiles : [Q1, Q2 (médiane), Q3] = [70000, 115000, 160000]
 - Interquartile Range (IQR) : Q(3) - Q(1) = 90000
 - Minimum : 350
 - Maximum : 250000
 - Moyenne : 115326.96
 - Médiane : 115000
 - Écart-type : 52786.184
 
Question 4 : Répartition des salaires par genre
Refaire la question précédente, en distinguant les genres. Tracez une boîte à moustache pour chaque genre. Commentaires ?
QH = quart(salaire_homme)  
QF = quart(salaire_femme)
IQH = QH(3) - QH(1)   
IQF = QF(3) - QF(1)
 min(salaire_homme)  
min(salaire_femme)   
max(salaire_homme)   
max(salaire_femme)   
mean(salaire_homme) 
mean(salaire_femme)  
median(salaire_homme) 
median(salaire_femme)  
stdev(salaire_homme) 
stdev(salaire_femme) 
// boite à moustache hommes : 
boxplot(salaire_homme);
title("Boîte à moustaches des salaires des hommes");
ylabel("Salaires");
// boite à moustache femmes : 
boxplot(salaire_femme);
title("Boîte à moustaches des salaires des femmes");
ylabel("Salaires");
Résultat :
- 
Hommes :
- Quartiles : [Q1, Q2 (médiane), Q3] = [75000, 120000, 170000]
 - Interquartile Range (IQR) : QH(3) - QH(1) = 95000
 - Minimum : 350
 - Maximum : 250000
 - Moyenne : 121389.87
 - Médiane : 120000
 - Écart-type : 52092.726
 
 - 
Femmes :
- Quartiles : [Q1, Q2 (médiane), Q3] = [60000, 105000, 150000]
 - Interquartile Range (IQR) : QF(3) - QF(1) = 90000
 - Minimum : 500
 - Maximum : 220000
 - Moyenne : 107889.00
 - Médiane : 105000
 - Écart-type : 52723.610
 
 




