179 lines
4.1 KiB
Markdown
179 lines
4.1 KiB
Markdown
# Exercice 3 : Analyse des salaires
|
|
|
|
## Table des matières
|
|
1. [Initialisation des variables](#init)
|
|
2. [Distribution des salaires par genre](#q1)
|
|
3. [Histogramme des salaires moyens par niveau d'études](#q2)
|
|
4. [Statistiques descriptives des salaires](#q3)
|
|
5. [Répartition des salaires par genre](#q4)
|
|
|
|
---
|
|
|
|
## Initialisation des variables {#init}
|
|
|
|
Pour cette exercice, veuillez initaliser les variables suivantes :
|
|
|
|
**[Script Scilab](scripts/init.sce) :**
|
|
|
|
```scilab
|
|
D = csvRead('data.csv');
|
|
DD = csvRead('data.csv',',','.','string');
|
|
genre = DD(:,3);
|
|
```
|
|
|
|
---
|
|
|
|
## Question 1 : Distribution des salaires par genre {#q1}
|
|
|
|
> Donnez, sous forme d'histogramme, la distribution des salaires suivant le genre.
|
|
|
|
**[Script Scilab](scripts/q1.sce) :**
|
|
|
|
```scilab
|
|
D_homme = D(genre == 'Male',:);
|
|
D_femme = D(genre == 'Female',:);
|
|
salaire_homme = D_homme(:,7);
|
|
salaire_femme = D_femme(:,7);
|
|
num_bins = 50;
|
|
|
|
subplot(2, 1, 1);
|
|
histplot(num_bins, salaire_homme);
|
|
title("Distribution des salaires pour les hommes");
|
|
xlabel("Salaire");
|
|
ylabel("Fréquence");
|
|
|
|
subplot(2, 1, 2);
|
|
histplot(num_bins, salaire_femme);
|
|
title("Distribution des salaires pour les femmes");
|
|
xlabel("Salaire");
|
|
ylabel("Fréquence");
|
|
```
|
|
|
|
**Résultat :**
|
|
|
|
![q1](img/q1.png)
|
|
|
|
---
|
|
|
|
## Question 2 : Histogramme des salaires moyens par niveau d'études {#q2}
|
|
|
|
> Tracez un histogramme des salaires moyens suivant le niveau d'études.
|
|
|
|
**[Script Scilab](scripts/q2.sce) :**
|
|
|
|
```scilab
|
|
niveau_etudes = D(:, 4);
|
|
salaires = D(:, 7);
|
|
unique_niveaux = unique(niveau_etudes);
|
|
moy_salaire_par_niveau = zeros(size(unique_niveaux));
|
|
|
|
for i = 1:length(unique_niveaux)
|
|
moy_salaire_par_niveau(i) = mean(salaires(niveau_etudes == unique_niveaux(i)));
|
|
end
|
|
|
|
bar(unique_niveaux, moy_salaire_par_niveau);
|
|
|
|
xlabel("Niveau d''études");
|
|
ylabel("Salaire moyen");
|
|
title("Salaire moyen par niveau d''études");
|
|
```
|
|
|
|
**Résultat :**
|
|
|
|
![q2](img/q2.png)
|
|
|
|
---
|
|
|
|
## Question 3 : Statistiques descriptives des salaires {#q3}
|
|
|
|
> Donnez les quartiles, interquartiles, minimum, maximum, moyenne, médiane, et écart-type des salaires. Tracez une boîte à moustaches.
|
|
|
|
**[Script Scilab](scripts/q3.sce) :**
|
|
|
|
```scilab
|
|
Q = quart(salaires)
|
|
IQR = Q(3) - Q(1);
|
|
min_salaire = min(salaires)
|
|
max_salaire = max(salaires)
|
|
mean(salaires)
|
|
median(salaires)
|
|
stdev(salaires)
|
|
boxplot(salaires)
|
|
```
|
|
**Résultat :**
|
|
|
|
- Quartiles : [Q1, Q2 (médiane), Q3] = [70000, 115000, 160000]
|
|
- Interquartile Range (IQR) : Q(3) - Q(1) = 90000
|
|
- Minimum : 350
|
|
- Maximum : 250000
|
|
- Moyenne : 115326.96
|
|
- Médiane : 115000
|
|
- Écart-type : 52786.184
|
|
|
|
![q3](img/q3.png)
|
|
|
|
---
|
|
|
|
## Question 4 : Répartition des salaires par genre {#q4}
|
|
|
|
> Refaire la question précédente, en distinguant les genres. Tracez une boîte à moustache pour chaque genre. Commentaires ?
|
|
|
|
**[Script Scilab](scripts/q4.sce) :**
|
|
|
|
```scilab
|
|
QH = quart(salaire_homme)
|
|
QF = quart(salaire_femme)
|
|
IQH = QH(3) - QH(1)
|
|
IQF = QF(3) - QF(1)
|
|
min(salaire_homme)
|
|
min(salaire_femme)
|
|
max(salaire_homme)
|
|
max(salaire_femme)
|
|
mean(salaire_homme)
|
|
mean(salaire_femme)
|
|
median(salaire_homme)
|
|
median(salaire_femme)
|
|
stdev(salaire_homme)
|
|
stdev(salaire_femme)
|
|
|
|
// boite à moustache hommes :
|
|
boxplot(salaire_homme);
|
|
title("Boîte à moustaches des salaires des hommes");
|
|
ylabel("Salaires");
|
|
|
|
// boite à moustache femmes :
|
|
boxplot(salaire_femme);
|
|
title("Boîte à moustaches des salaires des femmes");
|
|
ylabel("Salaires");
|
|
```
|
|
|
|
**Résultat :**
|
|
|
|
- Hommes :
|
|
|
|
- Quartiles : [Q1, Q2 (médiane), Q3] = [75000, 120000, 170000]
|
|
- Interquartile Range (IQR) : QH(3) - QH(1) = 95000
|
|
- Minimum : 350
|
|
- Maximum : 250000
|
|
- Moyenne : 121389.87
|
|
- Médiane : 120000
|
|
- Écart-type : 52092.726
|
|
|
|
![q4-homme](img/q4-homme.png)
|
|
|
|
|
|
- Femmes :
|
|
|
|
- Quartiles : [Q1, Q2 (médiane), Q3] = [60000, 105000, 150000]
|
|
- Interquartile Range (IQR) : QF(3) - QF(1) = 90000
|
|
- Minimum : 500
|
|
- Maximum : 220000
|
|
- Moyenne : 107889.00
|
|
- Médiane : 105000
|
|
- Écart-type : 52723.610
|
|
|
|
![q4-fille](img/q4-fille.png)
|
|
|
|
---
|
|
|
|
[⬅️](../EXO2/ "Exercice précédent (Exercice 2)") | [🏠](../ "Retour au sommaire") | [➡️](../EXO4/ "Exercice suivant (Exercice 4)") |