SAE_2.04/EXO3/README.md

179 lines
4.1 KiB
Markdown
Raw Normal View History

2024-06-09 16:44:32 +02:00
# Exercice 3 : Analyse des salaires
2024-06-09 16:44:32 +02:00
## Table des matières
2024-06-09 17:01:46 +02:00
1. [Initialisation des variables](#init)
2. [Distribution des salaires par genre](#q1)
3. [Histogramme des salaires moyens par niveau d'études](#q2)
4. [Statistiques descriptives des salaires](#q3)
5. [Répartition des salaires par genre](#q4)
---
## Initialisation des variables {#init}
Pour cette exercice, veuillez initaliser les variables suivantes :
2024-06-09 17:06:01 +02:00
**[Script Scilab](scripts/init.sce) :**
2024-06-09 17:01:46 +02:00
```scilab
D = csvRead('data.csv');
DD = csvRead('data.csv',',','.','string');
genre = DD(:,3);
```
2024-06-09 16:44:32 +02:00
---
## Question 1 : Distribution des salaires par genre {#q1}
> Donnez, sous forme d'histogramme, la distribution des salaires suivant le genre.
2024-06-09 17:06:01 +02:00
**[Script Scilab](scripts/q1.sce) :**
2024-06-09 16:44:32 +02:00
```scilab
2024-06-09 17:01:46 +02:00
D_homme = D(genre == 'Male',:);
D_femme = D(genre == 'Female',:);
salaire_homme = D_homme(:,7);
salaire_femme = D_femme(:,7);
num_bins = 50;
2024-06-09 16:44:32 +02:00
subplot(2, 1, 1);
histplot(num_bins, salaire_homme);
title("Distribution des salaires pour les hommes");
xlabel("Salaire");
ylabel("Fréquence");
subplot(2, 1, 2);
histplot(num_bins, salaire_femme);
title("Distribution des salaires pour les femmes");
xlabel("Salaire");
ylabel("Fréquence");
```
**Résultat :**
2024-06-09 17:36:56 +02:00
![q1](img/q1.png)
---
## Question 2 : Histogramme des salaires moyens par niveau d'études {#q2}
> Tracez un histogramme des salaires moyens suivant le niveau d'études.
**[Script Scilab](scripts/q2.sce) :**
```scilab
niveau_etudes = D(:, 4);
salaires = D(:, 7);
unique_niveaux = unique(niveau_etudes);
moy_salaire_par_niveau = zeros(size(unique_niveaux));
for i = 1:length(unique_niveaux)
moy_salaire_par_niveau(i) = mean(salaires(niveau_etudes == unique_niveaux(i)));
end
bar(unique_niveaux, moy_salaire_par_niveau);
xlabel("Niveau d''études");
ylabel("Salaire moyen");
title("Salaire moyen par niveau d''études");
```
**Résultat :**
![q2](img/q2.png)
---
## Question 3 : Statistiques descriptives des salaires {#q3}
> Donnez les quartiles, interquartiles, minimum, maximum, moyenne, médiane, et écart-type des salaires. Tracez une boîte à moustaches.
**[Script Scilab](scripts/q3.sce) :**
```scilab
Q = quart(salaires)
IQR = Q(3) - Q(1);
min_salaire = min(salaires)
max_salaire = max(salaires)
mean(salaires)
median(salaires)
stdev(salaires)
boxplot(salaires)
```
**Résultat :**
- Quartiles : [Q1, Q2 (médiane), Q3] = [70000, 115000, 160000]
2024-06-09 17:52:52 +02:00
- Interquartile Range (IQR) : Q(3) - Q(1) = 90000
2024-06-09 17:36:56 +02:00
- Minimum : 350
- Maximum : 250000
- Moyenne : 115326.96
- Médiane : 115000
- Écart-type : 52786.184
![q3](img/q3.png)
2024-06-09 17:01:46 +02:00
2024-06-09 16:44:32 +02:00
---
2024-06-09 17:36:56 +02:00
## Question 4 : Répartition des salaires par genre {#q4}
> Refaire la question précédente, en distinguant les genres. Tracez une boîte à moustache pour chaque genre. Commentaires ?
**[Script Scilab](scripts/q4.sce) :**
```scilab
2024-06-09 23:30:18 +02:00
QH = quart(salaire_homme)
QF = quart(salaire_femme)
IQH = QH(3) - QH(1)
IQF = QF(3) - QF(1)
min(salaire_homme)
min(salaire_femme)
max(salaire_homme)
max(salaire_femme)
mean(salaire_homme)
mean(salaire_femme)
median(salaire_homme)
median(salaire_femme)
stdev(salaire_homme)
stdev(salaire_femme)
// boite à moustache hommes :
boxplot(salaire_homme);
title("Boîte à moustaches des salaires des hommes");
ylabel("Salaires");
// boite à moustache femmes :
boxplot(salaire_femme);
title("Boîte à moustaches des salaires des femmes");
ylabel("Salaires");
2024-06-09 17:36:56 +02:00
```
**Résultat :**
2024-06-09 17:49:14 +02:00
- Hommes :
2024-06-09 17:36:56 +02:00
2024-06-09 17:49:14 +02:00
- Quartiles : [Q1, Q2 (médiane), Q3] = [75000, 120000, 170000]
- Interquartile Range (IQR) : QH(3) - QH(1) = 95000
- Minimum : 350
- Maximum : 250000
- Moyenne : 121389.87
- Médiane : 120000
- Écart-type : 52092.726
![q4-homme](img/q4-homme.png)
- Femmes :
- Quartiles : [Q1, Q2 (médiane), Q3] = [60000, 105000, 150000]
- Interquartile Range (IQR) : QF(3) - QF(1) = 90000
- Minimum : 500
- Maximum : 220000
- Moyenne : 107889.00
- Médiane : 105000
- Écart-type : 52723.610
![q4-fille](img/q4-fille.png)
---
[⬅️](../EXO2/ "Exercice précédent (Exercice 2)") | [🏠](../ "Retour au sommaire") | [➡️](../EXO4/ "Exercice suivant (Exercice 4)")