SAE_2.04/EXO3/README.md

268 lines
7.2 KiB
Markdown
Raw Normal View History

2024-06-09 16:44:32 +02:00
# Exercice 3 : Analyse des salaires
2024-06-09 16:44:32 +02:00
## Table des matières
2024-06-09 17:01:46 +02:00
1. [Initialisation des variables](#init)
2. [Distribution des salaires par genre](#q1)
3. [Histogramme des salaires moyens par niveau d'études](#q2)
4. [Statistiques descriptives des salaires](#q3)
5. [Répartition des salaires par genre](#q4)
---
## Initialisation des variables {#init}
Pour cette exercice, veuillez initaliser les variables suivantes :
2024-06-09 17:06:01 +02:00
**[Script Scilab](scripts/init.sce) :**
2024-06-09 17:01:46 +02:00
```scilab
2024-06-16 18:16:00 +02:00
csvDouble = csvRead("data.csv"); //ouvre data.csv en une matrice d'entier
csvString = csvRead("data.csv",[],[],'string'); //ouvre data.csv en une matrice de string
2024-06-09 17:01:46 +02:00
```
2024-06-09 16:44:32 +02:00
---
## Question 1 : Distribution des salaires par genre {#q1}
> Donnez, sous forme d'histogramme, la distribution des salaires suivant le genre.
2024-06-14 20:33:54 +02:00
**[Script Scilab - hommes](scripts/q1-homme.sce) :**
2024-06-09 16:44:32 +02:00
```scilab
2024-06-16 18:16:00 +02:00
id_male = find(csvString(:,3) == "Male" );
salaire_male = csvDouble(id_male,7);
histplot(10,salaire_male,normalization=%f);
2024-06-17 00:54:48 +02:00
xlabel('Salaire');
ylabel('Effectifs');
title('Distribution des salaires pour les hommes');
2024-06-14 20:33:54 +02:00
```
**[Script Scilab - femmes](scripts/q1-femme.sce) :**
```scilab
2024-06-16 18:16:00 +02:00
id_female = find(csvString(:,3) == "Female" );
salaire_female = csvDouble(id_female,7);
histplot(10,salaire_female,normalization=%f);
2024-06-17 00:54:48 +02:00
xlabel('Salaire');
ylabel('Effectifs');
title('Distribution des salaires pour les femmes');
2024-06-14 20:33:54 +02:00
```
**[Script Scilab - autres](scripts/q1-autres.sce) :**
```scilab
2024-06-16 18:16:00 +02:00
id_other = find(csvString(:,3) == "Other" );
salaire_other = csvDouble(id_other,7);
histplot(10,salaire_other,normalization=%f);
2024-06-17 00:54:48 +02:00
xlabel('Salaires');
ylabel('Effectifs');
title('Distribution des salaires pour les autres');
2024-06-09 16:44:32 +02:00
```
**Résultat :**
2024-06-14 20:33:54 +02:00
Hommes :
![q1](img/q1-homme.png)
Femmes :
![q1](img/q1-femme.png)
Autres :
![q1](img/q1-autres.png)
2024-06-09 17:36:56 +02:00
---
## Question 2 : Histogramme des salaires moyens par niveau d'études {#q2}
> Tracez un histogramme des salaires moyens suivant le niveau d'études.
**[Script Scilab](scripts/q2.sce) :**
```scilab
2024-06-16 18:16:00 +02:00
indice_high = find(csvDouble(:,4) == 0 );
salaire_high = csvDouble(indice_high,7);
moy_h = mean(salaire_high);
2024-06-14 20:33:54 +02:00
2024-06-09 17:36:56 +02:00
2024-06-16 18:16:00 +02:00
indice_b = find(csvDouble(:,4) == 1 );
salaire_b = csvDouble(indice_b,7);
moy_b = mean(salaire_b);
2024-06-09 17:36:56 +02:00
2024-06-14 20:33:54 +02:00
2024-06-16 18:16:00 +02:00
indice_m = find(csvDouble(:,4) == 2 );
salaire_m = csvDouble(indice_m,7);
moy_m = mean(salaire_m);
2024-06-14 20:33:54 +02:00
2024-06-16 18:16:00 +02:00
indice_p = find(csvDouble(:,4) == 3);
salaire_p = csvDouble(indice_p,7);
moy_p = mean(salaire_p);
2024-06-14 20:33:54 +02:00
2024-06-16 18:16:00 +02:00
matrice = [moy_h,moy_b,moy_m,moy_p];
bar([0,1,2,3],matrice);
2024-06-09 17:36:56 +02:00
xlabel("Niveau d''études");
ylabel("Salaire moyen");
title("Salaire moyen par niveau d''études");
```
**Résultat :**
![q2](img/q2.png)
---
## Question 3 : Statistiques descriptives des salaires {#q3}
> Donnez les quartiles, interquartiles, minimum, maximum, moyenne, médiane, et écart-type des salaires. Tracez une boîte à moustaches.
**[Script Scilab](scripts/q3.sce) :**
```scilab
2024-06-14 20:33:54 +02:00
mean(csvDouble(:,7)) //moyenne
min(csvDouble(:,7)) //min
max(csvDouble(:,7)) //max
median(csvDouble(:,7)) //médianne
quart(csvDouble(:,7)) //quartile
iqr(csvDouble(:,7)) //interquartile
stdev(csvDouble(:,7)) //ecart-type
sal = tabul(csvDouble(:,7));
[occurence_tri,indice_tri] = gsort(sal(:,2));
liste_exp = sal(:,1);
2024-06-16 18:16:00 +02:00
mode = liste_exp(indice_tri(1)) //mode
2024-06-14 20:33:54 +02:00
2024-06-16 18:16:00 +02:00
atomsLoad("stixbox");
boxplot(csvDouble(:,7),"orientation","horizontal");
2024-06-17 00:54:48 +02:00
xlabel('Salaires');
title('Boîte à moustache des salaires');
2024-06-09 17:36:56 +02:00
```
**Résultat :**
- Quartiles : [Q1, Q2 (médiane), Q3] = [70000, 115000, 160000]
2024-06-09 17:52:52 +02:00
- Interquartile Range (IQR) : Q(3) - Q(1) = 90000
2024-06-09 17:36:56 +02:00
- Minimum : 350
- Maximum : 250000
- Moyenne : 115326.96
- Médiane : 115000
2024-06-14 20:33:54 +02:00
- Mode : 140000
2024-06-09 17:36:56 +02:00
- Écart-type : 52786.184
![q3](img/q3.png)
2024-06-09 17:01:46 +02:00
2024-06-09 16:44:32 +02:00
---
2024-06-09 17:36:56 +02:00
## Question 4 : Répartition des salaires par genre {#q4}
> Refaire la question précédente, en distinguant les genres. Tracez une boîte à moustache pour chaque genre. Commentaires ?
2024-06-15 19:42:14 +02:00
**[Script Scilab - Autres](scripts/q4-autres.sce) :**
2024-06-09 17:36:56 +02:00
```scilab
2024-06-15 19:42:14 +02:00
id_other = find(csvString(:,3) == "Other" )
salaire_other = csvDouble(id_other,7)
mean(salaire_other) //moyenne
min(salaire_other) //min
max(salaire_other) //max
median(salaire_other) //médianne
quart(salaire_other) //quartile
iqr(salaire_other) //interquartile
stdev(salaire_other) //ecart-type
sal = tabul(salaire_other);
[occurence_tri,indice_tri] = gsort(sal(:,2));
liste_sal = sal(:,1);
mode = liste_sal(indice_tri(1)) //mode
2024-06-17 00:54:48 +02:00
boxplot(salaire_other,"orientation","horizontal")
xlabel('Salaires');
title('Boîte à moustache des salaires des autres');
2024-06-15 19:42:14 +02:00
```
**[Script Scilab - Femmes](scripts/q4-femme.sce) :**
```scilab
id_female = find(csvString(:,3) == "Female" )
salaire_female = csvDouble(id_female,7)
mean(salaire_female) //moyenne
min(salaire_female) //min
max(salaire_female) //max
median(salaire_female) //médianne
quart(salaire_female) //quartile
iqr(salaire_female) //interquartile
stdev(salaire_female) //ecart-type
sal = tabul(salaire_female);
[occurence_tri,indice_tri] = gsort(sal(:,2));
liste_sal = sal(:,1);
mode = liste_sal(indice_tri(1)) //mode
boxplot(salaire_female,"orientation","horizontal")
2024-06-17 00:54:48 +02:00
xlabel('Salaires');
title('Boîte à moustache des salaires des femmes');
2024-06-15 19:42:14 +02:00
```
**[Script Scilab - Hommes](scripts/q4-homme.sce) :**
```scilab
id_male = find(csvString(:,3) == "Male" )
salaire_male = csvDouble(id_male,7)
mean(salaire_male) //moyenne
min(salaire_male) //min
max(salaire_male) //max
median(salaire_male) //médianne
quart(salaire_male) //quartile
iqr(salaire_male) //interquartile
stdev(salaire_male) //ecart-type
sal = tabul(salaire_male);
[occurence_tri,indice_tri] = gsort(sal(:,2));
liste_sal = sal(:,1);
mode = liste_sal(indice_tri(1)) //mode
boxplot(salaire_male,"orientation","horizontal")
2024-06-17 00:54:48 +02:00
xlabel('Salaires');
title('Boîte à moustache des salaires des hommes');
2024-06-09 17:36:56 +02:00
```
**Résultat :**
2024-06-09 17:49:14 +02:00
- Hommes :
2024-06-09 17:36:56 +02:00
2024-06-15 19:42:14 +02:00
- Quartiles : [Q1, Q2 (médiane), Q3] = [75000, 120000, 170000]
- Interquartile Range (IQR) : QH(3) - QH(1) = 95000
- Minimum : 350
- Maximum : 250000
- Moyenne : 121389.87
- Médiane : 120000
- Écart-type : 52092.726
- Mode : 140000
2024-06-09 17:49:14 +02:00
![q4-homme](img/q4-homme.png)
- Femmes :
2024-06-15 19:42:14 +02:00
- Quartiles : [Q1, Q2 (médiane), Q3] = [60000, 105000, 150000]
- Interquartile Range (IQR) : QF(3) - QF(1) = 90000
- Minimum : 500
- Maximum : 220000
- Moyenne : 107889.00
- Médiane : 105000
- Écart-type : 52723.610
- Mode : 120000
2024-06-14 20:33:54 +02:00
![q4-femme](img/q4-femme.png)
2024-06-15 19:42:14 +02:00
- Autres :
2024-06-14 20:33:54 +02:00
2024-06-15 19:42:14 +02:00
- Quartiles : [Q1, Q2 (médiane), Q3] = [69032, 158610, 161393]
- Interquartile Range (IQR) : QF(3) - QF(1) = 92361
- Minimum : 62852
- Maximum : 166109
- Moyenne : 125869.86
- Médiane : 158610
- Écart-type : 44242.383
- Mode : 158966
2024-06-14 20:33:54 +02:00
![q4-autres](img/q4-autres.png)
2024-06-09 17:49:14 +02:00
2024-06-16 23:13:59 +02:00
- Commentaires : Les 3 diagrammes moustaches sembles être très similaires. Le placement de la médiane et des quartiles se confondent.
2024-06-09 17:49:14 +02:00
---
[⬅️](../EXO2/ "Exercice précédent (Exercice 2)") | [🏠](../ "Retour au sommaire") | [➡️](../EXO4/ "Exercice suivant (Exercice 4)")