SAE_2.04/EXO5/README.md
2024-06-16 18:16:00 +02:00

3.8 KiB

Exercice 5 : Analyse de la relation entre expérience et salaire par genre et niveau d'études

Table des matières

  1. Initialisation des variables
  2. Nuage de points et régression linéaire : Expérience vs Salaire par genre
  3. Nuage de points et régression linéaire : Expérience vs Salaire par niveau d'études

Initialisation des variables

Pour cette exercice, veuillez initaliser les variables suivantes :

Script Scilab :

csvDouble = csvRead("data.csv")                         //ouvre data.csv en une matrice d'entier
csvString = csvRead("data.csv",[],[],'string')          //ouvre data.csv en une matrice de string

Question 1 : Nuage de points et régression linéaire : Expérience vs Salaire par genre

Tracez un nuage de points (salaire,expérience) pour les hommes et les femmes, ainsi que les droites de regression associées. Commentaire ?

Script Scilab - Hommes :

id_male = find(csvString(:,3) == "Male" )
salaire_male = csvDouble(id_male,7)
exp_male = csvDouble(id_male,6)
plot2d(salaire_male,exp_male,-1)
[a,b] = reglin(salaire_male',exp_male')
y_reg = a*salaire_male+b
plot2d(salaire_male,y_reg,5)

Script Scilab - Femmes :

id_female = find(csvString(:,3) == "Female" )
salaire_female = csvDouble(id_female,7)
exp_female = csvDouble(id_female,6)
plot2d(salaire_female,exp_female,-1)
[a,b] = reglin(salaire_female',exp_female')
y_reg = a*salaire_female+b
plot2d(salaire_female,y_reg,5)

Résultat :

  • Nuage de points - Hommes : q1

  • Nuage de points - Femmes : q1

  • Commentaire : D'après les deux droites de régressions, lorsque l'on compare les hommes et les femmes, les femmes semblent avoir un meilleur salaire pour une expèrience moindre,


Question 2 : Nuage de points et régression linéaire : Expérience vs Salaire par niveau d'études

Tracez un nuage de points (salaire,expérince) et les droites de regression associées pour chaque niveau d'études. Commentaire ?

Script Scilab - Niveau d'étude n°1 :

indice_high = find(csvDouble(:,4) == 0 )
salaire_high = csvDouble(indice_high,7)
exp_high = csvDouble(indice_high,6)
plot2d(salaire_high,exp_high,-1)
[a,b] = reglin(salaire_high',exp_high')
y_reg = a*salaire_high+b
plot2d(salaire_high,y_reg,5)

Script Scilab - Niveau d'étude n°2 :

indice_b = find(csvDouble(:,4) == 1 )
salaire_b = csvDouble(indice_b,7)
exp_b = csvDouble(indice_b,6)
plot2d(salaire_b,exp_b,-1)
[a,b] = reglin(salaire_b',exp_b')
y_reg = a*salaire_b+b
plot2d(salaire_b,y_reg,5)

Script Scilab - Niveau d'étude n°3 :

indice_m = find(csvDouble(:,4) == 2 )
salaire_m = csvDouble(indice_m,7)
exp_m = csvDouble(indice_m,6)
plot2d(salaire_m,exp_m,-1)
[a,b] = reglin(salaire_m',exp_m')
y_reg = a*salaire_m+b
plot2d(salaire_m,y_reg,5)

Script Scilab - Niveau d'étude n°4 :

indice_p = find(csvDouble(:,4) == 3)
salaire_p = csvDouble(indice_p,7)
exp_p = csvDouble(indice_p,6)
plot2d(salaire_p,exp_p,-1)
[a,b] = reglin(salaire_p',exp_p')
y_reg = a*salaire_p+b
plot2d(salaire_p,y_reg,5)

Résultat :

  • Nuage de points pour le niveau d'étude n°1 : q2

  • Nuage de points pour le niveau d'étude n°2 : q2

  • Nuage de points pour le niveau d'étude n°3 : q2

  • Nuage de points pour le niveau d'étude n°4 : q2

  • Commentaires : La répartition des points sur les 4 graphes sont assez similaires, les 4 droites sont donc quasiment identiques.


⬅️ | 🏠