SAÉ S2.04 (visualisation de données)
Le fichier penguins_size.csv contient des données des manchots de Palmer.
Il comprend à la fois des variables quantitatives (longueurs, poids) et qualitatives (espèce, île, sexe) :
- Espèce (species)
- Île (island)
- Longueur du bec (culmen_length_mm)
- Profondeur du bec (culmen_depth_mm)
- Longueur des nageoires (flipper_length_mm)
- Masse corporelle (body_mass_g)
- Sexe (sex)
Attendus
Vous devez produire, en binôme :
- un dépot git sur grond, nommé sae_s204, dont je dois être collaborateur.
- Les script(s) scilab qui calculent/affichent les réponses demandées.
- Un compte rendu en markdown sur votre dépot git avec les commandes et les réponses (y compris les graphes).
Le tout est à rendre au plus tard le 19 juin.
Question 1
Combien de manchots sont présents dans le jeu de données ?
Question 2
Quelle est la répartition des individus par espèce ?
Question 3
Quelle est la répartition des manchots selon leur sexe ?
Question 4
Calculer la masse moyenne des manchots.
Question 5
Calculer :
- la moyenne
- la médiane
- l'écart-type
de la masse corporelle.
Question 6
Comparer la masse moyenne des trois espèces.
Question 7
Quelle espèce présente la plus forte variabilité de masse ?
Question 8
Déterminer les quartiles Q1, Q2 et Q3 de la masse corporelle.
Question 9
Calculer l'écart interquartile.
Question 10
Construire une boîte à moustaches de la masse corporelle.
Question 11
Comparer les boîtes à moustaches des masses selon l'espèce.
Question 12
Construire un histogramme de la masse corporelle.
Question 13
Déterminer :
- la classe modale
- la fréquence de chaque classe
Question 14
Construire un histogramme de la longueur des nageoires.
Question 15
Tracer un nuage de points :
- longueur des nageoires
- masse corporelle
Observe-t-on une relation entre ces deux variables ?
Question 16
Calculer le coefficient de corrélation linéaire de Pearson entre :
- masse corporelle
- longueur des nageoires
Question 17
Calculer la corrélation entre :
longueur du bec profondeur du bec
Question 18
On cherche à prédire la masse corporelle à partir de la longueur des nageoires.
Déterminer l'équation de la droite de régression :
Question 20
Calculer le coefficient de détermination R^2
Question 21
À l'aide du modèle obtenu, estimer la masse d'un manchot dont les nageoires mesurent 210 mm.
Question 22
Construire une droite de régression pour chaque espèce.
Comparer :
- les pentes
- les coefficients de corrélation
Question 23
Les mâles sont-ils en moyenne plus lourds que les femelles ?
Comparer :
- moyenne
- médiane
- écart-type
Question 24
Quelle variable est la plus fortement corrélée à la masse corporelle ?
Comparer :
- longueur du bec
- profondeur du bec
- longueur des nageoires