diff --git a/stats/tp/tp3/README.md b/stats/tp/tp3/README.md new file mode 100644 index 0000000..f8713e7 --- /dev/null +++ b/stats/tp/tp3/README.md @@ -0,0 +1,90 @@ +# TP3 : Statistiques descriptives. + + **Régressions linéaires** + +## Ex1 +Charger les séries statistiques $X,Y$ du fichier [notes.csv](./data/notes.csv). Ces séries représentent +les notes des étudiants d'une même promotion à 2 épreuves différentes. + +Ajustement linéaire de $Y$ en $X$ : $Y=aX+b$. + +1. Afficher le nuage de points $X,Y$ avec la commande `plot2d` + +
+ +2. Calculer + \[ + \overline{X},\overline{Y},\overline{XY},\overline{X^2}, \overline{Y^2}, Var(X), Var(Y), \sigma_{X,Y} + \] +3. En déduire l'équation de la droite d'ajustement linéaire de $Y$ par rapport à $X$ : + \[ + a=\frac{\sigma_{X,Y}}{Var(X)}= \qquad b=\overline{Y}-a\overline{X}= \qquad \rho = \frac{\sigma_{X,Y}}{\sqrt{Var(X)Var(Y)}} = + \] +4. Vérifier vos calculs en utlisant la commande `reglin` de scilab + ``` + --> [a,b,sig] = reglin(X,Y) + ``` + **Attention** `reglin` attend des vecteurs lignes. +5. Tracer la droite $y=ax+b$ sur le nuage de points. +6. Commenter la qualité de l'ajustement linéaire (justifier avec la valeur de $\rho$ ). + +## Ex2 +L'indice de réfraction d'un verre ($n=\frac{c}{v}$) se définit comme le rapport entre la vitesse de la lumière dans le vide ($c$) et dans +le verre ($v$). Cet indice varie selon la longueur d'onde de la lumière $\lambda$ (sa couleur) suivant une loi + +\[ + n=A + \frac{B}{\lambda^2} +\] + +On a mesuré $n$ pour différentes valeurs de $\lambda$ en angström : + + + + + +
couleurjaune clairjaune foncévertbleuviolet
λ 57905768546143584046
n 1.61861.6191.62191.63991.6492
+ +1. Saisir dans scilab les séries $X=\frac{1}{\lambda^2}$ et $Y=n$ correspondant aux données. +2. Calculer l'ajustement linéaire de $Y$ en fonction de $X$ et en déduire les coefficients $A$ et $B$. +3. Commenter la qualité de cet ajustement. +4. Tracer sur un même graphique les données, et la loi donnant $n$ en fonction de $\lambda$. +4. Estimer la veleur de $n$ pour $\lambda = 4900$ et $\lambda=2800$. + +## Ex3 +On soupçonne que l'acidité d'un sol (ph) soit liée à la présence d'aluminium échangeable (qae) suivant la loi + +\[ + qae = k\times A^{ph} +\] + +Pour vérifier cette hypothèse, on a mesuré le $ph$ et la quantité $qae$ d'aluminium échangeable (en p.p.m) en divers points du sol : + + + + +
ph4.24.44.85.15.45.66.2
qae4002601206030154
+ +1. En utilisant un ajustement linéaire, estimer la valeur de $k$ et $A$. +2. Tracer sur un même graphique les données et la loi. +3. Estimer la quantité d'aluminium échangeable pour $ph=5$ et $ph=13$. + + +## Ex4 + +Perturbation aléatoire et coefficient de corrélation. + +Si $Y=X$ l'ajustement linéaire de $Y$ en $X$ doit donner exactement $Y=X$ avec un +coefficent de corrélation $ \rho = 1 $. On veut étudier l'évolution de $ \rho $ au fur et à mesure qu'on ajoute à $X$ une perturbation aléatoire de plus en plus +grande. Pour chaque valeur de $e=0,0.2,0.5,1$ : + +1. Générer les séries statistiques + ``` + --> X=rand(1,15); + --> Y=X+e*rand(X); + ``` +2. Calculer $\rho$. +3. Calculer l'équation de la droite d'ajustement de $Y$ par rapport à $X$. +3. Calculer l'équation de la droite d'ajustement de $X$ par rapport à $Y$. +4. Afficher le nuage de points $(X,Y)$ et les deux droites d'ajustement linéaire. + +Commenter l'évolution des résultats en fonction de la valeur de $e$. diff --git a/stats/tp/tp3/data/notes.csv b/stats/tp/tp3/data/notes.csv new file mode 100644 index 0000000..3a26b1c --- /dev/null +++ b/stats/tp/tp3/data/notes.csv @@ -0,0 +1,103 @@ +10.03,14.07 +13.88,12.61 +8.25,9.6 +9.67,8.41 +5,6.69 +7.7,8.65 +0,1.79 +8.3,10.63 +12.33,11.93 +11.48,10.38 +9.2,11.61 +7.35,8.53 +9.45,10.4 +6.93,7.97 +9.23,9.05 +6.22,7.98 +5.9,8.9 +15.05,13.98 +13,12.52 +7.6,7.49 +7.47,9.66 +7.03,7.97 +7.25,8.21 +9.37,12.91 +6.92,7.86 +7.32,12.84 +7.65,11.27 +7.58,11.05 +9.97,13.37 +6.18,7.99 +11.65,11.89 +7.37,8.34 +6.63,10.22 +14.82,14.82 +11.8,11.56 +7.95,6.74 +9.25,12.13 +6.73,10.95 +11.37,13.9 +4.03,6.69 +11.3,12.76 +11.1,13.44 +0.75,3.52 +8.72,8.69 +8.98,10.31 +6.37,9.43 +7.88,10.86 +8.38,6.66 +6.5,8.42 +8.35,10.12 +11.75,13.11 +6.47,9.1 +9.73,11.32 +8.33,9.67 +7.82,11.49 +7.57,8.52 +10.32,10.67 +9.12,10.33 +12.65,14.37 +6.75,10.26 +8.78,10.21 +10.53,10.11 +8.05,10.14 +12.48,13.68 +8.98,10.07 +14.93,15.12 +9.9,10.94 +11.1,13.12 +11.62,12.44 +8,9.7 +11.88,13.13 +10.2,11.98 +7.77,8.58 +7.15,8.39 +6.18,10.43 +8.65,10.9 +5.85,10.53 +8.08,8.23 +6.87,9.68 +11.6,11.76 +8.8,11.48 +5.63,7.41 +7.6,11.38 +8.73,12.08 +16.85,16.7 +12.45,12.54 +8.68,10.88 +8.3,11.68 +11.5,12.84 +8.93,11.49 +12.03,14.89 +7.43,11.13 +5.15,8.54 +9.82,10.25 +12.88,12.4 +12.12,13.45 +10.38,13.29 +8.88,12.27 +8.12,9.45 +9.03,12.55 +9.62,10.1 +9.87,9.19 +11.45,13.78 diff --git a/stats/tp/tp3/img/img1.png b/stats/tp/tp3/img/img1.png new file mode 100644 index 0000000..d1bd21b Binary files /dev/null and b/stats/tp/tp3/img/img1.png differ