# TP3 : Statistiques descriptives. **Régressions linéaires** ## Ex1 Charger les séries statistiques $X,Y$ du fichier [notes.csv](./data/notes.csv). Ces séries représentent les notes des étudiants d'une même promotion à 2 épreuves différentes. Ajustement linéaire de $Y$ en $X$ : $Y=aX+b$. 1. Afficher le nuage de points $X,Y$ avec la commande `plot2d`
2. Calculer $$ \overline{X},\overline{Y},\overline{XY},\overline{X^2}, \overline{Y^2}, Var(X), Var(Y), \sigma_{X,Y} $$ 3. En déduire l'équation de la droite d'ajustement linéaire de $Y$ par rapport à $X$ : $$ a=\frac{\sigma_{X,Y}}{Var(X)}= \qquad b=\overline{Y}-a\overline{X}= \qquad \rho = \frac{\sigma_{X,Y}}{\sqrt{Var(X)Var(Y)}} = $$ 4. Vérifier vos calculs en utlisant la commande `reglin` de scilab ``` --> [a,b,sig] = reglin(X,Y) ``` **Attention** `reglin` attend des vecteurs lignes. 5. Tracer la droite $y=ax+b$ sur le nuage de points. 6. Commenter la qualité de l'ajustement linéaire (justifier avec la valeur de $\rho$ ). ## Ex2 L'indice de réfraction d'un verre ($n=\frac{c}{v}$) se définit comme le rapport entre la vitesse de la lumière dans le vide ($c$) et dans le verre ($v$). Cet indice varie selon la longueur d'onde de la lumière $\lambda$ (sa couleur) suivant une loi $$ n=A + \frac{B}{\lambda^2} $$ On a mesuré $n$ pour différentes valeurs de $\lambda$ en angström :
couleurjaune clairjaune foncévertbleuviolet
λ 57905768546143584046
n 1.61861.6191.62191.63991.6492
1. Saisir dans scilab les séries $X=\frac{1}{\lambda^2}$ et $Y=n$ correspondant aux données. 2. Calculer l'ajustement linéaire de $Y$ en fonction de $X$ et en déduire les coefficients $A$ et $B$. 3. Commenter la qualité de cet ajustement. 4. Tracer sur un même graphique les données, et la loi donnant $n$ en fonction de $\lambda$. 4. Estimer la veleur de $n$ pour $\lambda = 4900$ et $\lambda=2800$. ## Ex3 On soupçonne que l'acidité d'un sol (ph) soit liée à la présence d'aluminium échangeable (qae) suivant la loi $$ qae = k\times A^{ph} $$ Pour vérifier cette hypothèse, on a mesuré le $ph$ et la quantité $qae$ d'aluminium échangeable (en p.p.m) en divers points du sol :
ph4.24.44.85.15.45.66.2
qae4002601206030154
1. En utilisant un ajustement linéaire, estimer la valeur de $k$ et $A$. 2. Tracer sur un même graphique les données et la loi. 3. Estimer la quantité d'aluminium échangeable pour $ph=5$ et $ph=13$. ## Ex4 Perturbation aléatoire et coefficient de corrélation. Si $Y=X$ l'ajustement linéaire de $Y$ en $X$ doit donner exactement $Y=X$ avec un coefficent de corrélation $ \rho = 1 $. On veut étudier l'évolution de $ \rho $ au fur et à mesure qu'on ajoute à $X$ une perturbation aléatoire de plus en plus grande. Pour chaque valeur de $e=0,0.2,0.5,1$ : 1. Générer les séries statistiques ``` --> X=rand(1,15); --> Y=X+e*rand(X); ``` 2. Calculer $\rho$. 3. Calculer l'équation de la droite d'ajustement de $Y$ par rapport à $X$. 3. Calculer l'équation de la droite d'ajustement de $X$ par rapport à $Y$. 4. Afficher le nuage de points $(X,Y)$ et les deux droites d'ajustement linéaire. Commenter l'évolution des résultats en fonction de la valeur de $e$.