# TP3 : Statistiques descriptives.
**Régressions linéaires**
## Ex1
Charger les séries statistiques $X,Y$ du fichier [notes.csv](./data/notes.csv). Ces séries représentent
les notes des étudiants d'une même promotion à 2 épreuves différentes.
Ajustement linéaire de $Y$ en $X$ : $Y=aX+b$.
1. Afficher le nuage de points $X,Y$ avec la commande `plot2d`
2. Calculer
$$
\overline{X},\overline{Y},\overline{XY},\overline{X^2}, \overline{Y^2}, Var(X), Var(Y), \sigma_{X,Y}
$$
3. En déduire l'équation de la droite d'ajustement linéaire de $Y$ par rapport à $X$ :
$$
a=\frac{\sigma_{X,Y}}{Var(X)}= \qquad b=\overline{Y}-a\overline{X}= \qquad \rho = \frac{\sigma_{X,Y}}{\sqrt{Var(X)Var(Y)}} =
$$
4. Vérifier vos calculs en utlisant la commande `reglin` de scilab
```
--> [a,b,sig] = reglin(X,Y)
```
**Attention** `reglin` attend des vecteurs lignes.
5. Tracer la droite $y=ax+b$ sur le nuage de points.
6. Commenter la qualité de l'ajustement linéaire (justifier avec la valeur de $\rho$ ).
## Ex2
L'indice de réfraction d'un verre ($n=\frac{c}{v}$) se définit comme le rapport entre la vitesse de la lumière dans le vide ($c$) et dans
le verre ($v$). Cet indice varie selon la longueur d'onde de la lumière $\lambda$ (sa couleur) suivant une loi
$$
n=A + \frac{B}{\lambda^2}
$$
On a mesuré $n$ pour différentes valeurs de $\lambda$ en angström :
| couleur | jaune clair | jaune foncé | vert | bleu | violet |
| λ | 5790 | 5768 | 5461 | 4358 | 4046 |
| n | 1.6186 | 1.619 | 1.6219 | 1.6399 | 1.6492 |
1. Saisir dans scilab les séries $X=\frac{1}{\lambda^2}$ et $Y=n$ correspondant aux données.
2. Calculer l'ajustement linéaire de $Y$ en fonction de $X$ et en déduire les coefficients $A$ et $B$.
3. Commenter la qualité de cet ajustement.
4. Tracer sur un même graphique les données, et la loi donnant $n$ en fonction de $\lambda$.
4. Estimer la veleur de $n$ pour $\lambda = 4900$ et $\lambda=2800$.
## Ex3
On soupçonne que l'acidité d'un sol (ph) soit liée à la présence d'aluminium échangeable (qae) suivant la loi
$$
qae = k\times A^{ph}
$$
Pour vérifier cette hypothèse, on a mesuré le $ph$ et la quantité $qae$ d'aluminium échangeable (en p.p.m) en divers points du sol :
| ph | 4.2 | 4.4 | 4.8 | 5.1 | 5.4 | 5.6 | 6.2 |
| qae | 400 | 260 | 120 | 60 | 30 | 15 | 4 |
1. En utilisant un ajustement linéaire, estimer la valeur de $k$ et $A$.
2. Tracer sur un même graphique les données et la loi.
3. Estimer la quantité d'aluminium échangeable pour $ph=5$ et $ph=13$.
## Ex4
Perturbation aléatoire et coefficient de corrélation.
Si $Y=X$ l'ajustement linéaire de $Y$ en $X$ doit donner exactement $Y=X$ avec un
coefficent de corrélation $ \rho = 1 $. On veut étudier l'évolution de $ \rho $ au fur et à mesure qu'on ajoute à $X$ une perturbation aléatoire de plus en plus
grande. Pour chaque valeur de $e=0,0.2,0.5,1$ :
1. Générer les séries statistiques
```
--> X=rand(1,15);
--> Y=X+e*rand(X);
```
2. Calculer $\rho$.
3. Calculer l'équation de la droite d'ajustement de $Y$ par rapport à $X$.
3. Calculer l'équation de la droite d'ajustement de $X$ par rapport à $Y$.
4. Afficher le nuage de points $(X,Y)$ et les deux droites d'ajustement linéaire.
Commenter l'évolution des résultats en fonction de la valeur de $e$.