Statistiques
Statistiques à deux variables
On appelle série statistique à deux variables est une série statistiques dans laquelles on étudie simultanément deux caractères x et y observés sur une même population.
L'ajustement affine
IMAGE ICI
Méthode | Exemple | Formule |
---|---|---|
Classer les données par ordre croissant | ||
Classer les données en deux groupes égaux | 1er groupe les 4 premières données, le 2em groupe : les quatres dernières données | |
Calculer le point $G_1$ | $(\bar{x_1};\bar{y_1}) = (\frac{1+2+3+4}{4} ; \frac{1+3+5+4}{4}) = (2.5 ; 3.25)$ | $(\bar{x};\bar{y}) = \frac{\sum_{i=1}^{n}x_i}{n} ; \frac{\sum_{i=1}^{n}y_i}{n})$ |
Calculer le point $G_2$ | $(\bar{x_2};\bar{y_2}) = (\frac{5+6+7+8}{4} ; \frac{6+1+2+3}{4}) = (6.5 ; 3)$ | $(\bar{x};\bar{y}) = \frac{\sum_{i=1}^{n}x_i}{n} ; \frac{\sum_{i=1}^{n}y_i}{n})$ |
Calculer la pente de la droite | $m = \frac{3-3.25}{6.5-2.5} = -0.0625$ | $m = \frac{y_2-y_1}{x_2-x_1}$ |
Calculer l'ordonnée à l'origine | $p = 1 - (-0.0625) * 1 = 1.0625$ | $p = y_1 - m * x_1$ |
Droite finale | $y = -0.0625x + 1.0625$ | $y = m * x + p$ |
Méthode des moindres carrés
IMAGE ICI
Méthode courte
La méthode la plus courte pour calculer la droite des moindres carrés, c'est d'utiliser directement la calculatrice (CASIO fx-92B)
$$ Y = ax + b $$
$r$ correspond au coefficient de régression
Méthode longue
VOIR DANS LE LIVRE A LA PAGE 106.
Calculer et interpreter le coefficient de corrélation
Le coefficient de corrélation correspond au $r$ que la calculatrice donne. Il suffit ensuite d'utiliser le barème suivant pour l'interprêter, sans même avoir besoin du graphique.
Qualité de la corrélation | Positive | Négative |
---|---|---|
Parfaite | $0.98<r<1$ | $-1<r<-0.98$ |
Forte | $0.80<r<0.98$ | $-0.98<r<-0.80$ |
Moyenne | $0.60<r<0.80$ | $-0.80<r<-0.60$ |
Faible | $0.35<r<0.60$ | $-0.60<r<-0.35$ |
Nulle | $-0.35<r<0.35$ | $-0.35<r<0.35$ |
Ce coefficient défini à quel point le lien entre la droite de régression et les points sont proches. Si il n'y a aucun lien entre la droite et les points, c'est une corrélation nulle.
Différence entre corrélation et causalité
Une corrélation est un rapport entre deux valeurs ($x$ et $y$)
Une causalité c'est quand $x$ cause $y$ (ou l'inverse).
Il est très important de comprendre que ces deux mots ne sont pas synonymes, c'est un piège dans lequel de nombreux journalistes tombent. Voici un exemple de corrélation :
Les pays qui ont le plus de prix nobels sont les pays avec la plus grande consommation de chocolat
Cette affirmation est factuelle, c'est en effet le cas, mais ce n'est pas pour autant que manger du chocolat va faire de vous un génie comme beaucoup de journeaux l'ont dit.