Calculateur d'écart type

Calculez l'écart type d'échantillon et de population, la variance, la moyenne, l'étendue et toutes les statistiques descriptives d'une liste de nombres.

Comment ça marche

L'écart type mesure la dispersion d'un jeu de données autour de sa moyenne — de combien, en moyenne, les valeurs individuelles s'écartent de la moyenne. Un petit écart type signifie données très groupées ; un grand, données dispersées. Deux jeux de données peuvent avoir la même moyenne mais des formes très différentes, et l'écart type est le chiffre unique le plus courant pour décrire cet écart. Exemple classique : salaires dans une startup avec moyenne 80 000 € — si l'écart type est 5 000 €, tout le monde gagne près de 80k ; si c'est 40 000 €, les fondateurs gagnent 200k et les premiers employés survivent à 50k. La moyenne seule masque l'inégalité.

Il existe deux versions de l'écart type, et choisir la bonne compte. L'écart type de population (σ, divise par n) s'utilise quand on a des données sur chaque membre du groupe qui nous intéresse — p. ex. tailles de tous les joueurs d'une équipe précise. L'écart type d'échantillon (s, divise par n−1) s'utilise quand le jeu de données est un échantillon aléatoire d'une population plus large et qu'on veut estimer la dispersion de la population — p. ex. mesurer 100 tailles aléatoires pour estimer la dispersion du pays. Le n−1 (correction de Bessel) compense le fait que la moyenne d'échantillon est elle-même une estimation, ce qui sous-estime légèrement la vraie variance de population si on utilise n naïvement. Utilisez échantillon pour presque toute statistique inférentielle ; population seulement quand on a vraiment toute la population (rare en pratique).

La variance est l'écart type au carré — même information, unités différentes. L'écart type est dans les mêmes unités que les données originales (€, secondes, kg), ce qui le rend interprétable ; la variance est en unités au carré (€², secondes², kg²), commode pour les preuves et calculs mais moins intuitive. La règle empirique (68-95-99,7) donne une intuition pour les distributions « normales » : environ 68 % des valeurs sont dans 1 écart type de la moyenne, 95 % dans 2, et 99,7 % dans 3. Ainsi avec moyenne 80k et écart type 10k, vous vous attendez à ~68 % d'employés entre 70k et 90k. Les données réelles ne sont pas toujours parfaitement normales (revenus surtout, asymétriques à droite), mais la règle reste un bon contrôle de cohérence.

La formule

Moyenne : μ = (Σxᵢ) / n Variance de population : σ² = Σ(xᵢ − μ)² / n Écart type de population : σ = √σ² Variance d'échantillon : s² = Σ(xᵢ − x̄)² / (n − 1) Écart type d'échantillon : s = √s²

xᵢ sont les points de données individuels. n est le nombre de points. μ (mu) est la moyenne de population ; x̄ (x barre) la moyenne d'échantillon — calculées identiquement mais avec des symboles distincts selon le traitement. Σ signifie somme sur tous les points. Le n−1 de la formule d'échantillon est la correction de Bessel.

Exemple de calcul

  • Jeu : 4, 8, 6, 5, 3, 7. n = 6.
  • Moyenne = (4 + 8 + 6 + 5 + 3 + 7) / 6 = 33 / 6 = 5,5.
  • Écarts au carré : (4−5,5)² = 2,25, (8−5,5)² = 6,25, (6−5,5)² = 0,25, (5−5,5)² = 0,25, (3−5,5)² = 6,25, (7−5,5)² = 2,25. Somme = 17,5.
  • Variance de population = 17,5 / 6 ≈ 2,917 ; écart type de population = √2,917 ≈ 1,708. Variance d'échantillon = 17,5 / 5 = 3,5 ; écart type d'échantillon = √3,5 ≈ 1,871. La valeur d'échantillon est toujours légèrement plus grande à cause du dénominateur n−1.

Questions fréquentes

Dois-je utiliser la version échantillon (n−1) ou population (n) ?

Par défaut, échantillon (n−1) sauf si vous avez vraiment des données sur chaque membre du groupe. La formule n−1 compense le fait que la moyenne d'échantillon est elle-même une estimation, qui sous-estime la vraie variance de population si on utilise n. En pratique : analyse scientifique, A/B tests, sondages, feature engineering ML, analyse de rendements financiers — tout échantillon. Les formules de population ne s'appliquent que si le jeu de données est littéralement toute la population (classe de 30 élèves, tous les matchs d'une équipe, toutes les transactions d'une période close). En cas de doute, utilisez échantillon — la différence s'estompe pour les grands n, et utiliser échantillon quand on aurait dû utiliser population est bien moins faux que l'inverse.

Quelle est la différence entre écart type et erreur type ?

L'écart type décrit la dispersion des points individuels dans un échantillon. L'erreur type décrit la dispersion des moyennes d'échantillon sur de nombreux échantillons hypothétiques — elle répond à « de combien la moyenne changerait-elle si je tirais un autre échantillon aléatoire ? ». Mathématiquement, erreur type = écart type / √n, donc elle diminue avec un échantillon plus grand (plus de données, plus de confiance dans la moyenne). Usages distincts : écart type pour décrire la variabilité des données ; erreur type pour exprimer l'incertitude sur une estimation (p. ex. « la moyenne de population est 50 ± 2 », où 2 est l'erreur type). Les intervalles de confiance et p-valeurs sont construits à partir d'erreurs types, pas d'écarts types.

L'écart type peut-il être négatif ?

Non. L'écart type est la racine carrée de la variance, et la variance est une somme d'écarts au carré divisée par un compte positif — les deux quantités intermédiaires sont toujours non négatives, donc le résultat doit être ≥ 0. Il est exactement 0 quand tous les points sont égaux à la moyenne (toutes valeurs identiques, pas de variabilité). Un résultat négatif depuis un calculateur indique toujours une erreur d'entrée ou de calcul. La « déviation » d'un point individuel (xᵢ − μ) peut être négative ou positive, mais l'écart type est l'amplitude typique de ces déviations, exprimée en nombre positif.

Calculatrices associées