Calculatrice de cote Z

Convertissez un score brut en cote Z à partir de la moyenne et de l'écart-type, avec percentile et probabilité pour une distribution normale.

Comment ça marche

Une cote Z (ou score standard) indique à quelle distance un valeur unique se situe de la moyenne de sa distribution, en nombre d'écarts-types. La formule est z = (x − μ) / σ, où x est la valeur brute, μ la moyenne de population et σ l'écart-type de population. Une z de 0 signifie que la valeur tombe exactement sur la moyenne ; +1 signifie un écart-type au-dessus ; −2 signifie deux écarts-types en dessous. Le signe donne la direction, l'amplitude indique à quel point la valeur est inhabituelle.

L'intérêt de la cote Z est qu'elle élimine les unités et l'échelle de la mesure d'origine. Une note de 78 ne dit pas grand-chose en soi — mais une z de +1,2 vous dit que l'élève a fait mieux qu'environ 88 % de la promo, que l'examen soit sur 100 ou sur 250. La même logique s'applique aux mesures de laboratoire (une valeur biologique face à une plage de référence), au contrôle qualité (l'écart d'une pièce à la spécification), à la finance (un rendement face à sa moyenne historique) et à tout contexte où vous voulez comparer des valeurs issues de distributions d'échelles différentes sur un pied d'égalité.

Le percentile et la probabilité fournis par la calculatrice supposent que la distribution sous-jacente est approximativement normale — c'est-à-dire en cloche et symétrique autour de la moyenne. Beaucoup de mesures du monde réel s'en approchent suffisamment : tailles, pression artérielle, notes d'un grand groupe, tolérances de fabrication. Si vos données sont asymétriques (revenus, temps de réaction, croissance biologique), la cote Z elle-même reste bien définie, mais l'interprétation en percentile sera fausse — il faudrait une autre distribution de référence. Petit test de bon sens : si vos données ont une longue queue ou sont bornées à zéro, le percentile normal n'est qu'approximatif. Pour des données strictement normales, le percentile est exact (à l'arrondi près) et les règles : ±1σ contient 68 % des valeurs, ±2σ contient 95 %, ±3σ contient 99,7 %.

La formule

Cote Z : z = (x − μ) / σ Percentile : P(X ≤ x) = Φ(z) Prob. de queue : P(X > x) = 1 − Φ(z)

x est la valeur brute, μ la moyenne de population, σ l'écart-type de population. Φ(z) est la fonction de répartition de la loi normale standard — elle donne la probabilité qu'une variable normale tombe à z ou en dessous. La calculatrice évalue Φ(z) via l'approximation d'Abramowitz-Stegun, précise à environ sept décimales — largement suffisant en pratique. Si vous ne disposez que d'une moyenne et d'un écart-type d'échantillon plutôt que des paramètres de population, la « z » obtenue est techniquement une statistique t et le percentile normal sera légèrement biaisé pour de petits échantillons (n < 30) ; pour de grands échantillons la différence est négligeable.

Exemple de calcul

  • Un élève obtient 78 à un examen. La moyenne de la classe est 65 avec un écart-type de 10.
  • z = (78 − 65) / 10 = +1,30 — soit 1,3 écart-type au-dessus de la moyenne.
  • Φ(1,30) ≈ 0,9032 ; l'élève dépasse environ 90 % de la classe (10 % ont fait mieux).

Questions fréquentes

Quand puis-je faire confiance au percentile affiché ?

Lorsque la distribution sous-jacente est approximativement normale — en cloche, à peu près symétrique autour de la moyenne. Pour des notes d'examen sur une grande cohorte, des tests de QI, la taille, la tension artérielle, les tolérances industrielles et la plupart des mesures agrégées, l'hypothèse est suffisamment bonne pour que le percentile soit juste à un ou deux points près. Pour des données asymétriques (revenus, temps de réaction, toute variable bornée à zéro avec une longue queue), la cote Z reste bien définie comme distance à la moyenne, mais l'interprétation en percentile peut être très fausse — une z de +2 dans une distribution à queue lourde peut correspondre au 90ᵉ percentile et non au 97,5ᵉ. Règle rapide : si vous tracez l'histogramme de vos données et que ça ne ressemble pas à une cloche, utilisez la z uniquement comme amplitude et ne citez pas le percentile.

Dois-je utiliser l'écart-type de population ou d'échantillon ?

Utilisez l'écart-type de population (σ) lorsque vous avez réellement les données de toute la population — les notes de tous les élèves de la promo, les valeurs biologiques de tous les patients du registre. Utilisez l'écart-type d'échantillon (s) lorsque vous n'avez qu'un sous-ensemble et que vous estimez le paramètre de population. La calculatrice ne fait pas de différence dans le calcul — c'est l'interprétation du percentile qui change. Avec σ de population, le résultat est une vraie z et le percentile normal est exact (sous normalité). Avec s d'échantillon dans un petit échantillon (n < 30), le résultat est techniquement un t et le percentile normal sous-estime légèrement la probabilité de queue. Pour la plupart des usages laboratoire/classe avec des effectifs raisonnables, la différence est négligeable.

Que signifie une cote Z négative ?

Cela veut dire que la valeur brute se situe en dessous de la moyenne. L'amplitude est identique à celle d'une z positive — une z de −1,5 est exactement à la même distance du centre que +1,5, simplement de l'autre côté. L'interprétation en percentile s'inverse : une z de −1,5 place la valeur autour du 7ᵉ percentile (seulement 7 % de la distribution est en dessous), et +1,5 au 93ᵉ. Négatif n'est pas « mauvais » en soi — pour certaines métriques, plus bas est mieux (cholestérol, taux d'erreur, temps de réponse), pour d'autres plus haut est mieux (notes, mesures de forme). Le signe donne la direction ; vous jugez si cette direction est favorable selon le contexte.

Une cote Z est-elle la même chose qu'un score t ou un score standardisé ?

Presque. La cote Z utilise l'écart-type de population σ ; la statistique t utilise l'écart-type d'échantillon s et se réfère à une loi t plutôt qu'à une loi normale. Pour des échantillons n ≥ 30, la loi t est très proche de la normale et les deux sont, en pratique, interchangeables. « Score standardisé » est un terme parapluie qui désigne en général la cote Z, mais on l'emploie parfois pour toute mise à l'échelle produisant des valeurs centrées-réduites. Deux conventions apparentées mais distinctes : le T-score en psychométrie (moyenne 50, ET 10 — réécriture linéaire de z pour éviter les valeurs négatives) et la stanine (échelle 1-9, moyenne 5). Toutes sont des transformations linéaires simples de la z sous-jacente : une fois z calculée, passer de l'une à l'autre se fait avec une multiplication et une addition.

Calculatrices associées