Comment ça marche
Moyenne, médiane et mode sont les trois mesures classiques de tendance centrale — des nombres uniques qui résument « où se situe » un jeu de données sur la droite numérique. Elles répondent à la même question (« qu'est-ce qui est typique ? ») de trois façons différentes, et elles divergent souvent, ce qui est précisément l'intérêt d'en avoir trois. La moyenne est la moyenne arithmétique : on additionne les valeurs, on divise par le nombre. La médiane est la valeur centrale après tri : moitié des données au-dessus, moitié en dessous. Le mode est la valeur la plus fréquente (un jeu peut avoir plusieurs modes si plusieurs valeurs sont à égalité, ou aucun si toutes les valeurs sont uniques).
Le choix dépend de la forme des données et de ce qu'on veut communiquer. La moyenne est la plus informative quand les données sont assez symétriques et peu asymétriques — pour une distribution normale, moyenne, médiane et mode coïncident. Mais la moyenne est sensible aux valeurs aberrantes : un milliardaire dans une salle de 99 personnes ordinaires fait grimper la moyenne tout en laissant la médiane quasi inchangée. Donc pour reporter le revenu « typique », le prix immobilier « typique », ou tout « typique » d'une distribution à longue queue (revenus, richesse, temps de réponse, tailles de fichiers), utilisez la médiane — elle résume mieux la majorité. La moyenne est utile pour des maths ultérieures (multiplications, sommes entre groupes, tests statistiques comme le t-test supposent des données centrées sur la moyenne), mais elle trompe quand on reporte une seule valeur typique à un public non technique.
Le mode est le plus utile pour les données catégorielles (« couleur la plus populaire », « profession la plus commune », « bouton le plus cliqué ») et les données discrètes avec un regroupement naturel. Pour les données continues (tailles, températures, prix), le mode est souvent dénué de sens car aucune paire de valeurs n'est exactement égale au millimètre près. Dans ce cas, on regroupe les données en plages et on reporte la plage modale. Heuristique pratique : si les données sont symétriques et qu'il faut un seul nombre représentatif, utilisez la moyenne. Si elles sont asymétriques ou ont des outliers, la médiane. Pour décrire le pic d'une distribution ou parler de catégories, le mode. Reporter les trois et laisser comparer est souvent le plus honnête — ça révèle l'asymétrie quand moyenne et médiane divergent.
La formule
xᵢ sont les points individuels. n est le compte. Pour la médiane, il faut trier d'abord ; avec un nombre pair, la médiane est la moyenne des deux valeurs centrales. Le mode ne nécessite pas de tri et peut retourner plusieurs valeurs (bimodal, multimodal) ou aucune (toutes uniques).
Exemple de calcul
- Jeu : 7, 3, 9, 3, 5, 8, 3. n = 7.
- Moyenne = (7+3+9+3+5+8+3) / 7 = 38 / 7 ≈ 5,43.
- Tri : 3, 3, 3, 5, 7, 8, 9. n impair (7), donc médiane = la (7+1)/2 = 4ᵉ valeur = 5.
- Mode : 3 apparaît trois fois, plus que toute autre valeur, donc mode = 3. La moyenne (5,43), la médiane (5) et le mode (3) sont toutes différentes — typique pour un petit jeu asymétrique ; reporter les trois donne une image plus complète qu'une seule.
Questions fréquentes
Pourquoi la moyenne et la médiane sont-elles souvent différentes ?
Parce que la moyenne est sensible aux outliers et à l'asymétrie, tandis que la médiane les ignore. La moyenne utilise la magnitude réelle de chaque valeur dans le calcul, donc une seule valeur très grande ou très petite la décale visiblement ; la médiane n'utilise que la position des valeurs, donc les outliers extrêmes comptent comme n'importe quel autre point au-dessus ou au-dessous du milieu. Quand moyenne > médiane, les données sont asymétriques à droite (longue queue de valeurs hautes — typique des revenus, richesse, temps de réponse, tailles de fichiers). Quand moyenne < médiane, asymétrie à gauche (moins courante, vue dans des choses comme l'âge à la retraite ou les scores avec effet plancher/plafond). L'écart entre moyenne et médiane est en soi une mesure rapide d'asymétrie.
Et si mon jeu a plusieurs modes ?
Reportez-les toutes. Un jeu bimodal a deux valeurs à égalité (p. ex. 3, 3, 5, 5, 7 — 3 et 5 apparaissent chacun deux fois) ; multimodal en a trois ou plus. La calculatrice liste chaque valeur à égalité plutôt que de choisir arbitrairement. La bimodalité indique souvent que deux sous-populations distinctes sont analysées ensemble — p. ex., les tailles d'un groupe mixte d'adultes hommes et femmes sont bimodales car chaque sexe a sa plage typique. Quand vous voyez plusieurs modes, demandez-vous si votre jeu est en fait mixte et serait mieux analysé en sous-groupes. Si toutes les valeurs sont uniques (courant en mesures continues), il n'y a pas de mode — c'est la bonne réponse dans ce cas, et vous devez décrire la distribution par moyenne et médiane.
Quand reporter les trois vs une seule ?
Calculez toujours les trois ; reportez selon le public et le but. Pour un public technique ou une analyse approfondie, les trois avec leurs écarts racontent une histoire plus riche sur la forme. Pour un public non technique avec un seul nombre : médiane pour données asymétriques/type revenus, moyenne pour données symétriques/de mesure, mode seulement si les données sont catégorielles ou à regroupement naturel. En journalisme et politique, la médiane est généralement le bon défaut — plus dure à manipuler avec des outliers et représente honnêtement la « personne médiane ». En communication scientifique, la moyenne est conventionnelle avec son écart type. En analytics produit/UX, les trois aident : moyenne pour usage global, médiane pour comportement de l'utilisateur typique, mode pour identifier le pattern le plus courant (p. ex. « la plupart envoient 3 messages par session » — mode du compte).