La moyenne est une mesure statistique caractérisant les éléments d'un ensemble de quantités : elle exprime la grandeur qu'aurait chacun des membres de l'ensemble s'ils étaient tous identiques sans changer la dimension globale de l'ensemble. Il y a plusieurs façons de calculer la moyenne d'un ensemble de valeurs, choisies en fonction de la grandeur physique que représentent ces nombres. Dans le langage courant, le terme « moyenne » réfère généralement à la moyenne arithmétique.
Que représente la moyenne ?
En statistique
La moyenne est la valeur unique que devraient avoir tous les individus d'une population (ou d'un échantillon) pour que leur total soit inchangé. C'est un critère de position.
Dans la plupart des cas, le total formé par les individus d'une population est la somme de leurs valeurs. La moyenne est alors la moyenne arithmétique. Mais si le total représenté par une population ou un échantillon n'est pas la somme de leurs valeurs, la moyenne pertinente ne sera plus la moyenne arithmétique.
Si, par exemple, le total d'un ensemble d'individus est calculé par l'inverse de la moyenne arithmétique des inverses (cas des vitesses d'un ensemble de fractions d'un trajet, par exemple), on doit calculer leur moyenne harmonique.
Si, par exemple, le total d'un ensemble d'individus est le produit de leurs valeurs, il convient de calculer leur moyenne géométrique.
On rencontre, en physique, de multiples moyennes : la capacité électrique moyenne d'un ensemble de condensateurs en série est la moyenne harmonique de leurs capacités.
La moyenne ne peut donc se concevoir que pour une variable quantitative. On ne peut pas faire le total des valeurs d'une variable qualitative. Quand la variable est ordinale, on lui préférera la médiane.
Exemple de la moyenne scolaire
La moyenne est beaucoup utilisée en évaluation scolaire. Dans de nombreux systèmes scolaires, une partie de l'évaluation des élèves débouche sur une note chiffrée, par exemple
en France, en Tunisie, Algérie et au Maroc : de 0 à 10 ou de 0 à 20 (0 étant la plus mauvaise note, 10 ou 20 la meilleure) ;
en Suisse : de 1 à 6 (1 étant la plus mauvaise note, 6 la meilleure) ;
en Allemagne : de 6 à 1 (6 étant la plus mauvaise note, 1 la meilleure) ;
au Canada : de 0 à 100 (100 étant la meilleure note et 0 la plus mauvaise) ;
au Danemark : de -3 à 12 (-3 étant la plus mauvaise note, 12 la meilleure).
On peut alors calculer la moyenne des notes d'une classe dans une matière, ou la moyenne des notes d'un élève dans une matière. Ces moyennes ont des sens différents :
la moyenne de la classe est censée représenter un « niveau global », si tant est que cela ait un sens ;
dans le cas d'un examen de grande ampleur, comme le baccalauréat en France, où de nombreux élèves passent la même épreuve mais sont corrigés par différents professeurs, la différence des moyennes entre les groupes peut indiquer une différence de correction selon le professeur (certains étant plus sévères, d'autres plus tolérants), et l'on peut par exemple effectuer une correction de notes, une « mise en adéquation », afin que les groupes aient tous la même moyenne ; par exemple, si m1, m2… sont les moyennes des groupes et M la moyenne globale, alors les notes du groupe i seront multipliées par M/mi ;
dans le cas d'un élève : la moyenne des notes sur une matière permet de niveler les résultats ; ainsi, si les résultats sont fluctuants, les faiblesses d'un moment sont rattrapées par les réussites d'un autre moment ;
la moyenne des notes d'un élève dans plusieurs matières est une autre manière de niveler les résultats, non plus dans le temps mais selon la matière : les points forts rattrapent les points faibles ; la moyenne est alors un critère de sélection, sachant que ce que l'on demande d'un élève, ce n'est pas qu'il soit bon partout, mais qu'il ait des qualités permettant de rattraper ses défauts ; lorsque certaines matières sont plus importantes que d'autres, on applique des coefficients de pondération (cf. infra).
Dans ces exemples, la moyenne est un lissage des valeurs. On peut bien sûr se demander si la moyenne est un critère pertinent de sélection (voir Évaluation sommative) ; en général, ce n'est pas le seul critère qui entre en compte, à l'exception de certains examens et concours.
En géométrie
En géométrie, la moyenne correspond à la notion d'isobarycentre. Lorsque l'on veut décrire le comportement de plusieurs objets, il est parfois possible de les remplacer par un objet fictif dont les propriétés (telle la position dans l'espace) sont la moyenne des propriétés des différents objets. En mécanique rationnelle, cet objet fictif est appelé centre de masse de l'ensemble des objets considérés. En fait, dans la mesure où les objets ont en général des masses différentes, la notion de centre de masse correspond plutôt à la notion géométrique de barycentre, qui est une sorte de moyenne pondérée (voir plus loin).
En probabilités
Lorsque les valeurs sont aléatoires, la moyenne est appelée « espérance ». Si l'on peut déterminer une loi statistique de cette variable aléatoire, l'espérance est en général un des paramètres fondamentaux de cette loi.
Les différentes moyennes
Selon la manière dont le 'total' des individus est calculé (voir ci-dessus en Statistique), il existe différentes moyennes :
Moyenne arithmétique
La moyenne arithmétique est la moyenne « ordinaire », c'est-à-dire la somme des valeurs numériques (de la liste) divisée par le nombre de ces valeurs numériques.
-
La moyenne arithmétique se note A(x) quand des moyennes différentes sont présentes.
Exemple: Si un rectangle a pour côtés 3 et 7, alors le carré (c'est-à-dire le rectangle moyen) qui a le même périmètre a pour côté la moyenne arithmétique de 3 et 7, c'est-à-dire 5.
Si les valeurs sont affectées de coefficients, on peut définir la moyenne arithmétique pondérée :
Étant donné un ensemble de données
-
ainsi que les poids non-négatifs correspondants
-
la moyenne arithmétique pondérée est calculée suivant la formule :
-
, quotient de la somme pondérée des par la somme des poids;
Moyenne géométrique
La moyenne géométrique est définie de la manière suivante :
-
On peut illustrer la moyenne géométrique avec les deux cas suivants :
Si l'inflation d'un pays est de 5 % la première année et de 15 % la suivante, l'augmentation moyenne des prix se calcule grâce à la moyenne géométrique des coefficients multiplicateurs 1,05 et 1,15 soit une augmentation moyenne de 9,89 % et non grâce à la moyenne arithmétique 10 % (réponse intuitive).
Le carré (c'est-à-dire le rectangle moyen à deux côtés égaux) qui a même surface (le total considéré ici) qu'un rectangle de côtés 3 et 7 a pour côté la moyenne géométrique des deux côtés du rectangle = 4,5826. (voir le même exemple mais en moyenne quadratique).
La moyenne géométrique se note aussi quand des moyennes différentes sont présentes.
Il existe une moyenne géométrique pondérée, définie ci-dessous.
Étant donné un ensemble de données :
-
,
ainsi que les poids correspondants :
-
,
la moyenne géométrique pondérée est calculée comme étant :
-
.
Moyenne harmonique
La moyenne harmonique est définie de la manière suivante :
-
Si un train fait un trajet aller-retour entre 2 villes à la vitesse constante pour l'aller et à la vitesse constante au retour, la vitesse moyenne du trajet total n'est pas la moyenne arithmétique des 2 vitesses, mais leur moyenne harmonique.
Exemple: Si un rectangle a pour côtés 3 et 7, alors le carré (c'est-à-dire le rectangle moyen) qui a le même rapport (Surface sur Périmètre) a pour côté la moyenne harmonique de 3 et 7, c'est-à-dire 4,2.
La moyenne harmonique se note aussi quand des moyennes différentes sont présentes.
Il existe une moyenne harmonique pondérée, définie ci-dessous.
Étant donné un ensemble de données :
-
,
ainsi que les poids correspondants :
-
la moyenne harmonique pondérée est calculée comme étant :
-
.
Moyenne quadratique
La moyenne quadratique (nommée RMS pour Root Mean Square dans les pays anglophones), est définie de la manière suivante :
-
Exemple : si un rectangle a pour côtés 3 et 7, le carré (c'est-à-dire le rectangle moyen) qui a même diagonale (le total considéré ici) que ce rectangle, a pour côté la moyenne quadratique de 3 et 7, c'est-à-dire 5,3852.
La racine carrée de la moyenne du carré des valeurs instantanées d'une grandeur est appelée valeur quadratique moyenne, ou encore (par analogie avec l'électricité) valeur efficace.
La moyenne quadratique se note Q(x) quand des moyennes différentes sont présentes.
Comparaison entre les moyennes précédentes
Si a et b sont deux réels strictement positifs tels que a < b, alors :
-
(lorsque a = b, toutes ces moyennes sont égales).
Une démonstration de G(a,b) < A(a,b) De l'identité de Legendre on déduit et on conclut en appliquant la fonction racine carrée (qui est strictement croissante).
Pour démontrer ces comparaisons et les généraliser, on fait appel à la notion de fonction convexe.
Moyenne énergétique
La moyenne énergétique est définie de la manière suivante :
-
C'est la moyenne de valeurs données en décibels, par exemple en acoustique.
Cas général
Si nous notons la loi de composition qui donne le total pour deux individus, alors la valeur moyenne de n individus est la valeur, la même pour tous, qu'ils devraient avoir pour que leur total suivant la loi reste inchangé; c'est donc la solution de l'équation :
-
Cette équation peut être résolue s'il existe un isomorphisme (que nous noterons ) ramenant la loi à l'addition.
Rappelons qu'un isomorphisme est une bijection telle que l'image d'un composé est le composé des images, c'est-à-dire que, pour tout x et tout y :
-
Nous pouvons alors écrire :
-
Cette formule généralise et synthétise tous les cas précédents. Nous retrouvons par exemple :
la moyenne énergétique si :
-
;
ou la moyenne géométrique quand :
-
.
Un cas particulier important est celui où l'isomorphisme est une fonction puissance, c'est-à-dire que, pour tout x :
-
La moyenne, notée dans ce cas , s'exprime alors selon la formule :
-
où l'on retrouve :
pour m = 1, la moyenne arithmétique ;
pour m = 2, la moyenne quadratique ;
pour m = -1, la moyenne harmonique ;
lorsque m → 0, la limite de est la moyenne géométrique ;
lorsque m → +∞, la limite de est le maximum de la série ;
lorsque m → -∞, la limite de est le minimum de la série.
Extensions de la notion de moyenne
Au-delà des définitions précédentes de moyenne, il existe d'autres approches plus étendues pour cette notion :
Moyenne glissante
La moyenne glissante est une notion statistique, où la moyenne au lieu d'être calculée sur n valeurs fixes, est calculée sur n valeurs consécutives « glissantes ».
Ce type de calcul est aussi utilisé en informatique pour minimiser la taille mémoire nécessaire au stockage des valeurs intermédiaires. Différentes formules de moyennes glissantes existent, par exemple pour une moyenne glissante de période n :
(une moyenne glissante de période 0 ne prend qu'un terme) (formule de récurrence)
Moyenne tronquée (ou "réduite")
Une moyenne tronquée est un calcul de moyenne arithmétique qui est appliqué après avoir ignoré les valeurs les plus extrêmes des données. L'idée de la troncation, opération dont le résultat s'appelle une troncature de l'ensemble des données, est de ne pas tenir compte des valeurs les plus éloignées, considérées alors comme aberrantes, et ainsi, dans le cas de la moyenne dite tronquée, de ne la calculer que sur un sous-ensemble "central" des données, la troncature. Notons que cette procédure est généralisable à d'autres estimateurs centraux.
Les statistiques tronquées, en anglais trimmed estimators, ont été inventées pour pallier la sensibilité des statistiques aux valeurs aberrantes, ce qu'on appelle la robustesse statistique. Leur avantage sur la médiane et sur la moyenne arithmétique est d'allier la robustesse de la médiane, à la définition "collective" de la moyenne arithmétique, la formule de calcul ressemblant fort à celle de cette moyenne arithmétique, lui conférant un avantage psychologique sur la médiane dont le défaut majeur (!) est de ne pas s'écrire avec une formule simplement arithmétique.
Historiquement, cette technique a eu son heure de gloire dans la première moitié du XX siècle comme méthode de "correction" des valeurs aberrantes, et avec l'apparition des premiers calculateurs, notamment, jusqu'aux travaux plus récents pour mieux cerner la notion de robustesse (Peter Rousseeuw (en)).
Moyenne pondérée
La moyenne pondérée est utilisée, en géométrie pour localiser le barycentre d'un polygone, en physique pour déterminer le centre de gravité ou en statistique et probabilité pour calculer une espérance. On la calcule ainsi :
-
Dans le cas général le poids représente l'influence de l'élément par rapport aux autres.
À noter qu'il s'agit ici de la moyenne pondérée arithmétique. Il existe aussi des versions pondérées des autres moyennes, comme la moyenne géométrique pondérée et la moyenne harmonique pondérée.
Valeur moyenne d'une fonction
Pour toute fonction continue (ou même seulement continue par morceaux) sur un segment [a, b] non vide et non trivial (ie b > a), la valeur moyenne de ƒ sur [a, b] est le réel m défini par :
-
Cette notion généralise celle de moyenne d'un nombre fini de réels en l'appliquant à un nombre infini de valeurs prises par une fonction intégrable. Elle sert par exemple dans la décomposition en série de Fourier d'une fonction périodique : c'est la composante constante. En traitement du signal, pour les signaux périodiques, il s'agit de la composante continue (offset).
On peut aussi, par analogie avec les moyennes pondérées d'un nombre fini de réels, affecter « à chacune des valeurs prises par la fonction » un coefficient strictement positif. On utilise alors ce que l'on appelle une fonction poids
-
(w pour l'initiale de weight, poids en anglais) :
-
.
Ce procédé peut aussi s'utiliser sur un intervalle ouvert ou semi-ouvert mais borné (ie aucune de ses bornes n'est infinie) où la fonction ƒ×w est intégrable. On peut citer l'exemple classique servant à montrer l'orthogonalité de la famille des polynômes de Tchebychev :
-
où la fonction Tn×Tp est continue sur le fermé [0,1] et où la fonction poids est
-
est intégrable sur [0,1[, et dont l'intégrale vaut .
Nota : Lorsque la fonction est périodique de période T, elle a la même valeur moyenne sur toute période [a, a + T]. Cette valeur commune est appelée valeur moyenne de la fonction. Ainsi la fonction cosinus est de moyenne nulle, son carré de moyenne 1/2.
La médiane, alternative à la moyenne
De manière générale, la moyenne n'est pas forcément une manière pertinente de représenter la tendance centrale des données considérées. On peut, par exemple, lui préférer la valeur médiane qui est la valeur à laquelle 50 % des valeurs observées sont inférieures. La médiane n'est pas (sauf exception ou hasard) équivalente à la moyenne arithmétique de l'ensemble. En supposant que l'on ait, au préalable, rangé les valeurs observées de sorte qu'elles se trouvent indexées suivant l'ordre des valeurs croissantes :
pour un nombre pair 2n de valeurs, la médiane est la moyenne des deux valeurs centrales, soit , ou toute autre valeur strictement comprise entre et
pour un nombre impair 2n+1 de valeurs, la médiane est unique et égale à .
Exemples numériques
Moyenne simple
Sur un relevé de notes, dans une matière scolaire, on peut lire la séquence des cinq notes suivantes : 13, 14, 15, 8, 20.
La moyenne simple de l'élève, dans cette matière, est donc :
Moyenne pondérée
Sur un relevé de notes on peut lire 10 (coefficient : 2), 16 (coefficient : 1), 9 (coefficient : 3).
La moyenne pondérée est .