statistiquement是什么意思_statistiquement的常见用法_近义词

词典释义

adv.
1. 用统计方法;按统计学观点
indice de prix établi statistiquement 统计建立

物价指数

2. 统计数目上

;大数目上

短语搭配

indice de prix établi statistiquement统计建立的物价指数

原声例句

J’ai voulu vérifier si mon impression était statistiquement valide.

我想确认一下我的感觉在数据上是否有效。

[innerFrench]

Ils trouvent que statistiquement, sa déformation suit, ô surprise, la loi de Richter.

他们发现，统计起来，它的形变遵循着，哦真是惊讶，理查德定律。

[Reconnexion]

Ça, statistiquement, ce n'est pas le plus probable.

从统计数据来看，这并不是最有可能的。

[Top Chef 2017 顶级厨师]

Mais, par exemple, en Gironde, donc la région de Bordeaux, il y a statistiquement autant de jours de pluie que dans le nord.

但是，举个例子，在吉伦特省，也就是在波尔多地区，统计的数据显示雨天的数量与北方地区一样多。

[innerFrench]

– Monsieur Ivory, si je vous le disais, j'aurais statistiquement plus de chance que vous vous moquiez de moi, que de vous intéresser à mes travaux.

“伊沃里先生，如果我告诉了您，我敢肯定，从得到的数据结果来看，您多半会嘲笑我的工作，而不会觉得有趣。”

[《第一日》&《第一夜》]

Pourtant c'est un outil statistiquement plus puissant qu'une agence matrimoniale : au lieu d'une seule ligne, c'est un filet qu'on lance à l'eau !

然而，从统计学上讲，它是一个比婚姻机构更强大的工具：它不是一条线，而是一张被扔进水里的网！

[ABC DALF C1/C2]

Et statistiquement, il est beaucoup plus probable que cette personne a la même nationalité que vous.

[我的频道]

Ça veut dire que les bébés qui naissent actuellement en France vont statistiquement vivre jusqu’à 82 ans.

[Hugo Cotton]

A 65 ans, les femmes ont statistiquement une espérance de vie en bonne santé pour encore 12,6 années, donc jusqu'à 77,6 ans.

[法国TV3台午间电视新闻 2023年2月合集]

例句库

Les écarts sont faibles et non significatifs statistiquement (2 points de pourcentage).

差异细微，统计上可以忽略不计（2个百分点）。

La plupart d'entre elles ont montré que la corrélation était faible ou statistiquement peu significative.

大多数研究显示，两者之间的相关性较弱，或没有达到统计上的显著水平。

La différence n'est pas statistiquement significative.

其差别不具备统计学意义。

Le Comité a décidé d'examiner ce groupe de 978 déclarations en recourant à un échantillon statistiquement représentatif.

小组决定通过抽取有统计代表性的样本来审查这一组索赔(共987件)。

Statistiquement, la rémunération des femmes qui travaillent dans les secteurs de production est inférieure à celle des hommes.

据统计，在生产部门工作的妇女的收入比男子少。

L'incidence des pathologies correspondantes dans les hôpitaux du pays est statistiquement corrélée à l'augmentation des importations de volaille congelée.

喀麦隆各医院出现的有关病例，在统计上与冷冻鸡肉的进口增加相关联。

Il trouve ainsi des documents qui ne comportent pas le mot recherché mais contiennent des mots qui lui sont statistiquement corrélés.

结果会包括不含有搜索词，但从统计学角度与搜索词有关的词的文件。

En outre, la norme-cadre avait été validée statistiquement, reproduisant régulièrement les résultats du système actuel dans la très grande majorité des cas.

此外，经过统计论证，证明总标准在绝大部分情况下都能与现行系统产生的结果保持一致。

Les garçons sont plus vulnérables que les filles : l'écart entre eux est statistiquement sensible, quoique moins important que parmi les autres segments.

男童的境况比女童的境况更差：这种差距在统计上是非常明显的，尽管差异低于其他群体。

À cet égard, on s'est inquiété de la longueur du document et on a souligné la nécessité de collecter des données statistiquement valables.

在这方面，有发言者表示关切调查表的长度以及采集在统计上有效的数据的必要性。

À cet égard, on s'est inquiété de la longueur du document et la nécessité de collecter des données statistiquement valables a été soulignée.

在这方面，有发言者表示关切调查表的长度以及采集在统计上有效的数据的必要性。

Il faudra fixer un nombre statistiquement valable de sites non touchés (sites témoins) afin de minimiser l'effet d'éventuels facteurs confusionnels sur l'écosystème marin.

要尽量减少可能已经影响海洋生态系统的潜在混乱因素，就应确定没有受影响的(对照)地点，其数目的多少要保证取得有效统计数据。

Les taux de bêta-HCH des échantillons de lait étudiés étaient mesurables mais n'étaient pas statistiquement beaucoup plus élevés que ceux des échantillons de contrôle.

相对于对照奶而言，病例奶中的乙型六氯环己烷可以观测到，但其高出的部分没有达到统计上的显著水平。

Le nombre de naissances chez les filles de moins de 15 ans n'est pas enregistré officiellement; masqué par l'absence complète de données, ce problème est statistiquement invisible.

以下女童生育子女人数没有统计，问题因完全缺少数据而被掩盖或从统计上看不出来。

Des mesures statistiquement valables de la valeur des transactions commerciales électroniques font actuellement défaut pour la plupart des pays, en particulier dans le monde en développement.

大多数国家，尤其是发展中国家目前缺乏对电子商务交易价值的具有统计意义的衡量。

Les recherches empiriques qui ont été réalisées montrent qu'Internet a un impact positif, de plus en plus important, et statistiquement significatif sur les échanges au niveau mondial.

关于互联网对国际贸易影响的实证研究表明，互联网对全球贸易流动格局的影响是积极的，不断增加的，在统计上十分可观。

Dans la province de Pinar del Rio, la Rapporteuse spéciale a été informée qu'il y avait des cas de viol mais qu'ils n'étaient pas statistiquement significatifs.

在比那尔德里奥省，特别报告员得知，确实有一些强奸案，但尚未严重到“成为有效统计数字”的地步。

Il s'est révélé ne pas y avoir une différence statistiquement significative entre les sexes parmi les personnes qui avaient changé d'emploi au cours des deux années précédentes.

前两年期间在那些已换工作的人中间，已证明男女之间没有统计上的重大差别。

Les mariages précoces sont étroitement liés à la mortalité maternelle, dans la mesure où statistiquement, ce sont les jeunes femmes qui risquent le plus de mourir pendant leur grossesse.

早婚与产妇死亡率密切相关，因为统计数字表明，年轻妇女怀孕期间死亡的风险更大。

Statistiquement, les jeunes sont le groupe de la population comptant le plus de délinquants même si beaucoup d'entre eux finissent par s'éloigner de la délinquance et de la marginalité.

根据统计，青少年属于最活跃的犯罪群体，不过，大多数青年人最终会摆脱犯罪和不正常的行为。

法语百科

La statistique est à la fois une science, une méthode et un ensemble de techniques. La statistique comprend : la collecte de données, l'analyse et le traitement des données collectées, l'interprétation des résultats et leur présentation afin de rendre les données compréhensibles par tous.

Remarquons que la statistique est parfois notée « la Statistique » (avec une majuscule) ce qui permet de différencier cette science avec une statistique (avec une minuscule). Le pluriel a également souvent été utilisé historiquement pour la désigner : « les statistiques », cela permet de montrer la diversité de cette science.

La statistique est pour les uns un domaine des mathématiques, pour les autres (en particulier les anglo-saxons) une discipline à part entière hors des mathématiques, enfin de plus en plus, elle fait partie de ce que l'on appelle aujourd'hui la Sciences des Données (en anglais Data Science). Elle possède une composante théorique ainsi qu'une composante appliquée. La composante théorique s'appuie sur la théorie des probabilités et forme avec cette dernière, les sciences de l'aléatoire. La statistique appliquée est utilisée dans presque tous les domaines de l'activité humaine : ingénierie, management, économie, biologie, informatique, etc. La statistique utilise des règles et des méthodes sur la collecte des données, pour que celles-ci puissent être correctement interprétées, souvent comme composante d'une aide à la décision. Le statisticien a pour profession la mise au point d'outils statistiques, dans le secteur privé ou le secteur public, et leur exploitation généralement dans un domaine d'expertise.

Histoire

Bien que le nom de statistique soit relativement récent – on attribue en général l'origine du nom au XVIII siècle de l'allemand Staatskunde – cette activité semble exister dès la naissance des premières structures sociales. D'ailleurs, les premiers textes écrits retrouvés sont des recensements du bétail, des informations sur son cours et des contrats divers. On a ainsi trace des recensements en Chine au XXIII siècle av. J.-C. ou en Égypte au XVIII siècle av. J.-C.. Ce système de recueil de données se poursuit jusqu'au XVII siècle. En Europe, le rôle de collecteur de données est souvent tenu par des guildes marchandes, puis par les intendants de l'État.

Ce n'est qu'au XVIII siècle que l'on voit apparaître le rôle prévisionnel des statistiques avec la construction des premières tables de mortalité. Antoine Deparcieux écrit en 1746 l'Essai sur les probabilités de la durée de vie humaine. Elle va d'abord servir aux compagnies d'assurances sur la vie qui se créent alors.

La statistique est aussi un appui pour l'histoire prospective ou rétrospective de la démographie notamment. Ainsi en 1842, le Baron de Reiffenberg présentait-il à l'Académie ses calculs rétrospectifs de population chez des peuples gaulois, d'après des chiffres donnés par Jules César dans sa conquête des gaules (De bello Gallico, v.).

Les statistiques mathématiques s'appuyaient sur les premiers travaux concernant les probabilités développés par Fermat et Pascal. C'est probablement chez Thomas Bayes que l'on vit apparaître un embryon de statistique inférentielle. Condorcet et Laplace parlaient encore de probabilité là où l'on parlerait aujourd'hui de fréquence. Mais c'est à Adolphe Quetelet que l'on doit l'idée que la statistique est une science s'appuyant sur les probabilités.

Le XIX siècle voit cette activité prendre son plein essor. Des règles précises sur la collecte et l'interprétation des données furent édictées. La première application industrielle des statistiques eut lieu lors du recensement américain de 1890, qui mit en œuvre la carte perforée inventée par le statisticien Herman Hollerith. Celui-ci avait déposé un brevet au bureau américain des brevets.

Au XX siècle, ces applications industrielles se développèrent d'abord aux États-Unis, qui étaient en avance sur les sciences de gestion, puis seulement après la Première Guerre mondiale en Europe. Le régime nazi employa des méthodes statistiques à partir de 1934 pour le réarmement. En France, on était moins au fait de ces applications.

L'application industrielle des statistiques en France se développe avec la création de l'Insee, qui remplaça le Service National des Statistiques créé par René Carmille.

L'avènement de l'informatique dans les années 1940 (aux États-Unis), puis en Europe (dans les années 1960) permit de traiter un plus grand nombre de données, mais surtout de croiser entre elles des séries de données de types différents. C'est le développement de ce qu'on appelle l'analyse multidimensionnelle. Au cours du siècle, plusieurs courants de pensée vont s'affronter :

les objectivistes ou fréquentistes qui pensent que les probabilités fournissent un modèle permettant d'idéaliser la distribution en fréquence et que là s'arrête leur rôle ;

les subjectivistes qui voient les probabilités comme un moyen de mesurer la confiance que l'on peut avoir dans une prévision ;

les néo-bayesiens qui soutiennent que les données statistiques seules ne permettent pas de donner le modèle probabiliste idéalisant la distribution en fréquence: il est nécessaire de proposer au départ une forme générale du modèle.

Définition

Commençons par préciser que donner une définition de la statistique n'est pas chose facile, comme expliqué dans la section précédente, les définitions de la statistique évoluent en fonction de l'époque ou de son utilisation. En 1935, le statisticien Walter F. Willcox dénombrait entre 100 et 120 définitions différentes.

« Parmi les thèmes à propos desquels les statisticiens ne sont pas d'accord, se trouve la définition de leur science. »

— Maurice Kendall

Donnons en premier lieu, la définition la plus classique actuellement utilisée, au moins depuis 1982 : « La statistique est l'ensemble des méthodes qui ont pour objet la collecte, le traitement et l'interprétation de données d'observation relatives à un groupe d'individus ou d'unités. » Par cette définition, la statistique apparaît comme une science autonome orientée vers les données, comme la physique l'est vers la matière et la biologie vers la vie. Mais comme elle s'appuie sur la théorie des probabilités étant elle-même une science de l'aléatoire, (voir Interconnexions entre la théorie des probabilités et la statistique pour plus de détails), elle apparaît souvent en particulier d'un point de vue universitaire, comme une branche des mathématiques appliquées. Aujourd'hui, elle s'inscrit dans un champ disciplinaire plus transverse que les anglo-saxons nomment « Data Science » et dans lequel par ailleurs, l'informatique a elle aussi une place importante. Les différents aspects de la statistique sont regroupés en différents domaines ou concepts : la statistique descriptive plus couramment appelée aujourd'hui statistique exploratoire, l'inférence statistique, la statistique mathématique, l'analyse des données, l'apprentissage statistique, etc.

John Tukey prétend qu'il y a deux approches en statistiques, entre lesquelles on jongle constamment : les statistiques exploratoires et les statistiques confirmatoires (exploratory and confirmatory statistics) :

on explore d'abord les données pour avoir une idée experte du fonctionnement du système qu'elles représentent, ce qui permet de formuler des hypothèses cognitives sur les phénomènes mis en jeu de leurs propriétés ;

puis à partir de ces hypothèses de comportement, on élabore des expériences permettant de les confirmer ou de les infirmer en recourant à d'autres techniques statistiques.

Domaines d'application

En 1982, le statisticien Pierre Dagnelie propose trois grandes tendances de la statistique :

la statistique qualifiée d'« administrative » ou « gouvernementale » faite dans les instituts de statistique à propos de grands ensembles de données,

la statistique dite « mathématique » ou « universitaire » faite avec peu de données et qui a pour but la novation,

enfin la statistique « appliquée » ou « de terrain » faite dans les instituts de sondage d'opinion ou les facultés de médecine pour des problèmes concrets.

Dans la pratique, les méthodes et outils statistiques sont utilisés dans des domaines tels que :

géophysique, pour les prévisions météorologiques, la climatologie, la pollution, les études des rivières et des océans ;

démographie : le recensement permet de faire une photographie à un instant donné d'une population et permettra par la suite des sondages dans des échantillons représentatifs ;

sciences économiques et sociales, et en économétrie : l'étude du comportement d'un groupe de population ou d'un secteur économique s'appuie sur des statistiques. C'est dans cette direction que travaille l'Insee. Les questions environnementales s'appuient également sur des données statistiques ;

sociologie : les sources statistiques constituent des matériaux d'enquête, et les méthodes statistiques sont utilisées comme techniques de traitement des données ;

marketing : le sondage d'opinion devient un outil pour la décision ou l'investissement ;

dans les jeux de hasard et les paris tels que le loto ou les paris équestres, pour "prévoir" les résultats ;

physique : l'étude de la mécanique statistique et de la thermodynamique statistique (cf Physique statistique) permet de déduire du comportement de particules individuelles un comportement global (passage du microscopique au macroscopique) ;

métrologie, pour tout ce qui concerne les systèmes de mesure et les mesures elles-mêmes ;

médecine et en psychologie, tant pour le comportement des maladies que leur fréquence ou la validité d'un traitement ou d'un dépistage ;

archéologie, appliquée aux vestiges (céramologie, archéozoologie...)

écologie, pour l'étude des communautés végétales et des écosystèmes.

assurance et en finance (calcul des risques, actuariat, etc.)

informatique, surtout en algorithmique (anti-crénelage, interpolation numérique)

Statistique descriptive et statistique mathématique

Le but de la statistique est d'extraire des informations pertinentes d'une liste de nombres difficile à interpréter par une simple lecture. Deux grandes familles de méthodes sont utilisées selon les circonstances. Rien n'interdit de les utiliser en parallèle dans un problème concret mais il ne faut pas oublier qu'elles résolvent des problèmes de natures totalement distinctes. Selon une terminologie classique, ce sont la statistique descriptive et la statistique mathématique. Aujourd'hui, il semble que des expressions comme analyse des données et statistique inférentielle soient préférées, ce qui est justifié par le progrès des méthodes utilisées dans le premier cas.

Considérons par exemple les notes globales à un examen. Il peut être intéressant d'en tirer une valeur centrale qui donne une idée synthétique sur le niveau des étudiants. Celle-ci peut être complétée par une valeur de dispersion qui mesure, d'une certaine manière, l'homogénéité du groupe. Si on veut une information plus précise sur ce dernier point, on pourra construire un histogramme ou, d'un point de vue légèrement différent, considérer les déciles. Ces notions peuvent être intéressantes pour faire des comparaisons avec les examens analogues passés les années précédentes ou en d'autres lieux. Ce sont les problèmes les plus élémentaires de l'analyse des données qui concernent une population finie. Les problèmes portant sur des statistiques multidimensionnelles nécessitent l'utilisation de l'algèbre linéaire. Indépendamment du caractère, élémentaire ou non, du problème il s'agit de réductions statistiques de données connues dans lesquelles l'introduction des probabilités améliorerait difficilement l'information obtenue. Il est raisonnable de regrouper ces différentes notions :

statistique descriptive pour les notions élémentaires ;

analyse en composantes principales ;

analyse factorielle des correspondances ;

analyse discriminante ;

visualisation des données ;

etc.

Un changement radical se produit lorsque les données ne sont plus considérées comme une information complète à décrypter selon les règles de l'algèbre mais comme une information partielle sur une population plus importante, généralement considérée comme une population infinie. Pour induire des informations sur la population inconnue il faut introduire la notion de loi de probabilité. Les données connues constituent dans ce cas une réalisation d'un échantillon, ensemble de variables aléatoires supposées indépendantes (voir Loi de probabilité à plusieurs variables). La théorie des probabilités permet alors, entre autres opérations :

d'associer les propriétés de l'échantillon à celles qui sont prêtées à la loi de probabilité, inconnue en toute rigueur, c'est l'échantillonnage ;

de déduire inversement les paramètres de la loi de probabilité des informations que donne l'échantillon, c'est l'estimation ;

de déterminer un intervalle de confiance qui mesure la validité de l'estimation ;

de procéder à des tests d'hypothèse, le plus utilisé étant le Test du χ² pour mesurer l'adéquation de la loi de probabilité choisie à l'échantillon utilisé ;

etc.

La démarche statistique

Recueil des données

L'enquête statistique est toujours précédée d'une phase où sont déterminés les différents caractères à étudier.

L'étape suivante consiste à choisir la population à étudier. Il se pose alors le problème de l'échantillonnage : choix de la population à sonder (au sens large : cela peut être un sondage d'opinion en interrogeant des humains, ou bien le ramassage de roches pour déterminer la nature d'un sol en géologie), la taille de la population et sa représentativité.

Que ce soit pour un recueil total (recensement) ou partiel (sondage), des protocoles sont à mettre en place pour éviter les erreurs de mesures qu'elles soient accidentelles ou répétitives (biais).

Le pré traitement des données est extrêmement important, en effet, une transformation des données initiales (un passage au logarithme, par exemple), peuvent considérablement faciliter les traitements statistiques suivants.

Traitement des données

Le résultat de l'enquête statistique est une série de chiffres (tailles, salaires) ou de données qualitatives (langues parlées, marques préférées). Pour pouvoir les exploiter, il va être nécessaire d'en faire un classement et un résumé visuel ou numérique. Il sera parfois nécessaire d'opérer une compression de données. C'est le travail de la statistique descriptive. Il sera différent selon que l'étude porte sur une seule ou sur plusieurs variables.

Étude d'une seule variable

Le regroupement des données, le calcul des effectifs, la construction de graphiques permettent un premier résumé visuel du caractère statistique étudié. Dans le cas d'un caractère quantitatif continu, l'histogramme en est la représentation graphique la plus courante.

Les valeurs numériques d'un caractère statistique se répartissent dans , il est nécessaire de définir leurs positions. En statistiques, on est en général en présence d'un grand nombre de valeurs. Or, si l'intégralité de ces valeurs forme l'information, il n'est pas aisé de manipuler plusieurs centaines voire milliers de chiffres, ni d'en tirer des conclusions. Il faut donc calculer quelques valeurs qui vont permettre d'analyser les données : c'est le rôle des réductions statistiques. Celles-ci peuvent être extrêmement concises, réduites à un nombre : c'est le cas des valeurs centrales et des valeurs de dispersion. Certaines d'entre elles (comme la variance) sont élaborées pour permettre une exploitation plus théorique des données (voir Inférence statistique)

On peut aussi chercher à comparer deux populations. On s'intéressera alors plus particulièrement à leurs critères de position, de dispersion, à leur boîte à moustaches ou à l'analyse de la variance.

Étude de plusieurs variables

Les moyens informatiques permettent aujourd'hui d'étudier plusieurs variables simultanément. Le cas de deux variables va donner lieu à la création d'un nuage de points, d'une étude de corrélation (mathématiques) éventuelle entre les deux phénomènes ou étude d'une régression linéaire.

Mais on peut rencontrer des études sur plus de deux variables : c'est l'analyse multidimensionnelle dans laquelle on va trouver l'analyse en composantes principales, l'analyse en composantes indépendantes, la régression linéaire multiple et l'exploration de données (ou data mining). Aujourd'hui, l'exploration de données (appelé aussi knowledge discovery) s'appuie, entre autres, sur la statistique pour découvrir des relations entre les variables de très vastes bases de données. Les avancées technologiques (augmentation de la fréquence des capteurs disponibles, des moyens de stockage, et de la puissance de calcul) donnent à l'exploration de données, un réel intérêt.

Interprétation et analyse des données

L'inférence statistique a pour but de faire émerger des propriétés d'un ensemble de variables connues uniquement à travers quelques-unes de ses réalisations (qui constituent un échantillon de données).

Elle s'appuie sur les résultats de la statistique mathématique, qui applique des calculs mathématiques rigoureux concernant la théorie des probabilités et la théorie de l'information aux situations où on n'observe que quelques réalisations (expérimentations) du phénomène à étudier.

Sans la statistique mathématique, un calcul sur des données (par exemple une moyenne), n'est qu'un indicateur. C'est la statistique mathématique qui lui donne le statut d'estimateur dont on maîtrise le biais, l'incertitude et autres caractéristiques statistiques. On cherche en général à ce que l'estimateur soit sans biais, convergent (ou consistant) et efficace.

On peut aussi émettre des hypothèses sur la loi générant le phénomène général, par exemple « la taille des enfants de 10 ans en France suit-elle une loi gaussienne ? ». L'étude de l'échantillon va alors valider ou non cette hypothèse : c'est ce qu'on appelle les tests d'hypothèses. Les tests d'hypothèses permettent de quantifier la probabilité avec laquelle des variables (connues seulement à partir d'un échantillon) vérifient une propriété donnée.

Enfin, on peut chercher à modéliser un phénomène a posteriori. La modélisation statistique doit être différenciée de la modélisation physique. Dans le second cas, des physiciens (c'est aussi vrai pour des chimistes, biologistes, ou tout autre scientifique), cherchent à construire un modèle explicatif d'un phénomène, qui est soutenu par une théorie plus générale décrivant comment les phénomènes ont lieu en exploitant le principe de causalité. Dans le cas de la modélisation statistique, le modèle va être construit à partir des données disponibles, sans aucun a priori sur les mécanismes entrant en jeux. Ce type de modélisation s'appelle aussi modélisation empirique. Compléter une modélisation statistique par des équations physiques (souvent intégrées dans les pré traitements des données) est toujours positif.

Un modèle est avant tout un moyen de relier des variables à expliquer $Y$ à des variables explicatives $X$ , par une relation fonctionnelle :

Y = F(X)

Les modèles statistiques peuvent être regroupés en grandes familles (suivant la forme de la fonction $F$ ):

les modèles linéaires ;

les modèles non linéaires ;

les modèles non paramétriques.

Les modèles bayésiens (du nom de Bayes) peuvent être utilisés dans les trois catégories.

Statistique mathématique

Cette branche des mathématiques, très liée aux probabilités, est indispensable pour valider les hypothèses ou les modèles élaborés dans la statistique inférentielle. La théorie mathématiques des probabilités formalise les phénomènes aléatoires. Les statistiques mathématiques se consacrent à l'étude de phénomènes aléatoires que l'on connaît via certaines de ses réalisations.

Par exemple, pour une partie de dés à six faces :

le point de vue probabiliste est de formaliser un tel jeu par une distribution de probabilité associée aux événements la première, deuxième..., sixième face est tirée. La théorie des probabilités nous dit par exemple que pour que cette distribution soit une distribution de probabilité, il est nécessaire que . On peut alors étudier différentes propriétés de ce jeu ;

une fois cela fixé, les statistiques s'intéressent alors à ce genre de question : « Si au bout de 100 parties, chaque face a été tirée fois, puis-je avoir une idée de la valeur des probabilités ? Avec quel degré de confiance ? »

Une fois la règle établie, elle peut être utilisée en statistique inférentielle.

Statistique en sciences sociales

Les statistiques sont utilisées dans la plupart des sciences sociales. Elles présentent une méthodologie commune avec toutefois certaines spécificités selon la complexité de l'objet d'étude

En sociologie

L'apport des méthodes statistiques permet au sociologue l'utilisation de méthodes quantitatives lui permettant de déterminer des sociostyles.

Le problème majeur est pour le chercheur de définir des unités comparables (style de vie, tranche de revenus, opinions politiques, etc.).

Le sociologue réussit ainsi à déterminer des nuages de points correspondant à des axes comportementaux qui définissent l'évolution des différents groupes sociaux vers tel type de comportement (achat de tel ou tel produit, vote pour tel ou tel candidat à une élection).

中文百科

统计学是在数据分析的基础上，自17世纪中叶产生并逐步发展起来的一门学科。它是研究如何测定、收集、整理、归纳和分析反映数据数据，以便给出正确消息的科学。统计广泛地应用在各门学科，从自然科学、社会科学到人文学科，甚至被用来工商业及政府的情报决策之上。随着大数据(Big Data)时代来临，统计的面貌也逐渐改变，与信息、计算等领域密切结合，是数据科学(Data Science)中的重要主轴之一。

譬如自一组数据中，可以摘要并且描述这份数据的集中和离散情形，这个用法称作为描述统计学。另外，观察者以数据的形态，创建出一个用以解释其随机性和不确定性的数学模型，以之来推论研究中的步骤及母体，这种用法被称做推论统计学。这两种用法都可以被称作为应用统计学。数理统计学则是讨论背后的理论基础的学科。

总览

统计可以推测趋势和规律，说明自然和人文现象。很多人认为统计学是一种科学的数学分支，是关于收集、分析、解释、陈述数据的科学。另一些人认为它是数学的一个分支，因为统计学是关于收集解释数据的。由于它基于观测、重视应用，统计学常被看作是一门独特的数学科学，而不是一个数学分支。很多统计学都不是数学的：如确保所收集来的数据能得出有效的结论；将数据编码、存档以使得信息得以保存，可以在国际上进行比对；汇报结果、总结数据，以便统计员可以明白它们的意思；采取必要措施，保护数据来源对象的隐私。统计学家通过专门的试验设计和调查样本来提升数据质量。统计学自身也为数据的概率模型提供了预测工具。统计学在其他学术科目上得到了广泛的应用，如自然科学、社会科学、政府、商业等。统计顾问可以帮助没有入户调查经验组织与公司进行问卷研究。总结叙述收集来的数据被称之为描述统计学。这在进行实验研究信息交流中十分有用。另外，从数据的分布上也可以得出观测上的随机性和不确定性。将数据中的数据模型化，计算它的机率并且做出对于母群体的推论被称之为推论统计学。推论是科学进步的重要因素，因为它可能从随机变量中得出数据的结论。推论统计学将命题进行更深入的研究，将结果进行检测。这些都是科学方式的一部分。描述统计学和对新数据的分析更倾向于提供更多的信息，逼近命题所述的真理。 “应用统计学”包括描述统计学和推论统计学中的应用成分。理论统计学则注重统计推论背后的逻辑证明，以及数理统计学。数理统计学不但包括推导估测推论法的概率分布，还包括了计算统计和试验设计。统计学与概率论联系紧密，并常以后者为理论基础。简单地讲，两者不同点在于概率论从母群体中推导出样本的概率。统计推论则正好相反——从小的样本中得出大的母群体的参数。

统计学的历史

统计手法最早可以追溯至公元前5世纪。最早的统计著作来自公元9世纪的《密码破译》（Manuscript on Deciphering Cryptographic Messages）一书，由阿拉伯人肯迪编着。在书中，肯迪详细记录了如何使用统计数据和频率分析进行密码破译。根据沙特阿拉伯工程师易卜拉欣·阿凯笛（Ibrahim Al-Kadi）的说法，统计学和密码学分析便如此一同诞生了常态分配的钟型曲线的图佛罗伦萨银行家、执政官乔瓦尼·维伦（Giovanni Villani）编订了佛罗伦萨14世纪历史书籍Nuova Cronica ,包括了如人口、法令、商贸、教育、宗教场所在内的统计数据，被誉之为历史上统计学入门的第一本书。一些学者将1663年约翰·格兰特根据死亡率统计表编订出版的《自然与政治观察》（Natural and Political Observations）一书定格为统计学的诞生。统计学的英语词statistics是源于现代拉丁语statisticum collegium（国会）以及意大利语statista（国民或政治家）。德语Statistik，最早是由Gottfried Achenwall（1749）所使用，代表对国家的数据进行分析的学问，也就是“研究国家的科学”。在十九世纪统计学在广泛的数据以及数据中探究其意义，并且由John Sinclair引进到英语世界。统计学的初衷是作为政府（通常是中央政府）以及管理阶层的工具。它大量透过国家以及国际统计服务搜集国家以及本土的数据。另外依照各方面，普查则提供关母体的信息。统计背后牵涉到更多数学导向的领域，如机率，或是从经验科学（特别在天文学）中获得的经验证据设置估计参数。在今日的世界里统计已经被使用在不仅仅是国家或政府的事务，更延伸到商业，自然以及社会科学，医疗等甚至更多方面。因为统计学拥有深厚的历史以及广泛的应用性，统计学通常不只被认为是数学所处理的对象，而是与数学本身的哲学定义与意义有密切的关联。许多知名的大学拥有独立的数理统计学系。统计学也在如心理学，教育学以及公共卫生学系中被视为是一门主科。统计学的数学基础创建在17世纪布莱兹·帕斯卡和皮埃尔·德·费马发展的概率论上。概率论从研究几率得来。最小二乘法由卡尔·弗里德里希·高斯于1794年第一次得出。现代计算机可以进行更大尺度的统计运算，生成了许多无法用人工计算的新公式。

统计学的观念

描述统计学处理有关叙述的问题：是否可以摘要的说明数据的情形，不论是以数学或是图片表现，以用来代表母群体的性质？基础的数学描述包括了平均数和标准差等。图像的摘要则包含了许多种的表和图。主要是就说明数据的集中和离散情形。

推论统计学被用来将数据中的数据模型化，计算它的机率并且做出对于母群体的推论。这个推论可能以对/错问题的答案所呈现（假设检定），对于数字特征量的估计（估计），对于未来观察的预测，关联性的预测（相关性），或是将关系模型化（回归）。其他的模型化技术包括变异数分析（ANOVA），时间串行（time series analysis），以及数据挖掘（data mining）。

统计方法

设立研究计划，包括找到代表研究项目的数据，使用如下信息：根据处理效应进行初步预估，备用假说，预估实验变率。对实验目标的选择和道德上的考虑也是必不可少的。统计学家推荐实验（至少）应与另一个相同标准、不同项目的参照组进行对比，以减少偏差。

试验设计，使用区组变量来减少干扰变量的影响，将对象进行随机处理，消除估算处理效用与实验误差中的偏差。在此阶段，实验参与者和统计学家填写实验草案，并依此指导实验进程，对实验数据的原始分析进行细化。

根据实验草案进行实验、方差分析。

在第二次分析中进一步解析数据，为进一步研究提出新假说。

汇报研究结果并将其存档。

第一型错误中零假设被错误地证伪，得出测试结果为“假阳性”。

第二型错误中零假设没有被及时排除，母群体中的实际差异被错误判断为“假阴性”。

Student t检定注：Students为发展出此方法原创者的笔名。

变异数分析

卡方分配

费雪最小显著差异法（Fisher's Least Significant Difference test）

曼-惠特尼U检定（Mann-Whitney U）

回归分析

统计学的范畴

概率论与数理统计

抽样与抽样分布

统计数据的搜集、整理与显示

参数估计

非参数估计

假设检验

方差分析

时间串行分析

统计指数

聚类分析与判别分析

主成分分析与因子分析

延伸学科

农业科学

生物统计

商务统计

数据采矿（应用统计学以及图形从数据中获取知识）

经济统计学

电机统计

统计物理学

人口统计

心理统计学

教育统计学

社会统计（包括所有的社会科学）

文献统计分析

化学与进程分析（所有有关化学的数据分析与化工科学）

运动统计学，特别是棒球以及曲棍球

统计计算

计算机在20世纪后半叶的大量应用对统计科学产生了极大的影响。早期统计模型常常回避线性模型，但强劲的计算机及其算法导致非线性模型（如神经网络）和新式算法（如广义线性模式、等级线性模型）的大量应用。计算机性能的增强使得需要大量计算的再取样算法成为时尚，如置换检验、自助法。Gibbs取样法也使得贝叶斯模型更加可行。计算机革命使得统计在未来更加注重“实验”和“经验”。大量普通或专业的统计软件现已面市。

滥用

同样的销售量原点不同，看起来差距很大。统计数据时常被滥用，对结果的解释时常有利于演讲者。对统计的怀疑与误导可被称为：“世上有三种谎言：谎言，该死的谎言，统计数字”。许多对统计的滥用可能出于无意，也可能出于故意。《如何用统计来说谎》一书（How to Lie With Statistics）揭露了许多类似诡计，并在统计的应用与滥用中，回顾了许多案例中的统计方法（e.g. Warne, Lazo, Ramos, and Ritter (2012）。预防统计滥用包括使用合适的图表、规避偏差。当结论被轻率概化，超过了它所能代表的范围时，滥用就出现了。这常常是因无意或故意忽视样本偏差所导致的。条形统计图可能是最容易使用、最容易理解的图表了，它可以用手或计算机绘制而成。不巧的是，许多人忽视其中的偏差、误差，因为他们不留意。因此，虽然图表质量低劣，但人们常常愿意去相信。只有当样本可以代表总体时，统计结果才是可信、精确的。哈弗（Huff）称：“样本的可靠性可以被偏差破坏...给你自己点怀疑的空间吧。”

法法词典

statistiquement adverbe

1. en utilisant les méthodes mathématiques de recueil, de traitement et d'analyse de données réelles

des résultats exploitables statistiquement
2. si on se fonde sur un raisonnement logique ou mathématique

c'est statistiquement peu probable