词序
更多
查询
词典释义:
statistique
时间: 2023-09-17 11:46:55
TEF/TCF专四
[statistik]

n. f. 学; ; 表 a. ; 学常见用法

词典释义

n. f.
学;
~ quantique [物]量子
~ de la natalité 出生率


a.


常见用法
les statistiques du chômage失业率
faire des statistiques作

近义、反义、派生词
助记:
st立+at名词后缀+ist(=iste) 形容词后缀+ique名词、形容词后缀

词根:
st(a), stat, sist, stit, stin, staur, est, ét 站,立,安放,停留,固定

近义词:
dénombrement
联想词
empirique 江湖医生; quantitative 量; mathématique 数学; analyse 分析; analytique 分析,解析; sociologique 社会学; statistiquement ; prédiction 预言,预告; étude 学习; estimation 估价,评价; variance 方差, 离散差;
当代法汉科技词典
n. f. 【物理学】量子 力学

statistique adj. [学]statistiquef表; 法; 学;

bureau de statistique 

fluctuation statistique 涨落

mécanique statistique 力学

poids statistique 重[量]

prévision statistique 天气预报

répartition statistique 

bureau statistique 

短语搭配

manipuler les statistiques对数字统计弄虚作假

faire des statistiques作统计

mise à jour des statistiques更新统计资料;更新统计信息

cadre pour les statistiques culturelles教科文组织文化统计框架

statistique courante日常统计

statistique quantique〔物〕量子统计学

mécanique statistique统计力学

méthodes statistiques统计方法

surcharge statistique静力过载

statistique probabiliste概率论统计

原声例句

En plus, je ne suis pas sociologue et je n’ai pas trouvé d’études ni de statistiques sur le sujet.

此外,我不是社会学家,关于这个话题,我既没有找到相关研究,也没有找到数据

[innerFrench]

Selon les statistiques établies à partir de 1937, plus de 200 millions de Chinois ont fait la guerre.

据1937年以来的统计,有超过2亿中国人参加了这场战争。

[2021年度最热精选]

La statistique selon laquelle 18,1 % des adultes aux États-Unis souffrent de troubles de l'anxiété peut sembler insignifiante.

美国 18.1% 的成年人患有焦虑症,这一统计数字看起来可能微不足道。

[心理健康知识科普]

Dans le Manuel diagnostique et statistique des troubles mentaux, le trouble de la personnalité évitante se caractérise par des comportements de retrait social, d'inadéquation et de peur de la critique.

在《精神障碍诊断与统计手册》中,回避型人格障碍的特征是社交孤僻的行为、不足以及害怕批评。

[心理健康知识科普]

Ils ont passé à la moulinette de l'informatique et de la statistique tout un tas de textes avec plein de critères sur le vocabulaire, le style, et plein d'autres trucs que je ne vais pas détailler ici.

他们曾上过计算机科学和统计学的培训课程,他们要用很多不同的标准来研究一大堆文本,比如词汇,风格,以及许多其他我在这里不打算详细介绍的东西。

[硬核历史冷知识]

Selon une statistique établie par moi même.

根据我自己的统计

[Depuis quand]

C'est ça. Selon les dernières statistiques, il transporte à peu près 4,9 millions de passagers chaque jour.

是的。根据最新调查显示,地铁每天运送大约490万名乘客。

[北外法语 Le français (修订本)第二册]

Comme d'habitude je vais mettre les sources à la fin de la vidéo si vous voulez vérifier toutes ces statistiques, parce que moi-même j’étais assez surpris en découvrant l’ampleur du problème

和往常一样,我会在视频最后给出参考文献,如果你们想核实这些数据的话,因为我个人发现这个问题涉及到的规模时,我还是挺震惊的。

[innerFrench]

Selon les statistiques, tu glisse vers le haut.

根据统计显示,你往上划了。

[法国青年Cyprien吐槽集]

Tout le monde le dit et les statistiques le prouvent, mais à quoi bon tant de chiffres ?

大家都这样说,统计数字也证明了这点,可是这些数字又有什么用呢?

[北外法语 Le français 第四册]

例句库

Le notaire-ville et de la statistique, les testaments notariés traitées ces dernières années chez les jeunes (45 ans) représentaient 5% de la proportion.

该市公证处统计,近年办理的遗嘱公证当中,年轻人(45岁以下)占了5%的比例。

La Société est situé à côté de la route nationale 104, est des principales statistiques nationales Scenic Hill 25 km, 30 km de l'aéroport de Wenzhou, le trafic est très pratique.

本公司座落在104国道边,东邻国家重点风景区雁荡山25公里,本距温州机场30公里,交通十分方便。

Et, à la tête de la Section de Statistique, le commandant Henry ne perd pas de temps, il se livre à l'activité qui va être la sienne désormais: il fait des faux.

当上“统计处”头头之后,亨利少校没有闲着,从此投入了他独创的专项工作:造假!

Il ne me donne que ces données statistiques approximatives.

他只给我这些粗略的数据。

Un habitant sur trois serait âgé de 60 ans ou plus, contre un sur cinq en 2005, d’après les estimations du service statistique.

三个法国人中就将有一个60岁及以上的人。但在2005年,五个法国人中才有一个。

"Puis, a ne cesse de baisser pour arriver à 30 % en 1930", affirme l'historienne du cinéma Cari Beauchamp, qui a établi ces statistiques à partir de documents de la Bibliothèque du Congrès.

“这一比例不断下降,到1930年时,仅有30%。”这一数据在Cari Beauchamp撰写的相关文件中得到了证实。

Paoba hommes mai être à la recherche de plus d'une raison, à ce jour, je peux sortir des statistiques, il existe 14. 1, parce que les autres hommes qui sont allés dans un bar.

男人泡吧,可找的理由就不止一个了,到目前为止,笔者能够统计出来的,就有14个。1、因为别的人男人都去酒吧。

En août 2009, l'indice des prix à la consommation (IPC) augmente de 0,5 %, après une baisse de 0,4 % en juillet, selon les chiffres publiés mardi par l'Institut national de la statistique (Insee).

09年八月, 根据法国国家统计及经济研究所公布的数据表明:在七月份消费物价下跌了0.4%之后,八月份消费物价指数增长了0.5%。

Selon les données statistiques révélées, l'implantation des commerces manifeste un effet centrifuge lorsque le taux d'urbanisation est inférieur à 30%.

城市化率的不同阶段,从根本上决定和制约着零售业态格局的重组模式。

Les marchés terminent dans le vert, malgré des statistiques mitigées. L'attentisme a toutefois dominé cette séance avant la publication du rapport mensuel sur l'emploi demain vendredi.

尽管数据显示美国股市略有回升,但是尾市仍旧已下跌收盘。周五政府发布上月失业报告前,持观望意见的人士仍然按兵不动。

Elle emporte le contenu des corbeilles et le dépose à la Section de statistique.

她便悄悄地把字纸篓里的东西拿走,交给“统计处”。

Le bilan statistique montre cependant que la morosité n’a pas fini de dominer.

经济萧条带来的缺失负债统计表显示现在还没有摆脱经济萧条的统治。

Tout le monde le dit et les statistiques le prouvent, mais à quoi bon tant de chiffres ?

人人都这么说,统计数字也证明了这一点。但这么多数字有什么用呢?

Statistiques de l'heure limite: Février 1, 2006: Le public sont invités à visiter le terrain!

统计数字截止时间:2006年2月1日:欢迎各界人士实地参观考察!

Le bureau national des statistiques a évalué à 5 millions le nombre des réfugiés.

国家统计部门估计有500万名难民。

Le PIB d’un pays est généralement calculé par l’institut statistique national, qui recueille les données auprès de nombreuses sources.

一国PIB通常由国家统计局计算,它将大量来源的信息收集编集。

Qu’est ce que c’est les statistiques, c’est quoi les statistiques ? Dans quel domaine il est applique ?

什么是统计,一般运用在哪些方面?

Ces statistiques sont maquillées.

这些统计数字做过手脚。

Le principe de mon travail, c’est d’échapper aux chiffres et aux statistiques pour redonner une réalité à chacunà ce destin.

我的工作的主要内容就是脱离数字和统计,寻找命运背后的真相。

Yi Jin Sales Center, selon les statistiques de l'aviation civile, 2003, 120 avions à l'extérieur de la réserve trimestre s'est élevé à la première Dongguan.

中心销售额近亿,根据民航统计,2003年第一二季度外航订座量为东莞第一名。

法语百科

La statistique est à la fois une science, une méthode et un ensemble de techniques. La statistique comprend : la collecte de données, l'analyse et le traitement des données collectées, l'interprétation des résultats et leur présentation afin de rendre les données compréhensibles par tous.

Remarquons que la statistique est parfois notée « la Statistique » (avec une majuscule) ce qui permet de différencier cette science avec une statistique (avec une minuscule). Le pluriel a également souvent été utilisé historiquement pour la désigner : « les statistiques », cela permet de montrer la diversité de cette science.

La statistique est pour les uns un domaine des mathématiques, pour les autres (en particulier les anglo-saxons) une discipline à part entière hors des mathématiques, enfin de plus en plus, elle fait partie de ce que l'on appelle aujourd'hui la Sciences des Données (en anglais Data Science). Elle possède une composante théorique ainsi qu'une composante appliquée. La composante théorique s'appuie sur la théorie des probabilités et forme avec cette dernière, les sciences de l'aléatoire. La statistique appliquée est utilisée dans presque tous les domaines de l'activité humaine : ingénierie, management, économie, biologie, informatique, etc. La statistique utilise des règles et des méthodes sur la collecte des données, pour que celles-ci puissent être correctement interprétées, souvent comme composante d'une aide à la décision. Le statisticien a pour profession la mise au point d'outils statistiques, dans le secteur privé ou le secteur public, et leur exploitation généralement dans un domaine d'expertise.

Histoire

Bien que le nom de statistique soit relativement récent – on attribue en général l'origine du nom au XVIII siècle de l'allemand Staatskunde – cette activité semble exister dès la naissance des premières structures sociales. D'ailleurs, les premiers textes écrits retrouvés sont des recensements du bétail, des informations sur son cours et des contrats divers. On a ainsi trace des recensements en Chine au XXIII siècle av. J.-C. ou en Égypte au XVIII siècle av. J.-C.. Ce système de recueil de données se poursuit jusqu'au XVII siècle. En Europe, le rôle de collecteur de données est souvent tenu par des guildes marchandes, puis par les intendants de l'État.

Ce n'est qu'au XVIII siècle que l'on voit apparaître le rôle prévisionnel des statistiques avec la construction des premières tables de mortalité. Antoine Deparcieux écrit en 1746 l'Essai sur les probabilités de la durée de vie humaine. Elle va d'abord servir aux compagnies d'assurances sur la vie qui se créent alors.

La statistique est aussi un appui pour l'histoire prospective ou rétrospective de la démographie notamment. Ainsi en 1842, le Baron de Reiffenberg présentait-il à l'Académie ses calculs rétrospectifs de population chez des peuples gaulois, d'après des chiffres donnés par Jules César dans sa conquête des gaules (De bello Gallico, v.).

Les statistiques mathématiques s'appuyaient sur les premiers travaux concernant les probabilités développés par Fermat et Pascal. C'est probablement chez Thomas Bayes que l'on vit apparaître un embryon de statistique inférentielle. Condorcet et Laplace parlaient encore de probabilité là où l'on parlerait aujourd'hui de fréquence. Mais c'est à Adolphe Quetelet que l'on doit l'idée que la statistique est une science s'appuyant sur les probabilités.

Le XIX siècle voit cette activité prendre son plein essor. Des règles précises sur la collecte et l'interprétation des données furent édictées. La première application industrielle des statistiques eut lieu lors du recensement américain de 1890, qui mit en œuvre la carte perforée inventée par le statisticien Herman Hollerith. Celui-ci avait déposé un brevet au bureau américain des brevets.

Au XX siècle, ces applications industrielles se développèrent d'abord aux États-Unis, qui étaient en avance sur les sciences de gestion, puis seulement après la Première Guerre mondiale en Europe. Le régime nazi employa des méthodes statistiques à partir de 1934 pour le réarmement. En France, on était moins au fait de ces applications.

L'application industrielle des statistiques en France se développe avec la création de l'Insee, qui remplaça le Service National des Statistiques créé par René Carmille.

L'avènement de l'informatique dans les années 1940 (aux États-Unis), puis en Europe (dans les années 1960) permit de traiter un plus grand nombre de données, mais surtout de croiser entre elles des séries de données de types différents. C'est le développement de ce qu'on appelle l'analyse multidimensionnelle. Au cours du siècle, plusieurs courants de pensée vont s'affronter :

les objectivistes ou fréquentistes qui pensent que les probabilités fournissent un modèle permettant d'idéaliser la distribution en fréquence et que là s'arrête leur rôle ;

les subjectivistes qui voient les probabilités comme un moyen de mesurer la confiance que l'on peut avoir dans une prévision ;

les néo-bayesiens qui soutiennent que les données statistiques seules ne permettent pas de donner le modèle probabiliste idéalisant la distribution en fréquence: il est nécessaire de proposer au départ une forme générale du modèle.

Définition

Commençons par préciser que donner une définition de la statistique n'est pas chose facile, comme expliqué dans la section précédente, les définitions de la statistique évoluent en fonction de l'époque ou de son utilisation. En 1935, le statisticien Walter F. Willcox dénombrait entre 100 et 120 définitions différentes.

« Parmi les thèmes à propos desquels les statisticiens ne sont pas d'accord, se trouve la définition de leur science. »

— Maurice Kendall

Donnons en premier lieu, la définition la plus classique actuellement utilisée, au moins depuis 1982 : « La statistique est l'ensemble des méthodes qui ont pour objet la collecte, le traitement et l'interprétation de données d'observation relatives à un groupe d'individus ou d'unités. » Par cette définition, la statistique apparaît comme une science autonome orientée vers les données, comme la physique l'est vers la matière et la biologie vers la vie. Mais comme elle s'appuie sur la théorie des probabilités étant elle-même une science de l'aléatoire, (voir Interconnexions entre la théorie des probabilités et la statistique pour plus de détails), elle apparaît souvent en particulier d'un point de vue universitaire, comme une branche des mathématiques appliquées. Aujourd'hui, elle s'inscrit dans un champ disciplinaire plus transverse que les anglo-saxons nomment « Data Science » et dans lequel par ailleurs, l'informatique a elle aussi une place importante. Les différents aspects de la statistique sont regroupés en différents domaines ou concepts : la statistique descriptive plus couramment appelée aujourd'hui statistique exploratoire, l'inférence statistique, la statistique mathématique, l'analyse des données, l'apprentissage statistique, etc.

John Tukey prétend qu'il y a deux approches en statistiques, entre lesquelles on jongle constamment : les statistiques exploratoires et les statistiques confirmatoires (exploratory and confirmatory statistics) :

on explore d'abord les données pour avoir une idée experte du fonctionnement du système qu'elles représentent, ce qui permet de formuler des hypothèses cognitives sur les phénomènes mis en jeu de leurs propriétés ;

puis à partir de ces hypothèses de comportement, on élabore des expériences permettant de les confirmer ou de les infirmer en recourant à d'autres techniques statistiques.

Domaines d'application

En 1982, le statisticien Pierre Dagnelie propose trois grandes tendances de la statistique :

la statistique qualifiée d'« administrative » ou « gouvernementale » faite dans les instituts de statistique à propos de grands ensembles de données,

la statistique dite « mathématique » ou « universitaire » faite avec peu de données et qui a pour but la novation,

enfin la statistique « appliquée » ou « de terrain » faite dans les instituts de sondage d'opinion ou les facultés de médecine pour des problèmes concrets.

Dans la pratique, les méthodes et outils statistiques sont utilisés dans des domaines tels que :

géophysique, pour les prévisions météorologiques, la climatologie, la pollution, les études des rivières et des océans ;

démographie : le recensement permet de faire une photographie à un instant donné d'une population et permettra par la suite des sondages dans des échantillons représentatifs ;

sciences économiques et sociales, et en économétrie : l'étude du comportement d'un groupe de population ou d'un secteur économique s'appuie sur des statistiques. C'est dans cette direction que travaille l'Insee. Les questions environnementales s'appuient également sur des données statistiques ;

sociologie : les sources statistiques constituent des matériaux d'enquête, et les méthodes statistiques sont utilisées comme techniques de traitement des données ;

marketing : le sondage d'opinion devient un outil pour la décision ou l'investissement ;

dans les jeux de hasard et les paris tels que le loto ou les paris équestres, pour "prévoir" les résultats ;

physique : l'étude de la mécanique statistique et de la thermodynamique statistique (cf Physique statistique) permet de déduire du comportement de particules individuelles un comportement global (passage du microscopique au macroscopique) ;

métrologie, pour tout ce qui concerne les systèmes de mesure et les mesures elles-mêmes ;

médecine et en psychologie, tant pour le comportement des maladies que leur fréquence ou la validité d'un traitement ou d'un dépistage ;

archéologie, appliquée aux vestiges (céramologie, archéozoologie...)

écologie, pour l'étude des communautés végétales et des écosystèmes.

assurance et en finance (calcul des risques, actuariat, etc.)

informatique, surtout en algorithmique (anti-crénelage, interpolation numérique)

Statistique descriptive et statistique mathématique

Le but de la statistique est d'extraire des informations pertinentes d'une liste de nombres difficile à interpréter par une simple lecture. Deux grandes familles de méthodes sont utilisées selon les circonstances. Rien n'interdit de les utiliser en parallèle dans un problème concret mais il ne faut pas oublier qu'elles résolvent des problèmes de natures totalement distinctes. Selon une terminologie classique, ce sont la statistique descriptive et la statistique mathématique. Aujourd'hui, il semble que des expressions comme analyse des données et statistique inférentielle soient préférées, ce qui est justifié par le progrès des méthodes utilisées dans le premier cas.

Considérons par exemple les notes globales à un examen. Il peut être intéressant d'en tirer une valeur centrale qui donne une idée synthétique sur le niveau des étudiants. Celle-ci peut être complétée par une valeur de dispersion qui mesure, d'une certaine manière, l'homogénéité du groupe. Si on veut une information plus précise sur ce dernier point, on pourra construire un histogramme ou, d'un point de vue légèrement différent, considérer les déciles. Ces notions peuvent être intéressantes pour faire des comparaisons avec les examens analogues passés les années précédentes ou en d'autres lieux. Ce sont les problèmes les plus élémentaires de l'analyse des données qui concernent une population finie. Les problèmes portant sur des statistiques multidimensionnelles nécessitent l'utilisation de l'algèbre linéaire. Indépendamment du caractère, élémentaire ou non, du problème il s'agit de réductions statistiques de données connues dans lesquelles l'introduction des probabilités améliorerait difficilement l'information obtenue. Il est raisonnable de regrouper ces différentes notions :

statistique descriptive pour les notions élémentaires ;

analyse en composantes principales ;

analyse factorielle des correspondances ;

analyse discriminante ;

visualisation des données ;

etc.

Un changement radical se produit lorsque les données ne sont plus considérées comme une information complète à décrypter selon les règles de l'algèbre mais comme une information partielle sur une population plus importante, généralement considérée comme une population infinie. Pour induire des informations sur la population inconnue il faut introduire la notion de loi de probabilité. Les données connues constituent dans ce cas une réalisation d'un échantillon, ensemble de variables aléatoires supposées indépendantes (voir Loi de probabilité à plusieurs variables). La théorie des probabilités permet alors, entre autres opérations :

d'associer les propriétés de l'échantillon à celles qui sont prêtées à la loi de probabilité, inconnue en toute rigueur, c'est l'échantillonnage ;

de déduire inversement les paramètres de la loi de probabilité des informations que donne l'échantillon, c'est l'estimation ;

de déterminer un intervalle de confiance qui mesure la validité de l'estimation ;

de procéder à des tests d'hypothèse, le plus utilisé étant le Test du χ² pour mesurer l'adéquation de la loi de probabilité choisie à l'échantillon utilisé ;

etc.

La démarche statistique

Recueil des données

L'enquête statistique est toujours précédée d'une phase où sont déterminés les différents caractères à étudier.

L'étape suivante consiste à choisir la population à étudier. Il se pose alors le problème de l'échantillonnage : choix de la population à sonder (au sens large : cela peut être un sondage d'opinion en interrogeant des humains, ou bien le ramassage de roches pour déterminer la nature d'un sol en géologie), la taille de la population et sa représentativité.

Que ce soit pour un recueil total (recensement) ou partiel (sondage), des protocoles sont à mettre en place pour éviter les erreurs de mesures qu'elles soient accidentelles ou répétitives (biais).

Le pré traitement des données est extrêmement important, en effet, une transformation des données initiales (un passage au logarithme, par exemple), peuvent considérablement faciliter les traitements statistiques suivants.

Traitement des données

Le résultat de l'enquête statistique est une série de chiffres (tailles, salaires) ou de données qualitatives (langues parlées, marques préférées). Pour pouvoir les exploiter, il va être nécessaire d'en faire un classement et un résumé visuel ou numérique. Il sera parfois nécessaire d'opérer une compression de données. C'est le travail de la statistique descriptive. Il sera différent selon que l'étude porte sur une seule ou sur plusieurs variables.

Étude d'une seule variable

Le regroupement des données, le calcul des effectifs, la construction de graphiques permettent un premier résumé visuel du caractère statistique étudié. Dans le cas d'un caractère quantitatif continu, l'histogramme en est la représentation graphique la plus courante.

Les valeurs numériques d'un caractère statistique se répartissent dans , il est nécessaire de définir leurs positions. En statistiques, on est en général en présence d'un grand nombre de valeurs. Or, si l'intégralité de ces valeurs forme l'information, il n'est pas aisé de manipuler plusieurs centaines voire milliers de chiffres, ni d'en tirer des conclusions. Il faut donc calculer quelques valeurs qui vont permettre d'analyser les données : c'est le rôle des réductions statistiques. Celles-ci peuvent être extrêmement concises, réduites à un nombre : c'est le cas des valeurs centrales et des valeurs de dispersion. Certaines d'entre elles (comme la variance) sont élaborées pour permettre une exploitation plus théorique des données (voir Inférence statistique)

On peut aussi chercher à comparer deux populations. On s'intéressera alors plus particulièrement à leurs critères de position, de dispersion, à leur boîte à moustaches ou à l'analyse de la variance.

Étude de plusieurs variables

Les moyens informatiques permettent aujourd'hui d'étudier plusieurs variables simultanément. Le cas de deux variables va donner lieu à la création d'un nuage de points, d'une étude de corrélation (mathématiques) éventuelle entre les deux phénomènes ou étude d'une régression linéaire.

Mais on peut rencontrer des études sur plus de deux variables : c'est l'analyse multidimensionnelle dans laquelle on va trouver l'analyse en composantes principales, l'analyse en composantes indépendantes, la régression linéaire multiple et l'exploration de données (ou data mining). Aujourd'hui, l'exploration de données (appelé aussi knowledge discovery) s'appuie, entre autres, sur la statistique pour découvrir des relations entre les variables de très vastes bases de données. Les avancées technologiques (augmentation de la fréquence des capteurs disponibles, des moyens de stockage, et de la puissance de calcul) donnent à l'exploration de données, un réel intérêt.

Interprétation et analyse des données

L'inférence statistique a pour but de faire émerger des propriétés d'un ensemble de variables connues uniquement à travers quelques-unes de ses réalisations (qui constituent un échantillon de données).

Elle s'appuie sur les résultats de la statistique mathématique, qui applique des calculs mathématiques rigoureux concernant la théorie des probabilités et la théorie de l'information aux situations où on n'observe que quelques réalisations (expérimentations) du phénomène à étudier.

Sans la statistique mathématique, un calcul sur des données (par exemple une moyenne), n'est qu'un indicateur. C'est la statistique mathématique qui lui donne le statut d'estimateur dont on maîtrise le biais, l'incertitude et autres caractéristiques statistiques. On cherche en général à ce que l'estimateur soit sans biais, convergent (ou consistant) et efficace.

On peut aussi émettre des hypothèses sur la loi générant le phénomène général, par exemple « la taille des enfants de 10 ans en France suit-elle une loi gaussienne ? ». L'étude de l'échantillon va alors valider ou non cette hypothèse : c'est ce qu'on appelle les tests d'hypothèses. Les tests d'hypothèses permettent de quantifier la probabilité avec laquelle des variables (connues seulement à partir d'un échantillon) vérifient une propriété donnée.

Enfin, on peut chercher à modéliser un phénomène a posteriori. La modélisation statistique doit être différenciée de la modélisation physique. Dans le second cas, des physiciens (c'est aussi vrai pour des chimistes, biologistes, ou tout autre scientifique), cherchent à construire un modèle explicatif d'un phénomène, qui est soutenu par une théorie plus générale décrivant comment les phénomènes ont lieu en exploitant le principe de causalité. Dans le cas de la modélisation statistique, le modèle va être construit à partir des données disponibles, sans aucun a priori sur les mécanismes entrant en jeux. Ce type de modélisation s'appelle aussi modélisation empirique. Compléter une modélisation statistique par des équations physiques (souvent intégrées dans les pré traitements des données) est toujours positif.

Un modèle est avant tout un moyen de relier des variables à expliquer Y à des variables explicatives X, par une relation fonctionnelle :

Y = F(X)

Les modèles statistiques peuvent être regroupés en grandes familles (suivant la forme de la fonction F):

les modèles linéaires ;

les modèles non linéaires ;

les modèles non paramétriques.

Les modèles bayésiens (du nom de Bayes) peuvent être utilisés dans les trois catégories.

Statistique mathématique

Cette branche des mathématiques, très liée aux probabilités, est indispensable pour valider les hypothèses ou les modèles élaborés dans la statistique inférentielle. La théorie mathématiques des probabilités formalise les phénomènes aléatoires. Les statistiques mathématiques se consacrent à l'étude de phénomènes aléatoires que l'on connaît via certaines de ses réalisations.

Par exemple, pour une partie de dés à six faces :

le point de vue probabiliste est de formaliser un tel jeu par une distribution de probabilité associée aux événements la première, deuxième..., sixième face est tirée. La théorie des probabilités nous dit par exemple que pour que cette distribution soit une distribution de probabilité, il est nécessaire que . On peut alors étudier différentes propriétés de ce jeu ;

une fois cela fixé, les statistiques s'intéressent alors à ce genre de question : « Si au bout de 100 parties, chaque face a été tirée fois, puis-je avoir une idée de la valeur des probabilités ? Avec quel degré de confiance ? »

Une fois la règle établie, elle peut être utilisée en statistique inférentielle.

Statistique en sciences sociales

Les statistiques sont utilisées dans la plupart des sciences sociales. Elles présentent une méthodologie commune avec toutefois certaines spécificités selon la complexité de l'objet d'étude

En sociologie

L'apport des méthodes statistiques permet au sociologue l'utilisation de méthodes quantitatives lui permettant de déterminer des sociostyles.

Le problème majeur est pour le chercheur de définir des unités comparables (style de vie, tranche de revenus, opinions politiques, etc.).

Le sociologue réussit ainsi à déterminer des nuages de points correspondant à des axes comportementaux qui définissent l'évolution des différents groupes sociaux vers tel type de comportement (achat de tel ou tel produit, vote pour tel ou tel candidat à une élection).

中文百科

统计学是在数据分析的基础上,自17世纪中叶产生并逐步发展起来的一门学科。它是研究如何测定、收集、整理、归纳和分析反映数据数据,以便给出正确消息的科学。统计广泛地应用在各门学科,从自然科学、社会科学到人文学科,甚至被用来工商业及政府的情报决策之上。随着大数据(Big Data)时代来临,统计的面貌也逐渐改变,与信息、计算等领域密切结合,是数据科学(Data Science)中的重要主轴之一。

譬如自一组数据中,可以摘要并且描述这份数据的集中和离散情形,这个用法称作为描述统计学。另外,观察者以数据的形态,创建出一个用以解释其随机性和不确定性的数学模型,以之来推论研究中的步骤及母体,这种用法被称做推论统计学。这两种用法都可以被称作为应用统计学。数理统计学则是讨论背后的理论基础的学科。

总览

统计可以推测趋势和规律,说明自然和人文现象。 很多人认为统计学是一种科学的数学分支,是关于收集、分析、解释、陈述数据的科学。另一些人认为它是数学的一个分支,因为统计学是关于收集解释数据的。由于它基于观测、重视应用,统计学常被看作是一门独特的数学科学,而不是一个数学分支。很多统计学都不是数学的:如确保所收集来的数据能得出有效的结论;将数据编码、存档以使得信息得以保存,可以在国际上进行比对;汇报结果、总结数据,以便统计员可以明白它们的意思;采取必要措施,保护数据来源对象的隐私。 统计学家通过专门的试验设计和调查样本来提升数据质量。统计学自身也为数据的概率模型提供了预测工具。统计学在其他学术科目上得到了广泛的应用,如自然科学、社会科学、政府、商业等。统计顾问可以帮助没有入户调查经验组织与公司进行问卷研究。 总结叙述收集来的数据被称之为描述统计学。这在进行实验研究信息交流中十分有用。另外,从数据的分布上也可以得出观测上的随机性和不确定性。 将数据中的数据模型化,计算它的机率并且做出对于母群体的推论被称之为推论统计学。推论是科学进步的重要因素,因为它可能从随机变量中得出数据的结论。推论统计学将命题进行更深入的研究,将结果进行检测。这些都是科学方式的一部分。描述统计学和对新数据的分析更倾向于提供更多的信息,逼近命题所述的真理。 “应用统计学”包括描述统计学和推论统计学中的应用成分。理论统计学则注重统计推论背后的逻辑证明,以及数理统计学。数理统计学不但包括推导估测推论法的概率分布,还包括了计算统计和试验设计。 统计学与概率论联系紧密,并常以后者为理论基础。简单地讲,两者不同点在于概率论从母群体中推导出样本的概率。统计推论则正好相反——从小的样本中得出大的母群体的参数。

统计学的历史

统计手法最早可以追溯至公元前5世纪。最早的统计著作来自公元9世纪的《密码破译》(Manuscript on Deciphering Cryptographic Messages)一书,由阿拉伯人肯迪编着。在书中,肯迪详细记录了如何使用统计数据和频率分析进行密码破译。根据沙特阿拉伯工程师易卜拉欣·阿凯笛(Ibrahim Al-Kadi)的说法,统计学和密码学分析便如此一同诞生了 常态分配的钟型曲线的图 佛罗伦萨银行家、执政官乔瓦尼·维伦(Giovanni Villani)编订了佛罗伦萨14世纪历史书籍Nuova Cronica ,包括了如人口、法令、商贸、教育、宗教场所在内的统计数据,被誉之为历史上统计学入门的第一本书。一些学者将1663年约翰·格兰特根据死亡率统计表编订出版的《自然与政治观察》(Natural and Political Observations)一书定格为统计学的诞生。 统计学的英语词statistics是源于现代拉丁语statisticum collegium(国会)以及意大利语statista(国民或政治家)。德语Statistik,最早是由Gottfried Achenwall(1749)所使用,代表对国家的数据进行分析的学问,也就是“研究国家的科学”。在十九世纪统计学在广泛的数据以及数据中探究其意义,并且由John Sinclair引进到英语世界。 统计学的初衷是作为政府(通常是中央政府)以及管理阶层的工具。它大量透过国家以及国际统计服务搜集国家以及本土的数据。另外依照各方面,普查则提供关母体的信息。统计背后牵涉到更多数学导向的领域,如机率,或是从经验科学(特别在天文学)中获得的经验证据设置估计参数。在今日的世界里统计已经被使用在不仅仅是国家或政府的事务,更延伸到商业,自然以及社会科学,医疗等甚至更多方面。因为统计学拥有深厚的历史以及广泛的应用性,统计学通常不只被认为是数学所处理的对象,而是与数学本身的哲学定义与意义有密切的关联。许多知名的大学拥有独立的数理统计学系。统计学也在如心理学,教育学以及公共卫生学系中被视为是一门主科。 统计学的数学基础创建在17世纪布莱兹·帕斯卡和皮埃尔·德·费马发展的概率论上。概率论从研究几率得来。最小二乘法由卡尔·弗里德里希·高斯于1794年第一次得出。现代计算机可以进行更大尺度的统计运算,生成了许多无法用人工计算的新公式。

统计学的观念

描述统计学处理有关叙述的问题:是否可以摘要的说明数据的情形,不论是以数学或是图片表现,以用来代表母群体的性质?基础的数学描述包括了平均数和标准差等。图像的摘要则包含了许多种的表和图。主要是就说明数据的集中和离散情形。

推论统计学被用来将数据中的数据模型化,计算它的机率并且做出对于母群体的推论。这个推论可能以对/错问题的答案所呈现(假设检定),对于数字特征量的估计(估计),对于未来观察的预测,关联性的预测(相关性),或是将关系模型化(回归)。其他的模型化技术包括变异数分析(ANOVA),时间串行(time series analysis),以及数据挖掘(data mining)。

统计方法

设立研究计划,包括找到代表研究项目的数据,使用如下信息:根据处理效应进行初步预估,备用假说,预估实验变率。对实验目标的选择和道德上的考虑也是必不可少的。统计学家推荐实验(至少)应与另一个相同标准、不同项目的参照组进行对比,以减少偏差。

试验设计,使用区组变量来减少干扰变量的影响,将对象进行随机处理,消除估算处理效用与实验误差中的偏差。在此阶段,实验参与者和统计学家填写实验草案,并依此指导实验进程,对实验数据的原始分析进行细化。

根据实验草案进行实验、方差分析。

在第二次分析中进一步解析数据,为进一步研究提出新假说。

汇报研究结果并将其存档。

第一型错误中零假设被错误地证伪,得出测试结果为“假阳性”。

第二型错误中零假设没有被及时排除,母群体中的实际差异被错误判断为“假阴性”。

Student t检定注:Students为发展出此方法原创者的笔名。

变异数分析

卡方分配

费雪最小显著差异法(Fisher's Least Significant Difference test)

曼-惠特尼U检定(Mann-Whitney U)

回归分析

相关性

皮尔逊积矩相关系数

史匹曼等级相关系数

统计学的范畴

概率论与数理统计

抽样与抽样分布

统计数据的搜集、整理与显示

参数估计

非参数估计

假设检验

方差分析

时间串行分析

统计指数

聚类分析与判别分析

主成分分析与因子分析

相关分析与回归分析

延伸学科

农业科学

生物统计

商务统计

数据采矿(应用统计学以及图形从数据中获取知识)

经济统计学

电机统计

统计物理学

人口统计

心理统计学

教育统计学

社会统计(包括所有的社会科学)

文献统计分析

化学与进程分析(所有有关化学的数据分析与化工科学)

运动统计学,特别是棒球以及曲棍球

统计计算

计算机在20世纪后半叶的大量应用对统计科学产生了极大的影响。早期统计模型常常回避线性模型,但强劲的计算机及其算法导致非线性模型(如神经网络)和新式算法(如广义线性模式、等级线性模型)的大量应用。 计算机性能的增强使得需要大量计算的再取样算法成为时尚,如置换检验、自助法。Gibbs取样法也使得贝叶斯模型更加可行。计算机革命使得统计在未来更加注重“实验”和“经验”。大量普通或专业的统计软件现已面市。

滥用

同样的销售量原点不同,看起来差距很大。 统计数据时常被滥用,对结果的解释时常有利于演讲者。对统计的怀疑与误导可被称为:“世上有三种谎言:谎言,该死的谎言,统计数字”。许多对统计的滥用可能出于无意,也可能出于故意。《如何用统计来说谎》一书(How to Lie With Statistics)揭露了许多类似诡计,并在统计的应用与滥用中,回顾了许多案例中的统计方法(e.g. Warne, Lazo, Ramos, and Ritter (2012)。 预防统计滥用包括使用合适的图表、规避偏差。当结论被轻率概化,超过了它所能代表的范围时,滥用就出现了。这常常是因无意或故意忽视样本偏差所导致的。 条形统计图可能是最容易使用、最容易理解的图表了,它可以用手或计算机绘制而成。不巧的是,许多人忽视其中的偏差、误差,因为他们不留意。因此,虽然图表质量低劣,但人们常常愿意去相信。只有当样本可以代表总体时,统计结果才是可信、精确的。哈弗(Huff)称:“样本的可靠性可以被偏差破坏...给你自己点怀疑的空间吧。”

法法词典

statistique nom commun - féminin ( statistiques )

  • 1. ensemble de données chiffrées qui rendent compte de l'évolution de faits quantifiables [Remarque d'usage: le plus souvent au pluriel]

    fournir des statistiques économiques fiables

  • 2. mathématiques branche des mathématiques qui recueille, traite et analyse un ensemble de données réelles pour établir des prévisions [Remarque d'usage: en général au pluriel]

    suivre un cours de statistiques • statistique descriptive

statistique adjectif ( même forme au masculin et au féminin, pluriel statistiques )

  • 1. qui procède de la méthode de collecte et d'analyse de données réelles quantifiables

    une batterie de tests statistiques • série statistique

相关推荐

biais biais, eadj. 斜的, 歪的[仅用于建筑]n. m. 1. 斜, 倾斜, 歪斜; 2. <转>迂回的方法, 转弯抹角的办法, 花招, 借口, 遁词; 3. <转>方面, 角度; 斜向4. 斜裁的布条5.【统计学】,性en/ de biaisloc.adv1. 斜向地;歪斜地2. <转>迂回地,转弯抹角地,间接地par le biais de loc.prép.…;用…的(间接)办法常见用法

malodorant a. (m) 恶臭的, 难闻的

tribun n.m.1. (古罗马的)军官;行政长官 2. 平民演说;辩护士;民权保卫者3. 【史】(法拿破仑时期的)法案评委员会委员

immigrant immigrant, ea. 入境移居的n. 入境移

milliardaire a. 拥有十亿资财; 巨富, 豪富n. 亿万巨富, 大富豪

ciboule n. f 葱

incertain incertain, ea.1. 知, 可靠;未 2. 分明, 清晰;朦 3. (在未来)变化, 无法肯 4. 犹豫决 — n.m.【财政金融】(外汇)直接标价常见用法

automate n. m.木偶, 玩具, 木头, 惟命是从者; gestes d'automate 机械作 机, 装置, 机器, 售货售票机

apprivoiser 驯服

quitter v. t. 1. [古]免(债务); 让给2. 弃约; 放弃, 脱离; 中断, 丢下: 3. 离开, 走出:4. 放开, 放松: 5. 脱掉, 去(帽等): se quitter v. pr. 分离, 分别常见用法