Le bon usage de la statistique
12 février 2001
J'ai fait pas mal de statistique dans une vie
antérieure, j'ai produit des nombres et des analyses, et j'ai tâché de
comprendre ce que je faisais ainsi (cf. "Le
métier de statisticien"). J'ai donc
quelques idées de bon sens sur l'usage de la statistique et sur les cas où il
ne convient pas de l'utiliser. Je suis étonné de constater la résistance que
ces idées rencontrent.
Décrivons d'abord les idées, puis la
résistance, enfin expliquons celle-ci.
La production statistique ne peut commencer que
lorsque l'on dispose de nomenclatures permettant de découper et classer les
objets étudiés (cf. Essai sur les
nomenclatures industrielles). Or la construction d'une nomenclature est une
longue affaire. Il existe donc des époques où l'on ne dispose pas encore des
nomenclatures qui permettraient de décrire l'objet que l'on souhaite étudier.
Il en est ainsi, aujourd'hui, pour la nouvelle
économie. Les concepts ne sont pas clairement définis. Les séries
chronologiques sont trop courtes pour étalonner des modèles économétriques.
Lorsque des échanges marchands ont lieu, on peut mesurer leur valeur mais il
est difficile de distinguer dans son évolution ce qui provient du
volume et ce qui provient du prix, car la qualité des produits évolue vite.
Chaque pays calculant à sa façon les données macro-économiques, la
comparaison internationale est risquée. Certaines innovations ne sont pas
encore prises en compte : ainsi le téléphone mobile n'est pas représenté
dans l'indice du prix de la consommation des ménages en France, alors que 50 %
des personnes sont équipées. Il ne faut pas en vouloir aux statisticiens, car
le problème est redoutable (comment construire un indice qui recouvre
l'évolution de tarifs aussi divers ?)
Cette situation n'est pas sans précédents. Dans
la première moitié du XIXème siècle, l'industrie était nouvelle et les
concepts pour la décrire n'existaient pas. Qu'ont fait les statisticiens ? des monographies.
Ils n'ont pas calculé des totaux ou des moyennes, car les marchés en pleine
évolution étaient loin du point d'équilibre, mais ils ont fourni des
informations individuelles sur chaque établissement, permettant ainsi de
constater les performances que l'industrie rendait possibles (cf. l'article sur
les nomenclatures). Or la
monographie, c'est l'étape préliminaire de la statistique, celle où l'on peut
dégager les concepts qui fonderont ensuite nomenclatures, enquêtes et calculs.
Nous en sommes au même point avec les nouvelles
technologies. Utiliser la statistique, la macro-économie, les comparaisons
internationales, l'économétrie, c'est se croire plus avancés que nous ne le
sommes. Jean Tirole et Josh Lerner ont choisi la bonne approche dans "The
Simple Economics of Open Source" (17 janvier 2001), "En raison
du caractère encore trop récent de ce domaine, nous n'avons pas cherché à
construire un nouveau cadre théorique, ni à analyser des statistiques. Nous avons concentré notre attention sur quatre cas particuliers : Apache,
Linux, Perl et Sendmail" ("Reflecting
the early stage of the field’s development, we do not seek to develop new
theoretical frameworks or to statistically analyze large samples. Rather, we
focus on four "mini-cases" of particular projects: Apache, Linux,
Perl, and Sendmail"). Cette démarche ne signifie pas que l'on renonce aux
cadres théoriques que fournit la pensée économique, mais que l'on se garde de
plaquer sur une réalité nouvelle un cadre conceptuel hérité d'autres
époques.
La mode est cependant au quantitatif. Pour faire
sérieux, il faut évoquer des nombres. Bien sûr personne ne comprend rien
quand on affiche des tableaux de nombres ou que l'on cite des pourcentages :
pour que le public comprenne, il faudrait lui présenter les nombres de façon
sélective, intelligente, mais ce n'est pas le but. Il s'agit, pour celui
qui parle, non d'être compris mais d'inspirer le respect par une
liturgie. Personne n'ose lever le doigt pour dire "je n'y comprends
rien" : les rieurs seraient contre lui et pour l'orateur, chacun
feignant de s'y retrouver. (Vous trouvez que j'exagère ? alors regardez, dans votre entreprise,
la discussion du
budget annuel, et demandez-vous sincèrement si vous comprenez ce qui s'y passe.
Seul celui qui présente les tableaux sait de quoi il parle, et
encore.)
Le mépris accable celui qui met en doute la
pertinence du nombre alors même que celui-ci, en fait, n'apporte que la confusion. "Vous êtes un philosophe"
(et non un économiste), ou encore "vous êtes un
sociologue", lui dit-on en ricanant (à mon humble avis toute personne qui associe une connotation
péjorative à un terme comme "philosophe", "sociologue",
"technicien", "ingénieur" etc. s'exclut ipso facto
de la conversation sérieuse.) Le voilà expulsé de la corporation
des gens "sérieux", de ceux qui remplissent les revues d'articles
"économiques" dont la vacuité ne peut apparaître qu'après une
pénible semaine de lecture et de calcul, et qui rappellent ce
que Feynman disait de la "science prétentieuse".
Lors d'un groupe de travail consacré à
l'économie de la connaissance, un "économiste" a proposé de se
limiter à l'examen des échanges marchands "parce qu'ils sont
observables". N'êtes-vous pas en train de chercher votre clé sous le
réverbère, lui ai-je demandé ? que faites-vous de ce qui se passe
dans les entreprises en matière de groupware, knowledge
management, datawarehouse, système d'aide à la décision,
segmentation de la clientèle ? rien de tout cela n'est marchand puisque cela
se passe dans l'entreprise, mais cela ne constitue-t-il pas pourtant
l'essentiel de ce qui se fait en économie de la connaissance ? "Nenni, me
répondit-il en anglais, vous
êtes un philosophe, je ne peux travailler que si j'ai des données
quantitatives".
Quand donc respectera-t-on de nouveau la
frontière entre ce qui, c'est vrai, peut et doit se mesurer, et ce que l'on ne
peut aborder que de façon monographique ? les grands économistes n'étaient
pas de grands économètres. Il y a peu de statistiques dans les oeuvres de
Smith, Marshall et Hicks. Cela ne veut certes pas dire qu'ils étaient
indifférents aux faits. Mais sans doute n'éprouvaient-ils pas le besoin, pour
en imposer, d'abrutir leur lecteur par des calculs impertinents.
Je précise pour éviter les malentendus que
j'aime à utiliser le calcul et à analyser les nombres, lorsque c'est pertinent,
parce que cela apporte une clarté précieuse. Je sais que beaucoup de questions
qualitatives ne se tranchent que par le recours à la mesure quantitative, comme lorsque l'on estime la rentabilité d'un projet pour préparer une
décision. Mais je sais aussi combien il faut être sobre dans la présentation des
calculs si l'on veut être clair et compris, et si l'on ne cherche pas à
mystifier l'auditeur.
J'aime à utiliser les nombres et je les respecte.
Je vois donc bien que, souvent, on les prostitue pour impressionner.
Consultez la réponse
que m'a faite un statisticien.
|