RECHERCHE :
Bienvenue sur le site de Michel VOLLE
Powered by picosearch  


Vous êtes libre de copier, distribuer et/ou modifier les documents de ce site, à la seule condition de citer la source.
 GNU Free Documentation License.

Le bon usage de la statistique

12 février 2001

J'ai fait pas mal de statistique dans une vie antérieure, j'ai produit des nombres et des analyses, et j'ai tâché de comprendre ce que je faisais ainsi (cf. "Le métier de statisticien"). J'ai donc quelques idées de bon sens sur l'usage de la statistique et sur les cas où il ne convient pas de l'utiliser. Je suis étonné de constater la résistance que ces idées rencontrent. 

Décrivons d'abord les idées, puis la résistance, enfin expliquons celle-ci.

La production statistique ne peut commencer que lorsque l'on dispose de nomenclatures permettant de découper et classer les objets étudiés (cf. Essai sur les nomenclatures industrielles). Or la construction d'une nomenclature est une longue affaire. Il existe donc des époques où l'on ne dispose pas encore des nomenclatures qui permettraient de décrire l'objet que l'on souhaite étudier.

Il en est ainsi, aujourd'hui, pour la nouvelle économie. Les concepts ne sont pas clairement définis. Les séries chronologiques sont trop courtes pour étalonner des modèles économétriques. Lorsque des échanges marchands ont lieu, on peut mesurer leur valeur mais il est difficile de distinguer dans son évolution ce qui provient du volume et ce qui provient du prix, car la qualité des produits évolue vite. Chaque pays calculant à sa façon les données macro-économiques, la comparaison internationale est risquée. Certaines innovations ne sont pas encore prises en compte : ainsi le téléphone mobile n'est pas représenté dans l'indice du prix de la consommation des ménages en France, alors que 50 % des personnes sont équipées. Il ne faut pas en vouloir aux statisticiens, car le problème est redoutable (comment construire un indice qui recouvre l'évolution de tarifs aussi divers ?)

Cette situation n'est pas sans précédents. Dans la première moitié du XIXème siècle, l'industrie était nouvelle et les concepts pour la décrire n'existaient pas. Qu'ont fait les statisticiens ? des monographies. Ils n'ont pas calculé des totaux ou des moyennes, car les marchés en pleine évolution étaient loin du point d'équilibre, mais ils ont fourni des informations individuelles sur chaque établissement, permettant ainsi de constater les performances que l'industrie rendait possibles (cf. l'article sur les nomenclatures). Or la monographie, c'est l'étape préliminaire de la statistique, celle où l'on peut dégager les concepts qui fonderont ensuite nomenclatures, enquêtes et calculs.

Nous en sommes au même point avec les nouvelles technologies. Utiliser la statistique, la macro-économie, les comparaisons internationales, l'économétrie, c'est se croire plus avancés que nous ne le sommes. Jean Tirole et Josh Lerner ont choisi la bonne approche dans "The Simple Economics of Open Source" (17 janvier 2001), "En raison du caractère encore trop récent de ce domaine, nous n'avons pas cherché à construire un nouveau cadre théorique, ni à analyser des statistiques.  Nous avons concentré notre attention sur quatre cas particuliers : Apache, Linux, Perl et Sendmail" ("Reflecting the early stage of the field’s development, we do not seek to develop new theoretical frameworks or to statistically analyze large samples. Rather, we focus on four "mini-cases" of particular projects: Apache, Linux, Perl, and Sendmail"). Cette démarche ne signifie pas que l'on renonce aux cadres théoriques que fournit la pensée économique, mais que l'on se garde de plaquer sur une réalité nouvelle un cadre conceptuel hérité d'autres époques. 

La mode est cependant au quantitatif. Pour faire sérieux, il faut évoquer des nombres. Bien sûr personne ne comprend rien quand on affiche des tableaux de nombres ou que l'on cite des pourcentages : pour que le public comprenne, il faudrait lui présenter les nombres de façon sélective, intelligente, mais ce n'est pas le but. Il s'agit, pour celui qui parle, non d'être compris mais d'inspirer le respect par une liturgie. Personne n'ose lever le doigt pour dire "je n'y comprends rien" : les rieurs seraient contre lui et pour l'orateur, chacun feignant de s'y retrouver. (Vous trouvez que j'exagère ? alors regardez, dans votre entreprise, la discussion du budget annuel, et demandez-vous sincèrement si vous comprenez ce qui s'y passe. Seul celui qui présente les tableaux sait de quoi il parle, et encore.) 

Le mépris accable celui qui met en doute la pertinence du nombre alors même que celui-ci, en fait, n'apporte que la confusion. "Vous êtes un philosophe" (et non un économiste), ou encore "vous êtes un sociologue", lui dit-on en ricanant (à mon humble avis toute personne qui associe une connotation péjorative à un terme comme "philosophe", "sociologue", "technicien", "ingénieur" etc. s'exclut ipso facto de la conversation sérieuse.) Le voilà expulsé de la corporation des gens "sérieux", de ceux qui remplissent les revues d'articles "économiques" dont la vacuité ne peut apparaître qu'après une pénible semaine de lecture et de calcul, et qui rappellent ce que Feynman disait de la "science prétentieuse"

Lors d'un groupe de travail consacré à l'économie de la connaissance, un "économiste" a proposé de se limiter à l'examen des échanges marchands "parce qu'ils sont observables". N'êtes-vous pas en train de chercher votre clé sous le réverbère, lui ai-je demandé ? que faites-vous de ce qui se passe dans les entreprises en matière de groupware, knowledge management, datawarehouse, système d'aide à la décision, segmentation de la clientèle ? rien de tout cela n'est marchand puisque cela se passe dans l'entreprise, mais cela ne constitue-t-il pas pourtant l'essentiel de ce qui se fait en économie de la connaissance ? "Nenni, me répondit-il en anglais, vous êtes un philosophe, je ne peux travailler que si j'ai des données quantitatives". 

Quand donc respectera-t-on de nouveau la frontière entre ce qui, c'est vrai, peut et doit se mesurer, et ce que l'on ne peut aborder que de façon monographique ? les grands économistes n'étaient pas de grands économètres. Il y a peu de statistiques dans les oeuvres de Smith, Marshall et Hicks. Cela ne veut certes pas dire qu'ils étaient indifférents aux faits. Mais sans doute n'éprouvaient-ils pas le besoin, pour en imposer, d'abrutir leur lecteur par des calculs impertinents.

Je précise pour éviter les malentendus que j'aime à utiliser le calcul et à analyser les nombres, lorsque c'est pertinent, parce que cela apporte une clarté précieuse. Je sais que beaucoup de questions qualitatives ne se tranchent que par le recours à la mesure quantitative, comme lorsque l'on estime la rentabilité d'un projet pour préparer une décision. Mais je sais aussi combien il faut être sobre dans la présentation des calculs si l'on veut être clair et compris, et si l'on ne cherche pas à mystifier l'auditeur.

J'aime à utiliser les nombres et je les respecte. Je vois donc bien que, souvent, on les prostitue pour impressionner. 

Consultez la réponse que m'a faite un statisticien