Le métier de statisticien
CHAPITRE III
La méthode statistique
Retour à la table des matières
Ceux qui ne pratiquent pas la statistique, et en outre bon
nombre de statisticiens, ne perçoivent pas l'importance de la méthode statistique. Ils
conçoivent la définition des unités, des codes et des nomenclatures comme des tâches
obscures, indispensables sans doute mais relativement secondaires. On s'imagine volontiers
que la statistique fabrique spontanément et naturellement une image du réel que le
raisonnement peut ensuite utiliser telle quelle ; en négligeant la phase méthodologique
de la statistique, on néglige la relation entre les instruments de mesure et le cadre
théorique et idéologique dans lequel ils ont été conçus ; on saute l'étape lors de
laquelle la théorie s'incarne dans l'instrument.
Ce point de vue n'est pas le nôtre. Le fondement
méthodologique de l'instrument nous paraît, au contraire, déterminant. Il est à tel
point dépendant de la théorie que parfois, lorsque la théorie n'est pas explicite,
c'est l'examen de l'instrument lui-même qui peut permettre de la reconstituer : nous
verrons dans la partie historique que l'on peut trouver trace, dans les instruments
statistiques, des options théoriques ou idéologiques de ceux qui les ont conçus.
Considérons la méthode statistique à son début : la prise en
compte d'une " demande d'information ". Nous verrons que la demande sociale est
particulièrement ambiguë et se manifeste selon des médiations complexes. Aussi nous
contenterons-nous ici d'une situation volontairement simplifiée : celle où le
statisticien est confronté à un " demandeur " unique, à une personne qui, à
elle seule, représente une institution.
Supposons par exemple que quelqu'un demande à un statisticien
de lui fournir des informations sur les établissements industriels d'une certaine zone
géographique. Le plus souvent, la demande spontanée prend l'une ou l'autre de deux
formes différentes selon le caractère du demandeur : soit il veut, dit-il " tout
savoir " sur ces établissements ; soit il a déjà, au contraire, une idée précise
sur ce qu'il désire savoir.
Celui qui veut " tout savoir " doit être
immédiatement placé devant cette évidence : on pourrait employer toute la force de
travail de la population dans des recherches statistiques sans parvenir pour autant à
épuiser un sujet d'étude même réduit. Faut-il aller jusqu'à compter les cheveux des
personnes employées dans ces établissements, à les classer par longueur ? Non, bien
sûr. Donc, il ne s'agit pas de tout connaître. Il faut sélectionner. Mais que
sélectionner ? On ne se posera pas les mêmes questions selon que l'on étudie ces
établissements en vue de mettre au point un programme de formation professionnelle, ou un
plan d'équipement routier, ou de rechercher des occasions d'investissement, ou de
prospecter un marché, etc. Les questions doivent être adaptées aux objectifs visés,
qui peuvent être extrêmement précis (on cherche par exemple à trouver un marché pour
un produit donné, qui sera disponible pendant une période limitée et pour un prix
donné). Cette adaptation ne peut se faire que si l'on connaît conjointement et le
problème posé, et les possibilités de la production d'information. Or, avant la
rencontre entre le demandeur et le statisticien, cette connaissance n'est pas "
conjointe " : l'un connaît ses problèmes, l'autre connaît les possibilités de la
statistique. La mise en relation de ces deux connaissances ne peut se faire qu'à travers
un dialogue.
Par ailleurs, lorsque la demande est précise, rien ne permet
d'espérer que sa formulation spontanée tiendra compte des possibilités de la
statistique, que le demandeur connaît peu ou pas. Parfois il sera impossible de
satisfaire cette demande spontanée ; parfois au contraire ce sera possible et même
facile, mais qui sait si d'autres informations n'auraient pas, en fait, rendu au demandeur
de meilleurs services ? Avant de communiquer des résultats ou de concevoir un instrument
nouveau, le statisticien doit, au moins provisoirement, mettre entre parenthèses la
demande spontanée et s'inquiéter de ce que le demandeur veut faire, de ses intentions
d'action et de ses objectifs. Il doit l'interroger afin d'obtenir les indications
indispensables pour une production pertinente d'information. Il arrive que le demandeur
juge cette interrogation indiscrète, et qu'il refuse de répondre. Il faut alors lui
expliquer qu'on ne pourra construire pour lui aucun instrument convenable sans savoir ce
qu'il veut en faire et que, s'il entend utiliser des statistiques stockées dans les
publications ou les banques de données, il ne pourra le faire de façon raisonnable
qu'après avoir reçu un mode d'emploi adapté à ses besoins : telle statistique sera
utilisable par celui qui n'a besoin que d'un ordre de grandeur, et sera trop imprécise
pour celui qui veut étudier des évolutions. Le plus souvent le demandeur est rassuré
par ces explications ; mais il arrive que le dialogue entre le statisticien et lui ne
puisse pas débuter, à cause d'un véritable blocage.
Au fond, la situation du statisticien face au demandeur est
semblable à celle de l'architecte face à son client : " Je veux que vous me
construisiez une maison ", dit le client ; et, si cela se trouve, il a déjà son
idée sur ce qu'il souhaite : idée en général conventionnelle et maladroite, car il
ignore les possibilités et les limites de l'architecture. L'architecte consciencieux
interrogera son client sur sa famille, ses goûts, son style de vie, ses moyens ; il
" branchera " sur les besoins du client sa connaissance des techniques de la
construction et des possibilités d'aménagement ; et le plan qui résultera de cette
confrontation sera le produit conjoint des besoins et de la technique. Par contre un
architecte peu consciencieux imposera d'autorité un plan omnibus, ou au contraire se
laissera déterminer par la première et maladroite expression de la demande ; ainsi
agissent aussi les statisticiens peu consciencieux.
La demande d'information peut assez souvent être satisfaite à
l'aide de statistiques existantes, moyennant quelques précautions et rectifications. Mais
il arrive aussi qu'elle nécessite une nouvelle production d'information, qui sera
réalisée si le client décide de s'offrir le luxe de financer une enquête (1). C'est
cette dernière hypothèse que nous allons maintenant suivre.
Tout au long de la phase méthodologique, le contact entre le
statisticien et le client doit être assidu. Certes, le client peut avoir l'impression
d'être importuné ; il peut penser que le statisticien n'a qu'à se débrouiller tout
seul pour produire les informations qu'on lui demande. C'est malheureusement ainsi que
cela se passe souvent. La définition des unités, la construction des nomenclatures sont
considérées comme des étapes sans grand intérêt, subalternes et péniblement
techniques, auxquelles on n'accorde pas une grande attention. Et pourtant, les choix
réalisés à ce stade sont essentiels. Mais revenons, pour un instant, à la description
de ces opérations.
Il n'y a pas de statistique sans ce que l'on appelle des "
unités statistiques ", c'est-à-dire (en simplifiant un peu) des personnes ou des
objets sur lesquels porte le questionnaire, et qu'il convient de définir. Les "
unités " possibles a priori sont très variées : l'individu, le ménage, le
logement, le compte bancaire, l'entreprise, l'établissement, la fraction d'entreprise,
etc. Dans certaines enquêtes agricoles, l'" unité " est un point repéré sur
une photographie aérienne et autour duquel on observe périodiquement les cultures. La
définition de l'unité dépend, bien sûr, de ce que l'on recherche et aussi des
possibilités présumées de la collecte.
La construction des nomenclatures pose davantage de problèmes.
C'est, en fait, l'opération fondamentale de la méthode statistique. C'est la pratique -
et non la théorie statistique, qui n'accorde que peu ou pas de place aux nomenclatures -
qui nous a progressivement convaincu de leur importance, que nous n'étions nullement
enclin à reconnaître d'abord. Nous en avons déduit un critère de jugement qui vaut ce
qu'il vaut mais qui nous a souvent rendu service : un statisticien qui ne conçoit pas
l'importance des nomenclatures sera peut-être bon technicien ou bon organisateur, ce ne
sera pas vraiment un statisticien au sens plein du mot. Une question suffit pour savoir à
qui l'on a affaire.
Mais qu'est-ce qu'une nomenclature ? Le mot est un peu
rébarbatif, la chose l'est aussi. Quand, par exemple, on feuillette une nomenclature de
produits, on y trouve une liste de produits, classée d'une façon qui peut paraître
étrange, et émaillée de détails cocasses (2). Souvent la nomenclature comporte
plusieurs " niveaux " correspondant à des degrés de détail différents : les
produits de la liste la plus détaillée se regroupent pour constituer un poste du niveau
supérieur, etc. Le schéma de telles nomenclatures est celui d'un " arbre " :
Il existe des nomenclatures de produits, d'activité, d'emploi,
de qualification, de catégories sociales ; le code géographique est une nomenclature,
ainsi que le " plan comptable " qui sert à classer les opérations comptables
(3). La classification des êtres vivants se fait selon une nomenclature dont les niveaux
principaux sont ceux des règnes, embranchements, classes, ordres, familles et espèces.
Le formalisme des nomenclatures est donc largement répandu, avec sa structure en niveaux
emboîtés les uns dans les autres. Le mot " nomenclature " a de nombreux
synonymes : systématique, typologie, taxinomie, etc. Dans le langage des statisticiens,
qui n'est pas encore parfaitement fixé, les mots tendent à prendre le sens suivant : la
" classification " est l'opération par laquelle on construit une nomenclature
(on définit les " classes "). La " nomenclature " est le produit
concret, disponible sous la forme d'un texte, de l'opération de classification. Le "
classement " est l'opération par laquelle on identifie la classe d'une nomenclature
à laquelle appartient un individu : on classe les établissements selon leur activité
économique principale, les individus selon leur métier, leur catégorie sociale, etc.
Le traitement de l'information (qu'il soit " manuel "
ou automatique) nécessite des " codages " : au moment de l'exploitation des
résultats, il est impossible de conserver la dénomination d'une classe " en clair
" ; cette dénomination sera remplacée par un code numérique, d'ailleurs
conventionnel, mais auquel on demandera d'avoir certaines propriétés commodes : par
exemple, les premiers chiffres du code désigneront le classement de l'individu dans le
niveau le plus agrégé de la nomenclature (que l'on nommera alors " premier niveau
"), les chiffres suivants désignant le classement dans le deuxième niveau, etc., de
sorte que le code indiquera à la fois la classe élémentaire et les classes des niveaux
plus agrégés auxquelles elle appartient. Les nomenclatures fournissent le point de
départ de ces codages et, pour un informaticien, les mots " code " et "
nomenclature " sont synonymes. La gestion automatique des nomenclatures inclut des
calculs d'agrégation et de ventilation, ainsi que la mise en uvre des " tables
de passage " à l'aide desquelles on peut, moyennant parfois une perte de précision,
transcrire des résultats d'une nomenclature dans une autre.
Nous ne chercherons pas ici à aller plus avant dans la
description du rôle pratique des nomenclatures dans la production d'information (4)..
Nous en avons assez dit pour que l'on sente son importance. Les choix opérés lors de la
constitution des nomenclatures vont concerner toutes les phases de la production
d'information, et le produit final de cette production sera profondément marqué par ces
choix. Les nomenclatures déterminent la grille conceptuelle à travers laquelle le réel
est perçu : le niveau le plus fin est, comme le " grain " d'une photographie,
un degré de détail au-delà duquel on ne peut plus rien discerner ; les niveaux
agrégés sont des regroupements dont le raisonnement s'empare, mais sur lesquels il est
risqué de raisonner sans se soucier de leur construction. Celle-ci doit être faite en
usant de " critères " qui règlent l'agrégation des postes élémentaires
d'une façon convenable en regard des utilisations : nous verrons au chapitre IX comment
ces critères ont pu évoluer dans l'histoire.
Prenons un exemple. L'" industrie textile " peut être
définie en regroupant un certain nombre de branches : les textiles artificiels et
synthétiques (T.A.S.), la bonneterie, et les industries textiles traditionnelles de la
laine, de la soierie, du coton, du lin, etc. A priori, d'autres définitions sont
possibles : on pourrait classer la bonneterie avec la confection ou les T.A.S. avec la
chimie.
D'après la première définition l'" industrie textile
" associe donc des branches d'activité en forte croissance (les T.A.S. et la
bonneterie) à d'autres branches en déclin (laine, coton, etc.). L'indice de la
production des textiles, moyenne pondérée des indices de ces branches, est représenté
par une courbe qui serpente au milieu de l'éventail des évolutions ; l'impression qui
découle de cette courbe est que l'industrie textile, après avoir subit un choc en 1965
et avoir connu quelques oscillations, a retrouvé, dès 1968, son niveau de 1963 et a, de
1968 à 1973, progressé à un rythme modéré (courbe " Textile 1 ").
Si l'on avait choisi d'autres conventions, l'évolution de
l'industrie textile aurait semblé différente. Par exemple, en classant hors du textile
les T.A.S. et la bonneterie, on obtient une courbe " Textile 2 " bien
différente de la première, car elle montre une baisse plus accentuée en 1965, et un
rattrapage du niveau de 1963 en 1971 seulement, suivi d'une croissance nettement plus
lente.
Tirons les leçons de cet exercice. L'économiste qui parle de
l'industrie textile, s'il est pressé ou superficiel (cela arrive), regarde la courbe
" Textile 1 " sans s'interroger sur ce qu'elle recouvre ; il la commente en
présentant l'évolution des textiles comme une croissance lente ; cette lenteur fait
certes contraste avec le reste de l'économie, mais la croissance, même lente, est
réelle. Si au contraire les conventions excluent les T.A.S. et la bonneterie, la courbe
donne l'image d'une industrie dont la production stagne, et on parlera des textiles comme
d'une industrie dont le retard s'accentue. Dans les deux cas, pourtant, la réalité
physique de l'industrie est la même : seule a changé l'image qu'en donne la
nomenclature.
Cet exemple peut sembler peu probant. Un économiste qui
travaille sur une industrie aussi importante que le textile ne se contente pas, dira-t-on,
de regarder l'évolution d'ensemble de cette industrie : il examine aussi les évolutions
de ses parties, et il sait en voir les différences. Sans doute ; mais il arrive pourtant
parfois qu'un économiste commette l'erreur de prendre un concept construit pour la chose
elle-même. Par exemple, lorsqu'il s'agit de procéder à des comparaisons
internationales, on ne pense pas toujours à vérifier que les nomenclatures des divers
pays comparés soient identiques, et l'on confronte alors des chiffres qui recouvrent des
contenus différents. Le même risque se présente lorsqu'on étudie des évolutions sur
très longue période, car alors les nomenclatures d'un même pays ont changé. Ensuite,
l'erreur que l'on saura éviter lorsqu'il s'agit d'une branche importante comme le textile
ne sera peut-être pas évitée sur des branches moins connues. Enfin, et surtout, le
public qui reçoit l'information et qui n'a ni l'idée, ni le loisir de l'analyser dans le
détail, concentre son attention sur quelques indicateurs essentiels ; ces indicateurs
véhiculent une image de la réalité économique, certes grossière, mais à partir de
laquelle se forgent des opinions, se prennent des décisions, etc. ; et, par-delà toutes
les finesses possibles des études détaillées, l'image de l'évolution de l'industrie
textile qui restera dans la mémoire de ce public informé et actif et qui, quelque jour,
provoquera quelque décision, sera influencée fortement (même si elle n'est pas
déterminée) par les indicateurs statistiques globaux, et donc par les choix opérés
dans la construction des nomenclatures.
Pour bien comprendre ce que contient un poste agrégé, il ne
suffit pas toujours de lire la liste des postes les plus fins : on pourrait croire par
exemple que tous les pansements relèvent de l'industrie textile, et la liste fine
comporte des postes qui le donnent à penser (ouate, etc.) ; or une partie importante de
la production de pansements est classée dans l'industrie pharmaceutique, qui relève de
la chimie.
Ce qui précède explique que les nomenclatures aient une telle
importance politique. Les concepts qu'elles délimitent servent non seulement à produire
de l'information, mais à découper des institutions, à instruire les dossiers qui
préparent des décisions ; l'information qu'ils définissent sera parfois "
réifiée " au point de passer pour la réalité elle-même. Un objet économique qui
n'est pas reconnu dans les nomenclatures est " tué " pour la connaissance
statistique et le raisonnement économique (5) ; un objet dont l'existence économique est
douteuse, mais que les nomenclatures continuent à définir, se survit à lui-même dans
le discours et dans la politique économiques (6). On comprend que les discussions et les
consultations qui aident à préparer les nomenclatures soient parfois si tendues, si
polémiques : des institutions se battent alors pour leur survie ou pour l'extension de
leurs compétences. L'effet du cadre institutionnel sur les nomenclatures est tout aussi
important que celui des exigences de la " connaissance économique pure " : on
peut le déplorer, mais c'est un fait. Pourrait-il en être autrement, alors que les
institutions déterminent la nature et les moyens de l'action politique et économique, et
exigent d'être alimentées en information pour éclairer leur action ?
Mais allons un peu plus loin. La nature même de son travail
oblige le statisticien à disposer de nomenclatures explicites fournissant un découpage
correct (" sans omission ni double emploi ", selon la formule consacrée (7)) du
domaine qu'il doit étudier. Supposons qu'un statisticien soit chargé de mettre en place
un système d'information au sein d'une institution complexe, par exemple d'une
administration. Bien souvent, cette institution sera elle-même divisée en services qui
constituent autant de petites institutions distinctes, pourvues d'une politique propre, et
se comportent comme des féodalités se disputant leurs territoires en menant une guerre
de manuvres et de coups de main. La situation du " front " se stabilise
habituellement grâce à quelques compromis implicites et plus ou moins boiteux ; la
répartition réelle des tâches diffère presque toujours de la répartition théorique
qui figure dans l'organigramme. Le caractère implicite des compromis est, bien sûr, une
des conditions essentielles de la stabilisation du " front " et de la
tranquillité relative des services : une prise de conscience claire réveillerait des
plaies d'amour propre que l'habitude a anesthésiées, et une explicitation publique
provoquerait une intervention de la hiérarchie qui, au nom de la logique, modifierait les
frontières des services et ouvrirait des occasions de conflits sur un terrain renouvelé.
Or le statisticien réclame justement une explicitation radicale
des domaines de compétence et d'action pour définir son instrument, organiser ses
circuits de collecte et de transmission, préparer ses nomenclatures. Il acquiert alors
assez rapidement - et souvent à sa grande surprise, car sa formation principalement
mathématique ne le prépare guère aux subtilités de la politique des services - la
réputation d'un trouble-fête, voire d'un dangereux révolutionnaire venu exprès créer
du désordre dans l'institution. Un malentendu s'installe entre le statisticien qui
applique les règles techniques de son métier et utilise en toute bonne foi un langage
qu'il croit être celui de la rationalité et du bon sens, et une institution qui a
besoin, pour continuer de fonctionner, du maintien des équilibres délicats qu'elle a
forgés au cours de son histoire. Le plus souvent, c'est l'institution qui l'emporte dans
ce conflit. Une fois passé le premier moment de stupeur, elle entoure le statisticien
d'une barrière protectrice faite d'un mélange très particulier d'inertie, d'approbation
factice, de bêtise simulée. Le statisticien a alors l'impression de se battre contre des
édredons ; l'information qu'il produit, bien qu'elle soit conforme aux demandes
exprimées par les services, ne leur sert visiblement à rien. S'il manque de sensibilité
historique et sociologique, il se percevra comme le représentant malheureux de la Raison
dans un univers absurde. Et il tournera à vide, enfermé dans sa logique, jusqu'au jour
(qui peut fort bien ne jamais arriver) où, par suite d'une évolution de l'institution
qui lui restera mystérieuse, tel service ou telle catégorie de personnes se mettront à
utiliser ses produits, à des fins imprévues et en tout cas différentes des objectifs
initiaux.
Nous pourrions illustrer ce schéma par des anecdotes, des noms
propres et des dates. Bien des praticiens y auront reconnu des situations qu'ils ont
vécues ou côtoyées, qu'il s'agisse de praticiens de la statistique au sens usuel du
terme ou d'informaticiens, de conseillers en gestion, etc., ayant eu à mettre en place
dans le cadre de leurs travaux une organisation de production d'information et donc
à se comporter, peu ou prou, en statisticiens (8).
S'il veut pouvoir exercer correctement son métier,
c'est-à-dire produire une information significative et pratiquement utilisable, le
statisticien doit travailler aussi en historien et en sociologue. La manipulation naïve
des instrument de son métier risque de le conduire à l'échec, voire même à une
défaite totale qui entraînera une débâcle psychologique et le broiera personnellement
; il sera alors d'autant plus écrasé qu'il n'aura pas compris la nature des réactions
qu'il a suscitées, et qu'il ne pourra s'expliquer les événements que par la
méchanceté des gens, par la cruauté du destin et par ses propres déficiences. Les
exigences de l'efficacité et de la santé mentale des praticiens (nous ne forçons pas
les mots) concourent pour les inviter à être attentifs aux circonstances politiques, et
à relier leur analyse des problèmes techniques à une étude historique de
l'institution, de ses enjeux, des relations entre les services. Seule cette analyse
permettra au statisticien d'entrer assez avant dans la connaissance de l'organisme qu'il
doit assister pour mettre en place des systèmes qui seront, peut-être, un peu
surprenants en regard des habitudes techniques et de la logique, mais qui n'en fourniront
pas moins des produits bien adaptés aux besoins réels de l'institution et aussi à ses
possibilités.
Adaptée aux structures de l'institution, l'information aura en
retour un effet sur ces structures. En effet, elle ouvre des possibilités d'action, elle
permet un repérage et une formulation plus rapides de certains problèmes, elle dévoile
ce qu'elle montre et elle voile ce qu'elle tait par ses silences. Ainsi, que les services
l'aient voulu ou non, sans même qu'ils s'en avisent, l'information remodèle les moyens
de leur action, les normes sur lesquelles ils assoient leurs décisions, les critères
selon lesquels ils se sentent jugés. D'une manière certes indirecte et quelque peu
oblique, le statisticien se trouve doté d'un pouvoir considérable à long terme sur
l'institution ; mais ce pouvoir de fait est difficile à mettre au service d'une action
réfléchie, car les voies par lesquelles l'information produite agit sur l'institution
sont obscures (9).
Lorsque l'institution est dotée d'une stratégie -
c'est-à-dire en fait lorsqu'elle est dirigée, quelle que soit d'ailleurs la forme de la
direction (individuelle et autoritaire, collégiale et dialoguante, collective et
décentralisée) -, la production d'information doit être prise en compte dans la
stratégie elle-même, en raison de ses conséquences à long terme. Le statisticien est,
par nature, un homme d'état-major ; et si ce fait n'est généralement pas reconnu, c'est
parce que le rôle de la production d'information n'est pas perçu correctement. Les
services statistiques ou comptables sont le plus souvent, dans les institutions, des
cellules à part, dont on utilise les produits sans se préoccuper de leur origine, sans
percevoir l'importance des choix opérés par les techniciens. Il est vrai que le
comportement habituel des statisticiens et des comptables renforce cette illusion.
Il y a des exceptions. Certaines entreprises savent produire et
utiliser l'information en l'adaptant de façon fine à leur stratégie (nous ne pensons
évidemment pas ici aux maquillages, mêmes subtils, auxquels certaines d'entre elles
procèdent en vue d'améliorer leur position vis-à-vis du fisc ou des actionnaires (10)).
Nous avons entendu, lors d'une réunion entre industriels, l'un d'entre eux déclarer à
un autre : " Si tu changes ta nomenclature de produits, tu changeras de politique
sans même t'en apercevoir. " C'était là une remarque pénétrante : les décisions
d'investissement, d'orientation commerciale, etc., reposent sur des résultats fournis par
la comptabilité analytique, et sont donc extrêmement sensibles à la façon dont
produits et clients sont définis et classés.
Revenons maintenant à une situation dont nous nous sommes
éloignés un moment : celle d'un statisticien dialoguant avec un demandeur pour mettre au
point un instrument. Les considérations qui précèdent permettent de comprendre pourquoi
le dialogue entre le statisticien et le demandeur doit être assidu, non seulement pour
l'explicitation des objectifs, mais aussi pour la mise au point des nomenclatures. En
effet la discussion sur les nomenclatures est au fond la meilleure situation possible pour
amener le " client " à expliciter dans le détail ses objectifs. Par ailleurs,
elle offre une excellente occasion pédagogique pour lui faire comprendre la nature et les
limites de la production d'information, et le préparer à l'utilisation des résultats.
Il faut donc lui expliquer que, malgré l'ennui qu'il peut éprouver lors de discussions
très techniques, il doit leur accorder une attention soutenue parce qu'elles risquent de
déterminer, à terme, ses choix stratégiques et ceux de ses services. Il faut qu'il
s'implique dans ces questions, car il y sera impliqué par la suite, bon gré mal gré.
Dès que le système statistique qu'il s'agit de mettre en place
est un peu complexe, se posent des problèmes de coordination et d'organisation. Des
services distincts vont coopérer dans la production d'information ; alors s'opposent deux
conceptions, et s'engage le débat sans fin du centralisateur et du décentralisateur,
l'affrontement entre un service central de coordination statistique et des services
techniques qui tous souhaiteraient produire l'information sans être bridés par les
consignes de la coordination. Il s'agit là de conflits purement institutionnels : nous
connaissons des individus qui, passés d'un service technique au service central (ou
inversement) ont modifié leurs convictions, pourtant fort énergiques, à l'instant même
de leur mutation. Cette question ne mériterait donc guère l'examen si, dans les faits,
elle n'occasionnait d'interminables disputes, et si elle ne posait, au fond, un problème
de méthode qu'il importe de voir clairement. Mais laissons la parole aux parties :
Le centralisateur :
" Les travaux statistiques exigent la mise en uvre
d'un savoir-faire particulier, qui ne s'acquiert que par l'expérience du métier, et qui
doit être fréquemment mis à jour en raison de l'évolution des techniques. Par
ailleurs, la définition de domaines d'enquêtes sans omission ni double emploi, la
construction de nomenclatures cohérentes et sans ambiguïté, l'utilisation, dans
diverses enquêtes, de concepts permettant de confronter leurs résultats, tout cela
suppose une discipline et une clarté de vues que l'on ne peut obtenir que dans un
organisme centralisé animé par une autorité unique. "
Le décentralisateur :
" Chaque travail statistique porte sur un domaine
spécifique. Il faut connaître l'industrie de la chaussure - à la fois dans sa
technologie et dans ses structures économiques - pour faire une bonne statistique de la
production de chaussures : sans cela, le statisticien risque de concevoir des
nomenclatures inadaptées à la réalité ; son manque de familiarité avec les
entreprises l'empêchera de voir, lors des vérifications, les erreurs les plus criantes.
Il faut donc qu'il soit le plus près possible de son domaine, et que la statistique soit
décentralisée. La coordination nécessaire doit être assurée par des organismes
légers, n'exécutant aucune tâche de production. "
Les lecteurs informaticiens auront reconnu dans ce dialogue des
phrases analogues (mutatis mutandis) à celles que l'on entend lorsque l'on parle de
centraliser ou de décentraliser l'analyse ou la programmation. Ces deux discours
s'affrontent dans un dialogue sans issue, car ils relèvent de logiques différentes. Ils
sont à la fois irréfutables et incompatibles. Faute de disposer d'une logique d'un
niveau supérieur - qui les dépasserait et permettrait donc de définir, entre les deux
nécessités, le " point d'équilibre " auquel il convient de s'arrêter -,
l'équilibre n'est obtenu en pratique que par un compromis qui résulte du rapport de
forces entre l'organisme central et les services, et qui mécontente tout le monde parce
qu'il viole les deux logiques à la fois.
Les considérations purement techniques sont insuffisantes pour
chercher les " points d'équilibre ". Seule une analyse des usages attendus de
l'information produite peut permettre d'apprécier les conséquences de tel ou tel type
d'erreur, et donc de répondre à la question. Le débat se place alors sur le plan
méthodologique ; et c'est parce que, le plus souvent, les statisticiens ne parviennent
pas à porter le débat sur ce plan-là que l'équilibre s'instaure presque toujours
aveuglément, par le jeu des rapports de forces.
- La moindre enquête coûtant plusieurs dizaines ou centaines de miniers de
francs, seules les institutions d'une certaine importance peuvent en faire réaliser. Il
faut aussi qu'elles aient la patience d'attendre les résultats qui, sauf dans le cas de
sondages très rapides, ne peuvent être disponibles qu'après quelques mois, voire
quelques années de travail.
- Dans la nomenclature douanière des produits, les pompes ordinaires, les pompes
à essence et les pompes à injection pour moteur Diesel sont classées ensemble dans
la rubrique 84-10. Bien sûr, cela s'explique : faite pour permettre l'application de
taxes différencies, la nomenclature douanière est rédigée de telle sorte que les
risques d'erreurs de classement soient réduits le plus possible : il est donc normal
d'utiliser un classement partiellement mnémotechnique (" toutes les pompes ensembles
").
- Le plan comptable comporte en fait deux nomenclatures, puisque chaque opération
est, selon les règles de la comptabilité en partie double, classée deux fois : au
crédit d'un poste et au débit d'un autre. Il comporte en outre des soldes permettant
d'apprécier les résultats économiques de l'entreprise.
- Sur ce point, voir par exemple G. Rosch, " La taxonomie nosologique ", in
Consommation n° 4, 1976, et M. Volle Analyse des données (Economica, 198 1),
chapitre X.
- Ceci peut être fait de façon tout à fait délibérée. Ainsi, le découpage en
1790 de la France en départements (niveau agrégé du " code géographique ") a
rompu avec l'ancien découpage des provinces et rendit impossible la continuité des
institutions provinciales.
- C'est le cas de l'industrie lainière. Depuis longtemps, les distinctions "
par matière " à l'intérieur de l'industrie textile ont perdu leur sens en raison
de la généralisation des mélanges et de l'évolution des techniques. La nomenclature
devrait plutôt être structurée " par stade d'élaboration " : peignage,
filature, tissage. Mais les structures en place, les traditions, se réfèrent encore aux
matières ; les institutions sont en retard sur l'évolution économique. Il est
essentiel, pour leur survie, que les nomenclatures contiennent des rubriques par matière,
même si la signification des informations que l'on peut rassembler sous ces rubriques est
douteuse. Elle mènent pour l'obtenir une guerre de retardement qui a été jusqu'à
présent efficace. La nomenclature correspond alors non plus aux nécessités de l'analyse
économique, mais à une sorte de complexe socioéconomique difficile à démêler. Nous
pressions un jour un responsable de l'industrie lainière de nous donner une définition
de sa branche, et il nous répondit : " L'industrie lainière, c'est un état
d'esprit. "
- Telle est en effet la contrainte technique essentielle à laquelle doit obéir
chaque niveau d'une nomenclature : il doit déterminer une " partition " de
l'ensemble étudié, c'est-à-dire une subdivision de cet ensemble en classes telles que
tout élément puisse être classé, et classé d'une seule façon. Nous ne résisterons
pas ici au plaisir de citer une " classification chinoise " imaginée par Borges
et qui combine, avec une sorte de génie logique, toutes les erreurs possibles en matière
de nomenclatures : " Les animaux se divisent en a) appartenant à l'empereur,
b) embaumés, c) apprivoisés, d) cochons de lait, e) sirènes, f) fabuleux, g) chiens en
liberté, h) inclus dans la présente classification, i) qui s'agitent comme des fous, j)
innombrables, k) dessinés avec un pinceau très fin en poil de chameau, l) et coetera, m)
qui viennent de casser la cruche, n) qui de loin semblent des mouches. "
- On trouvera une " étude de cas " très vivante dans "
B.I.D.U.L.E. " (0 1 -Informatique, n° 106, décembre 1976/janvier 1977).
- Elles sont explorées par le Centre de gestion scientifique de l'Ecole des mines,
aux travaux duquel nous devons beaucoup des idées contenues dans ce chapitre.
- Le livre d'Anthony Sampson, I. T. T. ou l'Etat souverain (Alain Moreau,
1973) en contient des exemples. On sait que M. Geneen, longtemps président d'I.T.T., est
comptable de formation et passe même pour un " génie de la comptabilité ".