RECHERCHE :
Bienvenue sur le site de Michel VOLLE
Powered by picosearch  


Vous êtes libre de copier, distribuer et/ou modifier les documents de ce site, à la seule condition de citer la source.
 GNU Free Documentation License.

Le métier de statisticien

CHAPITRE III

La méthode statistique

Retour à la table des matières

Ceux qui ne pratiquent pas la statistique, et en outre bon nombre de statisticiens, ne perçoivent pas l'importance de la méthode statistique. Ils conçoivent la définition des unités, des codes et des nomenclatures comme des tâches obscures, indispensables sans doute mais relativement secondaires. On s'imagine volontiers que la statistique fabrique spontanément et naturellement une image du réel que le raisonnement peut ensuite utiliser telle quelle ; en négligeant la phase méthodologique de la statistique, on néglige la relation entre les instruments de mesure et le cadre théorique et idéologique dans lequel ils ont été conçus ; on saute l'étape lors de laquelle la théorie s'incarne dans l'instrument.

Ce point de vue n'est pas le nôtre. Le fondement méthodologique de l'instrument nous paraît, au contraire, déterminant. Il est à tel point dépendant de la théorie que parfois, lorsque la théorie n'est pas explicite, c'est l'examen de l'instrument lui-même qui peut permettre de la reconstituer : nous verrons dans la partie historique que l'on peut trouver trace, dans les instruments statistiques, des options théoriques ou idéologiques de ceux qui les ont conçus.

Considérons la méthode statistique à son début : la prise en compte d'une " demande d'information ". Nous verrons que la demande sociale est particulièrement ambiguë et se manifeste selon des médiations complexes. Aussi nous contenterons-nous ici d'une situation volontairement simplifiée : celle où le statisticien est confronté à un " demandeur " unique, à une personne qui, à elle seule, représente une institution.

Supposons par exemple que quelqu'un demande à un statisticien de lui fournir des informations sur les établissements industriels d'une certaine zone géographique. Le plus souvent, la demande spontanée prend l'une ou l'autre de deux formes différentes selon le caractère du demandeur : soit il veut, dit-il " tout savoir " sur ces établissements ; soit il a déjà, au contraire, une idée précise sur ce qu'il désire savoir.

Celui qui veut " tout savoir " doit être immédiatement placé devant cette évidence : on pourrait employer toute la force de travail de la population dans des recherches statistiques sans parvenir pour autant à épuiser un sujet d'étude même réduit. Faut-il aller jusqu'à compter les cheveux des personnes employées dans ces établissements, à les classer par longueur ? Non, bien sûr. Donc, il ne s'agit pas de tout connaître. Il faut sélectionner. Mais que sélectionner ? On ne se posera pas les mêmes questions selon que l'on étudie ces établissements en vue de mettre au point un programme de formation professionnelle, ou un plan d'équipement routier, ou de rechercher des occasions d'investissement, ou de prospecter un marché, etc. Les questions doivent être adaptées aux objectifs visés, qui peuvent être extrêmement précis (on cherche par exemple à trouver un marché pour un produit donné, qui sera disponible pendant une période limitée et pour un prix donné). Cette adaptation ne peut se faire que si l'on connaît conjointement et le problème posé, et les possibilités de la production d'information. Or, avant la rencontre entre le demandeur et le statisticien, cette connaissance n'est pas " conjointe " : l'un connaît ses problèmes, l'autre connaît les possibilités de la statistique. La mise en relation de ces deux connaissances ne peut se faire qu'à travers un dialogue.

Par ailleurs, lorsque la demande est précise, rien ne permet d'espérer que sa formulation spontanée tiendra compte des possibilités de la statistique, que le demandeur connaît peu ou pas. Parfois il sera impossible de satisfaire cette demande spontanée ; parfois au contraire ce sera possible et même facile, mais qui sait si d'autres informations n'auraient pas, en fait, rendu au demandeur de meilleurs services ? Avant de communiquer des résultats ou de concevoir un instrument nouveau, le statisticien doit, au moins provisoirement, mettre entre parenthèses la demande spontanée et s'inquiéter de ce que le demandeur veut faire, de ses intentions d'action et de ses objectifs. Il doit l'interroger afin d'obtenir les indications indispensables pour une production pertinente d'information. Il arrive que le demandeur juge cette interrogation indiscrète, et qu'il refuse de répondre. Il faut alors lui expliquer qu'on ne pourra construire pour lui aucun instrument convenable sans savoir ce qu'il veut en faire et que, s'il entend utiliser des statistiques stockées dans les publications ou les banques de données, il ne pourra le faire de façon raisonnable qu'après avoir reçu un mode d'emploi adapté à ses besoins : telle statistique sera utilisable par celui qui n'a besoin que d'un ordre de grandeur, et sera trop imprécise pour celui qui veut étudier des évolutions. Le plus souvent le demandeur est rassuré par ces explications ; mais il arrive que le dialogue entre le statisticien et lui ne puisse pas débuter, à cause d'un véritable blocage.

Au fond, la situation du statisticien face au demandeur est semblable à celle de l'architecte face à son client : " Je veux que vous me construisiez une maison ", dit le client ; et, si cela se trouve, il a déjà son idée sur ce qu'il souhaite : idée en général conventionnelle et maladroite, car il ignore les possibilités et les limites de l'architecture. L'architecte consciencieux interrogera son client sur sa famille, ses goûts, son style de vie, ses moyens ; il " branchera " sur les besoins du client sa connaissance des techniques de la construction et des possibilités d'aménagement ; et le plan qui résultera de cette confrontation sera le produit conjoint des besoins et de la technique. Par contre un architecte peu consciencieux imposera d'autorité un plan omnibus, ou au contraire se laissera déterminer par la première et maladroite expression de la demande ; ainsi agissent aussi les statisticiens peu consciencieux.

La demande d'information peut assez souvent être satisfaite à l'aide de statistiques existantes, moyennant quelques précautions et rectifications. Mais il arrive aussi qu'elle nécessite une nouvelle production d'information, qui sera réalisée si le client décide de s'offrir le luxe de financer une enquête (1). C'est cette dernière hypothèse que nous allons maintenant suivre.

Tout au long de la phase méthodologique, le contact entre le statisticien et le client doit être assidu. Certes, le client peut avoir l'impression d'être importuné ; il peut penser que le statisticien n'a qu'à se débrouiller tout seul pour produire les informations qu'on lui demande. C'est malheureusement ainsi que cela se passe souvent. La définition des unités, la construction des nomenclatures sont considérées comme des étapes sans grand intérêt, subalternes et péniblement techniques, auxquelles on n'accorde pas une grande attention. Et pourtant, les choix réalisés à ce stade sont essentiels. Mais revenons, pour un instant, à la description de ces opérations.

Il n'y a pas de statistique sans ce que l'on appelle des " unités statistiques ", c'est-à-dire (en simplifiant un peu) des personnes ou des objets sur lesquels porte le questionnaire, et qu'il convient de définir. Les " unités " possibles a priori sont très variées : l'individu, le ménage, le logement, le compte bancaire, l'entreprise, l'établissement, la fraction d'entreprise, etc. Dans certaines enquêtes agricoles, l'" unité " est un point repéré sur une photographie aérienne et autour duquel on observe périodiquement les cultures. La définition de l'unité dépend, bien sûr, de ce que l'on recherche et aussi des possibilités présumées de la collecte.

La construction des nomenclatures pose davantage de problèmes. C'est, en fait, l'opération fondamentale de la méthode statistique. C'est la pratique - et non la théorie statistique, qui n'accorde que peu ou pas de place aux nomenclatures - qui nous a progressivement convaincu de leur importance, que nous n'étions nullement enclin à reconnaître d'abord. Nous en avons déduit un critère de jugement qui vaut ce qu'il vaut mais qui nous a souvent rendu service : un statisticien qui ne conçoit pas l'importance des nomenclatures sera peut-être bon technicien ou bon organisateur, ce ne sera pas vraiment un statisticien au sens plein du mot. Une question suffit pour savoir à qui l'on a affaire.

Mais qu'est-ce qu'une nomenclature ? Le mot est un peu rébarbatif, la chose l'est aussi. Quand, par exemple, on feuillette une nomenclature de produits, on y trouve une liste de produits, classée d'une façon qui peut paraître étrange, et émaillée de détails cocasses (2). Souvent la nomenclature comporte plusieurs " niveaux " correspondant à des degrés de détail différents : les produits de la liste la plus détaillée se regroupent pour constituer un poste du niveau supérieur, etc. Le schéma de telles nomenclatures est celui d'un " arbre " :

wpe2.jpg (7310 octets)

Il existe des nomenclatures de produits, d'activité, d'emploi, de qualification, de catégories sociales ; le code géographique est une nomenclature, ainsi que le " plan comptable " qui sert à classer les opérations comptables (3). La classification des êtres vivants se fait selon une nomenclature dont les niveaux principaux sont ceux des règnes, embranchements, classes, ordres, familles et espèces. Le formalisme des nomenclatures est donc largement répandu, avec sa structure en niveaux emboîtés les uns dans les autres. Le mot " nomenclature " a de nombreux synonymes : systématique, typologie, taxinomie, etc. Dans le langage des statisticiens, qui n'est pas encore parfaitement fixé, les mots tendent à prendre le sens suivant : la " classification " est l'opération par laquelle on construit une nomenclature (on définit les " classes "). La " nomenclature " est le produit concret, disponible sous la forme d'un texte, de l'opération de classification. Le " classement " est l'opération par laquelle on identifie la classe d'une nomenclature à laquelle appartient un individu : on classe les établissements selon leur activité économique principale, les individus selon leur métier, leur catégorie sociale, etc.

Le traitement de l'information (qu'il soit " manuel " ou automatique) nécessite des " codages " : au moment de l'exploitation des résultats, il est impossible de conserver la dénomination d'une classe " en clair " ; cette dénomination sera remplacée par un code numérique, d'ailleurs conventionnel, mais auquel on demandera d'avoir certaines propriétés commodes : par exemple, les premiers chiffres du code désigneront le classement de l'individu dans le niveau le plus agrégé de la nomenclature (que l'on nommera alors " premier niveau "), les chiffres suivants désignant le classement dans le deuxième niveau, etc., de sorte que le code indiquera à la fois la classe élémentaire et les classes des niveaux plus agrégés auxquelles elle appartient. Les nomenclatures fournissent le point de départ de ces codages et, pour un informaticien, les mots " code " et " nomenclature " sont synonymes. La gestion automatique des nomenclatures inclut des calculs d'agrégation et de ventilation, ainsi que la mise en œuvre des " tables de passage " à l'aide desquelles on peut, moyennant parfois une perte de précision, transcrire des résultats d'une nomenclature dans une autre.

Nous ne chercherons pas ici à aller plus avant dans la description du rôle pratique des nomenclatures dans la production d'information (4).. Nous en avons assez dit pour que l'on sente son importance. Les choix opérés lors de la constitution des nomenclatures vont concerner toutes les phases de la production d'information, et le produit final de cette production sera profondément marqué par ces choix. Les nomenclatures déterminent la grille conceptuelle à travers laquelle le réel est perçu : le niveau le plus fin est, comme le " grain " d'une photographie, un degré de détail au-delà duquel on ne peut plus rien discerner ; les niveaux agrégés sont des regroupements dont le raisonnement s'empare, mais sur lesquels il est risqué de raisonner sans se soucier de leur construction. Celle-ci doit être faite en usant de " critères " qui règlent l'agrégation des postes élémentaires d'une façon convenable en regard des utilisations : nous verrons au chapitre IX comment ces critères ont pu évoluer dans l'histoire.

Prenons un exemple. L'" industrie textile " peut être définie en regroupant un certain nombre de branches : les textiles artificiels et synthétiques (T.A.S.), la bonneterie, et les industries textiles traditionnelles de la laine, de la soierie, du coton, du lin, etc. A priori, d'autres définitions sont possibles : on pourrait classer la bonneterie avec la confection ou les T.A.S. avec la chimie.

D'après la première définition l'" industrie textile " associe donc des branches d'activité en forte croissance (les T.A.S. et la bonneterie) à d'autres branches en déclin (laine, coton, etc.). L'indice de la production des textiles, moyenne pondérée des indices de ces branches, est représenté par une courbe qui serpente au milieu de l'éventail des évolutions ; l'impression qui découle de cette courbe est que l'industrie textile, après avoir subit un choc en 1965 et avoir connu quelques oscillations, a retrouvé, dès 1968, son niveau de 1963 et a, de 1968 à 1973, progressé à un rythme modéré (courbe " Textile 1 ").

wpe4.jpg (24264 octets)

Si l'on avait choisi d'autres conventions, l'évolution de l'industrie textile aurait semblé différente. Par exemple, en classant hors du textile les T.A.S. et la bonneterie, on obtient une courbe " Textile 2 " bien différente de la première, car elle montre une baisse plus accentuée en 1965, et un rattrapage du niveau de 1963 en 1971 seulement, suivi d'une croissance nettement plus lente.

Tirons les leçons de cet exercice. L'économiste qui parle de l'industrie textile, s'il est pressé ou superficiel (cela arrive), regarde la courbe " Textile 1 " sans s'interroger sur ce qu'elle recouvre ; il la commente en présentant l'évolution des textiles comme une croissance lente ; cette lenteur fait certes contraste avec le reste de l'économie, mais la croissance, même lente, est réelle. Si au contraire les conventions excluent les T.A.S. et la bonneterie, la courbe donne l'image d'une industrie dont la production stagne, et on parlera des textiles comme d'une industrie dont le retard s'accentue. Dans les deux cas, pourtant, la réalité physique de l'industrie est la même : seule a changé l'image qu'en donne la nomenclature.

Cet exemple peut sembler peu probant. Un économiste qui travaille sur une industrie aussi importante que le textile ne se contente pas, dira-t-on, de regarder l'évolution d'ensemble de cette industrie : il examine aussi les évolutions de ses parties, et il sait en voir les différences. Sans doute ; mais il arrive pourtant parfois qu'un économiste commette l'erreur de prendre un concept construit pour la chose elle-même. Par exemple, lorsqu'il s'agit de procéder à des comparaisons internationales, on ne pense pas toujours à vérifier que les nomenclatures des divers pays comparés soient identiques, et l'on confronte alors des chiffres qui recouvrent des contenus différents. Le même risque se présente lorsqu'on étudie des évolutions sur très longue période, car alors les nomenclatures d'un même pays ont changé. Ensuite, l'erreur que l'on saura éviter lorsqu'il s'agit d'une branche importante comme le textile ne sera peut-être pas évitée sur des branches moins connues. Enfin, et surtout, le public qui reçoit l'information et qui n'a ni l'idée, ni le loisir de l'analyser dans le détail, concentre son attention sur quelques indicateurs essentiels ; ces indicateurs véhiculent une image de la réalité économique, certes grossière, mais à partir de laquelle se forgent des opinions, se prennent des décisions, etc. ; et, par-delà toutes les finesses possibles des études détaillées, l'image de l'évolution de l'industrie textile qui restera dans la mémoire de ce public informé et actif et qui, quelque jour, provoquera quelque décision, sera influencée fortement (même si elle n'est pas déterminée) par les indicateurs statistiques globaux, et donc par les choix opérés dans la construction des nomenclatures.

Pour bien comprendre ce que contient un poste agrégé, il ne suffit pas toujours de lire la liste des postes les plus fins : on pourrait croire par exemple que tous les pansements relèvent de l'industrie textile, et la liste fine comporte des postes qui le donnent à penser (ouate, etc.) ; or une partie importante de la production de pansements est classée dans l'industrie pharmaceutique, qui relève de la chimie.

Ce qui précède explique que les nomenclatures aient une telle importance politique. Les concepts qu'elles délimitent servent non seulement à produire de l'information, mais à découper des institutions, à instruire les dossiers qui préparent des décisions ; l'information qu'ils définissent sera parfois " réifiée " au point de passer pour la réalité elle-même. Un objet économique qui n'est pas reconnu dans les nomenclatures est " tué " pour la connaissance statistique et le raisonnement économique (5) ; un objet dont l'existence économique est douteuse, mais que les nomenclatures continuent à définir, se survit à lui-même dans le discours et dans la politique économiques (6). On comprend que les discussions et les consultations qui aident à préparer les nomenclatures soient parfois si tendues, si polémiques : des institutions se battent alors pour leur survie ou pour l'extension de leurs compétences. L'effet du cadre institutionnel sur les nomenclatures est tout aussi important que celui des exigences de la " connaissance économique pure " : on peut le déplorer, mais c'est un fait. Pourrait-il en être autrement, alors que les institutions déterminent la nature et les moyens de l'action politique et économique, et exigent d'être alimentées en information pour éclairer leur action ?

Mais allons un peu plus loin. La nature même de son travail oblige le statisticien à disposer de nomenclatures explicites fournissant un découpage correct (" sans omission ni double emploi ", selon la formule consacrée (7)) du domaine qu'il doit étudier. Supposons qu'un statisticien soit chargé de mettre en place un système d'information au sein d'une institution complexe, par exemple d'une administration. Bien souvent, cette institution sera elle-même divisée en services qui constituent autant de petites institutions distinctes, pourvues d'une politique propre, et se comportent comme des féodalités se disputant leurs territoires en menant une guerre de manœuvres et de coups de main. La situation du " front " se stabilise habituellement grâce à quelques compromis implicites et plus ou moins boiteux ; la répartition réelle des tâches diffère presque toujours de la répartition théorique qui figure dans l'organigramme. Le caractère implicite des compromis est, bien sûr, une des conditions essentielles de la stabilisation du " front " et de la tranquillité relative des services : une prise de conscience claire réveillerait des plaies d'amour propre que l'habitude a anesthésiées, et une explicitation publique provoquerait une intervention de la hiérarchie qui, au nom de la logique, modifierait les frontières des services et ouvrirait des occasions de conflits sur un terrain renouvelé.

Or le statisticien réclame justement une explicitation radicale des domaines de compétence et d'action pour définir son instrument, organiser ses circuits de collecte et de transmission, préparer ses nomenclatures. Il acquiert alors assez rapidement - et souvent à sa grande surprise, car sa formation principalement mathématique ne le prépare guère aux subtilités de la politique des services - la réputation d'un trouble-fête, voire d'un dangereux révolutionnaire venu exprès créer du désordre dans l'institution. Un malentendu s'installe entre le statisticien qui applique les règles techniques de son métier et utilise en toute bonne foi un langage qu'il croit être celui de la rationalité et du bon sens, et une institution qui a besoin, pour continuer de fonctionner, du maintien des équilibres délicats qu'elle a forgés au cours de son histoire. Le plus souvent, c'est l'institution qui l'emporte dans ce conflit. Une fois passé le premier moment de stupeur, elle entoure le statisticien d'une barrière protectrice faite d'un mélange très particulier d'inertie, d'approbation factice, de bêtise simulée. Le statisticien a alors l'impression de se battre contre des édredons ; l'information qu'il produit, bien qu'elle soit conforme aux demandes exprimées par les services, ne leur sert visiblement à rien. S'il manque de sensibilité historique et sociologique, il se percevra comme le représentant malheureux de la Raison dans un univers absurde. Et il tournera à vide, enfermé dans sa logique, jusqu'au jour (qui peut fort bien ne jamais arriver) où, par suite d'une évolution de l'institution qui lui restera mystérieuse, tel service ou telle catégorie de personnes se mettront à utiliser ses produits, à des fins imprévues et en tout cas différentes des objectifs initiaux.

Nous pourrions illustrer ce schéma par des anecdotes, des noms propres et des dates. Bien des praticiens y auront reconnu des situations qu'ils ont vécues ou côtoyées, qu'il s'agisse de praticiens de la statistique au sens usuel du terme ou d'informaticiens, de conseillers en gestion, etc., ayant eu à mettre en place dans le cadre de leurs travaux une organisation de production d'information et donc à se comporter, peu ou prou, en statisticiens (8).

S'il veut pouvoir exercer correctement son métier, c'est-à-dire produire une information significative et pratiquement utilisable, le statisticien doit travailler aussi en historien et en sociologue. La manipulation naïve des instrument de son métier risque de le conduire à l'échec, voire même à une défaite totale qui entraînera une débâcle psychologique et le broiera personnellement ; il sera alors d'autant plus écrasé qu'il n'aura pas compris la nature des réactions qu'il a suscitées, et qu'il ne pourra s'expliquer les événements que par la méchanceté des gens, par la cruauté du destin et par ses propres déficiences. Les exigences de l'efficacité et de la santé mentale des praticiens (nous ne forçons pas les mots) concourent pour les inviter à être attentifs aux circonstances politiques, et à relier leur analyse des problèmes techniques à une étude historique de l'institution, de ses enjeux, des relations entre les services. Seule cette analyse permettra au statisticien d'entrer assez avant dans la connaissance de l'organisme qu'il doit assister pour mettre en place des systèmes qui seront, peut-être, un peu surprenants en regard des habitudes techniques et de la logique, mais qui n'en fourniront pas moins des produits bien adaptés aux besoins réels de l'institution et aussi à ses possibilités.

Adaptée aux structures de l'institution, l'information aura en retour un effet sur ces structures. En effet, elle ouvre des possibilités d'action, elle permet un repérage et une formulation plus rapides de certains problèmes, elle dévoile ce qu'elle montre et elle voile ce qu'elle tait par ses silences. Ainsi, que les services l'aient voulu ou non, sans même qu'ils s'en avisent, l'information remodèle les moyens de leur action, les normes sur lesquelles ils assoient leurs décisions, les critères selon lesquels ils se sentent jugés. D'une manière certes indirecte et quelque peu oblique, le statisticien se trouve doté d'un pouvoir considérable à long terme sur l'institution ; mais ce pouvoir de fait est difficile à mettre au service d'une action réfléchie, car les voies par lesquelles l'information produite agit sur l'institution sont obscures (9).

Lorsque l'institution est dotée d'une stratégie - c'est-à-dire en fait lorsqu'elle est dirigée, quelle que soit d'ailleurs la forme de la direction (individuelle et autoritaire, collégiale et dialoguante, collective et décentralisée) -, la production d'information doit être prise en compte dans la stratégie elle-même, en raison de ses conséquences à long terme. Le statisticien est, par nature, un homme d'état-major ; et si ce fait n'est généralement pas reconnu, c'est parce que le rôle de la production d'information n'est pas perçu correctement. Les services statistiques ou comptables sont le plus souvent, dans les institutions, des cellules à part, dont on utilise les produits sans se préoccuper de leur origine, sans percevoir l'importance des choix opérés par les techniciens. Il est vrai que le comportement habituel des statisticiens et des comptables renforce cette illusion.

Il y a des exceptions. Certaines entreprises savent produire et utiliser l'information en l'adaptant de façon fine à leur stratégie (nous ne pensons évidemment pas ici aux maquillages, mêmes subtils, auxquels certaines d'entre elles procèdent en vue d'améliorer leur position vis-à-vis du fisc ou des actionnaires (10)). Nous avons entendu, lors d'une réunion entre industriels, l'un d'entre eux déclarer à un autre : " Si tu changes ta nomenclature de produits, tu changeras de politique sans même t'en apercevoir. " C'était là une remarque pénétrante : les décisions d'investissement, d'orientation commerciale, etc., reposent sur des résultats fournis par la comptabilité analytique, et sont donc extrêmement sensibles à la façon dont produits et clients sont définis et classés.

Revenons maintenant à une situation dont nous nous sommes éloignés un moment : celle d'un statisticien dialoguant avec un demandeur pour mettre au point un instrument. Les considérations qui précèdent permettent de comprendre pourquoi le dialogue entre le statisticien et le demandeur doit être assidu, non seulement pour l'explicitation des objectifs, mais aussi pour la mise au point des nomenclatures. En effet la discussion sur les nomenclatures est au fond la meilleure situation possible pour amener le " client " à expliciter dans le détail ses objectifs. Par ailleurs, elle offre une excellente occasion pédagogique pour lui faire comprendre la nature et les limites de la production d'information, et le préparer à l'utilisation des résultats. Il faut donc lui expliquer que, malgré l'ennui qu'il peut éprouver lors de discussions très techniques, il doit leur accorder une attention soutenue parce qu'elles risquent de déterminer, à terme, ses choix stratégiques et ceux de ses services. Il faut qu'il s'implique dans ces questions, car il y sera impliqué par la suite, bon gré mal gré.

Dès que le système statistique qu'il s'agit de mettre en place est un peu complexe, se posent des problèmes de coordination et d'organisation. Des services distincts vont coopérer dans la production d'information ; alors s'opposent deux conceptions, et s'engage le débat sans fin du centralisateur et du décentralisateur, l'affrontement entre un service central de coordination statistique et des services techniques qui tous souhaiteraient produire l'information sans être bridés par les consignes de la coordination. Il s'agit là de conflits purement institutionnels : nous connaissons des individus qui, passés d'un service technique au service central (ou inversement) ont modifié leurs convictions, pourtant fort énergiques, à l'instant même de leur mutation. Cette question ne mériterait donc guère l'examen si, dans les faits, elle n'occasionnait d'interminables disputes, et si elle ne posait, au fond, un problème de méthode qu'il importe de voir clairement. Mais laissons la parole aux parties :

Le centralisateur :

" Les travaux statistiques exigent la mise en œuvre d'un savoir-faire particulier, qui ne s'acquiert que par l'expérience du métier, et qui doit être fréquemment mis à jour en raison de l'évolution des techniques. Par ailleurs, la définition de domaines d'enquêtes sans omission ni double emploi, la construction de nomenclatures cohérentes et sans ambiguïté, l'utilisation, dans diverses enquêtes, de concepts permettant de confronter leurs résultats, tout cela suppose une discipline et une clarté de vues que l'on ne peut obtenir que dans un organisme centralisé animé par une autorité unique. "

Le décentralisateur :

" Chaque travail statistique porte sur un domaine spécifique. Il faut connaître l'industrie de la chaussure - à la fois dans sa technologie et dans ses structures économiques - pour faire une bonne statistique de la production de chaussures : sans cela, le statisticien risque de concevoir des nomenclatures inadaptées à la réalité ; son manque de familiarité avec les entreprises l'empêchera de voir, lors des vérifications, les erreurs les plus criantes. Il faut donc qu'il soit le plus près possible de son domaine, et que la statistique soit décentralisée. La coordination nécessaire doit être assurée par des organismes légers, n'exécutant aucune tâche de production. "

Les lecteurs informaticiens auront reconnu dans ce dialogue des phrases analogues (mutatis mutandis) à celles que l'on entend lorsque l'on parle de centraliser ou de décentraliser l'analyse ou la programmation. Ces deux discours s'affrontent dans un dialogue sans issue, car ils relèvent de logiques différentes. Ils sont à la fois irréfutables et incompatibles. Faute de disposer d'une logique d'un niveau supérieur - qui les dépasserait et permettrait donc de définir, entre les deux nécessités, le " point d'équilibre " auquel il convient de s'arrêter -, l'équilibre n'est obtenu en pratique que par un compromis qui résulte du rapport de forces entre l'organisme central et les services, et qui mécontente tout le monde parce qu'il viole les deux logiques à la fois.

Les considérations purement techniques sont insuffisantes pour chercher les " points d'équilibre ". Seule une analyse des usages attendus de l'information produite peut permettre d'apprécier les conséquences de tel ou tel type d'erreur, et donc de répondre à la question. Le débat se place alors sur le plan méthodologique ; et c'est parce que, le plus souvent, les statisticiens ne parviennent pas à porter le débat sur ce plan-là que l'équilibre s'instaure presque toujours aveuglément, par le jeu des rapports de forces.

  1. La moindre enquête coûtant plusieurs dizaines ou centaines de miniers de francs, seules les institutions d'une certaine importance peuvent en faire réaliser. Il faut aussi qu'elles aient la patience d'attendre les résultats qui, sauf dans le cas de sondages très rapides, ne peuvent être disponibles qu'après quelques mois, voire quelques années de travail.
  2. Dans la nomenclature douanière des produits, les pompes ordinaires, les pompes à essence et les pompes à injection pour moteur Diesel sont classées ensemble dans la rubrique 84-10. Bien sûr, cela s'explique : faite pour permettre l'application de taxes différencies, la nomenclature douanière est rédigée de telle sorte que les risques d'erreurs de classement soient réduits le plus possible : il est donc normal d'utiliser un classement partiellement mnémotechnique (" toutes les pompes ensembles ").
  3. Le plan comptable comporte en fait deux nomenclatures, puisque chaque opération est, selon les règles de la comptabilité en partie double, classée deux fois : au crédit d'un poste et au débit d'un autre. Il comporte en outre des soldes permettant d'apprécier les résultats économiques de l'entreprise.
  4. Sur ce point, voir par exemple G. Rosch, " La taxonomie nosologique ", in Consommation n° 4, 1976, et M. Volle Analyse des données (Economica, 198 1), chapitre X.
  5. Ceci peut être fait de façon tout à fait délibérée. Ainsi, le découpage en 1790 de la France en départements (niveau agrégé du " code géographique ") a rompu avec l'ancien découpage des provinces et rendit impossible la continuité des institutions provinciales.
  6. C'est le cas de l'industrie lainière. Depuis longtemps, les distinctions " par matière " à l'intérieur de l'industrie textile ont perdu leur sens en raison de la généralisation des mélanges et de l'évolution des techniques. La nomenclature devrait plutôt être structurée " par stade d'élaboration " : peignage, filature, tissage. Mais les structures en place, les traditions, se réfèrent encore aux matières ; les institutions sont en retard sur l'évolution économique. Il est essentiel, pour leur survie, que les nomenclatures contiennent des rubriques par matière, même si la signification des informations que l'on peut rassembler sous ces rubriques est douteuse. Elle mènent pour l'obtenir une guerre de retardement qui a été jusqu'à présent efficace. La nomenclature correspond alors non plus aux nécessités de l'analyse économique, mais à une sorte de complexe socioéconomique difficile à démêler. Nous pressions un jour un responsable de l'industrie lainière de nous donner une définition de sa branche, et il nous répondit : " L'industrie lainière, c'est un état d'esprit. "
  7. Telle est en effet la contrainte technique essentielle à laquelle doit obéir chaque niveau d'une nomenclature : il doit déterminer une " partition " de l'ensemble étudié, c'est-à-dire une subdivision de cet ensemble en classes telles que tout élément puisse être classé, et classé d'une seule façon. Nous ne résisterons pas ici au plaisir de citer une " classification chinoise " imaginée par Borges et qui combine, avec une sorte de génie logique, toutes les erreurs possibles en matière de nomenclatures : " Les animaux se divisent en a) appartenant à l'empereur, b) embaumés, c) apprivoisés, d) cochons de lait, e) sirènes, f) fabuleux, g) chiens en liberté, h) inclus dans la présente classification, i) qui s'agitent comme des fous, j) innombrables, k) dessinés avec un pinceau très fin en poil de chameau, l) et coetera, m) qui viennent de casser la cruche, n) qui de loin semblent des mouches. "
  8. On trouvera une " étude de cas " très vivante dans " B.I.D.U.L.E. " (0 1 -Informatique, n° 106, décembre 1976/janvier 1977).
  9. Elles sont explorées par le Centre de gestion scientifique de l'Ecole des mines, aux travaux duquel nous devons beaucoup des idées contenues dans ce chapitre.
  10. Le livre d'Anthony Sampson, I. T. T. ou l'Etat souverain (Alain Moreau, 1973) en contient des exemples. On sait que M. Geneen, longtemps président d'I.T.T., est comptable de formation et passe même pour un " génie de la comptabilité ".