SCIENCE EN FRANCE TRANS-SCIENCE A.F.I. BIBLIOGRAPHIE CONTACT LE MYTHE DE L'INFLATION DÉMOGRAPHIQUE Réflexions à propos des chiffres et des statistiques Par Marcel V. LOCQUIN Introduction
L'essentiel de l'aventure humaine créatrice, tant intellectuelle, que scientifique, artistique ou littéraire, en deux mots culturelle et sociale, ne doit plus se laisser engluer par une démarche statistique initiale, le plus souvent dérivée d'un secteur trop étroit d'application des mathématiques fondamentales.
Il n'est donc pas inutile d'examiner sérieusement la fiabilité des statistiques démographiques ainsi que de leurs interprétations, publiées chaque année dans les différents pays du monde et le plus souvent largement commentées par les prévisionnistes de la presse écrite. Cela est d'autant plus nécessaire que ces publications et ces commentaires sont de nature à influencer le public ainsi que nos décideurs, tant industriels que politiques, qui n'ont pas toujours les éléments critiques nécessaires pour apprécier la fiabilité de ces statistiques et de ces commentaires.
Nécessités statistiques
On sait depuis longtemps que les statistiques sont, dans toutes les Sciences, l'outil essentiel et nécessaire pour accéder au premier degré de la connaissance dans un domaine encore inexploré ou
mal connu.En Sciences Humaines et Sociales, les plus jeunes dans le développement des Sciences, l'outil statistique est primordial et essentiel, à condition qu'on le manie correctement.
Liaison observateur - objets observés
Le statisticien ne doit pas oublier que les faits observés ne sont pas indépendants de lui. Il prétend à l'objectivité alors que le filtre de ses sens, de sa pensée et de son langage sont subjectifs par
nature. L'émergence des faits d'observation est précédée par une activité théorique spéculative, nécessaire pour pouvoir définir au préalable les faits que l'on cherche, afin de les extraire ensuite de
leur environnement où ils sont fondus. On a pu condenser ce processus très général en une phrase un peu trop lapidaire: "En Science, on ne trouve que ce que l'on cherche".
Les pièges des statistiques
De nombreux chausse-trappes jalonnent l'emploi des outils statistiques, particulièrement dans leurs applications sociétales. La démographie et le principal facteur influant sur celle-ci, la santé, y
sont les premières concernées.Il ne faut pas oublier que si l'analyse statistique porte sur une tranche de notre société, le nombre des facteurs interagissant à prendre en compte dépasse vite la centaine. De tous ces facteurs,
il en est fort peu qui soient indépendants les uns des autres. Le danger vient alors du fait que pour pouvoir travailler, le statisticien applique une tactique réductrice, sans bien en mesurer les
inconvénients. Il élimine d'emblée certains paramètres, mais les éliminer n'est possible, sans introduire d'erreurs, que si on sait qu'ils sont indépendants de ceux que l'on garde. Or dans la pratique sociale, le nombre de paramètres liés domine largement le nombre des paramètres que l'on peut considérer comme indépendants. Imaginons que l'on veuille analyser statistiquement le comportement nutritionnel d'un groupe social dans lequel on aurait éliminé les végétariens, sous le fallacieux prétexte qu'ils sont en petit nombre, le résultat obtenu par l'analyse comparée de la consommation des sources protéiques sera sans valeur, on le comprend aisément.C'est pourtant ce que l'on fait en analyse statistique démographique lorsque l'on verse dans deux catégories distinctes les immigrés et les natifs d'une même région, ou d'un même pays,
comme si aucun lien social n'existait entre eux et autour d'eux. Certains le font souvent pour pouvoir justifier un a priori de plus grande violence dans l'un des deux groupes. Si au départ, on découpe différemment les deux groupes, soit par rapport à leur habitat, soit en fonction de leur niveau de vie par exemple, on obtiendra deux autres répartitions entre les violents et les non violents, beaucoup moins liées à la qualité de natif ou d'immigré, mais plutôt relative au niveau moyen de vie de chacun des groupes, ou aux quartiers habités par chacun, ces deniers eux-même corrélés au niveau de vie.* Toute statistique doit également prendre en compte les imprécisions dans les mesures des données recueillies. On dit par exemple que le chiffre donné est précis à 3% près. Ce 3% exprime une incertitude sur la fiabilité des mesures, incertitude qui peut être intrinsèque, c'est à dire liée à la précision ou l'imprécision de l'appareil utilisé pour les mesures, ou bien extrinsèque, c'est à dire
inhérente à la variabilité des objets même mesurés.L'outil de mesure de base du statisticien démographe est le comptage des individus qui se fait par exemple par tranches d'âges et par régions géopolitiques.
Il est évident qu'aucun pays du monde ne peut s'offrir le luxe d'un recensement démographique annuel, même s'il ne prend pas en compte d'autres facteurs sociaux comme le revenu, l'état de santé,
le logement ou la nationalité par exemple. Dans les pays développés les recensements ont lieu environ tous les dix ans, ils sont donc espacés d'une demi génération.On est alors en droit de se poser la question de savoir comment sont établies les statistiques annuelles des Etats et quelle confiance on peut leur accorder, la publication des résultats statistiques étant rarement accompagnée d'une description de la méthode employée pour les obtenir.
Ainsi dans les États qui ont des registres d'état civil fiables depuis plus d'une génération, on prend comme base les chiffres donnés par le dernier recensement et, chaque année, on ajoute le nombre
des naissances et on retranche celui des décès.Parfois on prend aussi en compte les immigrations déclarées, mais plus rarement les émigrations qui sont plus difficiles à comptabiliser.
On ne peut distinguer clairement les immigrants définitifs des immigrants temporaires mais de longue durée, comme par exemple ceux qui séjournent pendant plusiseurs mois, voire plusieurs années,
pour effectuer leurs études, une formation professionnelle ou un stage industriel. Il y a aussi beaucoup de migrants touristes ou saisonniers dont on peut connaître la date d'entrée s'ils sont soumis aux formalités des visas, mais plus difficilement la date de sortie d'un territoire. Seuls des pays industrialisés, bien équipés administrativement et socialement peuvent le faire, et encore avec
une marge d'incertitudes difficile à chiffrer.Une autre difficulté survient lors des interprétations. Prenons l'exemple de la France métropolitaine qui, en 1996, selon l'Organisation Mondiale du Tourisme, a reçu 61,5 millions de touristes, soit 3% de plus que sa propre population. Cherchez combien de statisticiens, dans leurs corrélations
démographico-économique par exemple, ont tenu compte de ce facteur ? Vous serez étonnés du résultat.Remarquons en passant que la France est le pays au Monde qui reçoit le plus de touristes, avant les États Unis qui viennent en second en n'en reçoivant que 46,8 millions. Ceci permet de dire
que les français sont quatre fois plus accuellants les étrangers que les américains, puisque le rapport des populations entre ces deux pays est de 1 à 3.On peut aussi aisément imaginer toutes les erreurs qui peuvent involontairement et inévitablement être introduites dans les recensements effectués dans des pays étendus, à population clairsemée vivant dans des régions montagneuses comme dans l'Himalaya ou les Andes, ou inversement à population dense vivant dans des pays colossaux comme l'Inde ou la Chine, qui, à eux deux, totalisent plus du tiers de la population de la planète.
Il ne faut pas oublier également que la tentation est grande pour certains de donner, faute de personnel qualifié, des estimations chiffrées sans fondements réalistes ou de donner volontairement un coup de pouce aux chiffres pour se trouver dans une catégorie démographique généralement plus élevée, ouvrant droit à de nombreux avantages en matière d'investissements ou d'aides internationales en matière de santé ou d'alimentation par exemple.
Dans certains cas on pense que la fraude peut être estimée à quelque 20%.On a vu récemment ce phénomène se produire dans une ville de la région parisienne en France, dont certains responsables municipaux ont été suspectés de fraude sur l'effectif de la population de leur commune, pour que ce chiffre ne descende pas au dessous de la barre fatidique des 70.000 habitants, car en dessous de cet effectif ils perdaient certains avantages administratifs et financiers.
* Autre remarque, un changement du point de départ choisi pour une comparaison statistique au fil des ans, peut donner une toute autre image d'une évolution et donner lieu à des interprétations erronées. H. Le Bras, dans son livre extrêmement bien documenté, "Les limites de la planète", au chapitre "Mensonge des chiffres, vérité des statistiques", donne des exemples très instructifs tirés des statistiques américaines du "Worldwatch Institute". Ainsi en choisissant comme base de comparaison aux États-Unis, la production en céréales d'une année sèche suivie d'une série d'années pluvieuses, ou une année pluvieuse suivie d'une série d'années également pluvieuses, on n'aura évidemment pas le même profil évolutif. Si le statisticien ne prend pas la peine de préciser ce facteur météorologique, le lecteur peut être largement induit en erreur quant aux interprétations qu'il peut être amené à faire car la production agricole de ce pays est très dépendante, d'une année sur l'autre, des aléas climatiques.
* Des réserves particulières sont à faire lorsque l'on prend comme base pour une nouvelle statistique les données résultant de statistiques antérieurement faites par d'autres. Cela conduit souvent à des aberrations, car on amplifie ainsi les erreurs des précédentes.
N'oublions pas qu'une erreur de 3,5 %, qui, dans certains cas, peut être considérée comme étant sans importance sur une année, si elle se répète avec le même taux plusieurs années de suite, peut
engendrer, suivant la formule des intérêts composés, une erreur de 100% au bout de 20 ans, autrement dit à terme d'une génération.* Il peut y avoir également un autre pénomène pervers, lié à la "qualification" des données sujettes à statistiques qui peuvent être ambiguës et fausser les résultats ainsi que leurs commentaires. En
effet certaines confusions sémantiques peuvent être fréquentes.Par exemple, il y a souvent confusion sémantique entre séropositifs et sidéens déclarés, les seconds ne représentant que quelques pour cents des premiers. Pour connaître ce pourcentage, toute statistique précise est encore prématurée, le temps s'écoulant entre la contamination ayant amené la séropositivité et la maladie déclarée, constatée par l'effondrement des défenses immunitaires, peut
excéder dix ans. On ne dispose pas d'éléments statistiques fiables assez anciens pour ce faire, car les débuts de l'épidémie de sida, notamment en Europe, ne datent que d'une décennie.* Autre constat pervers, celui des effets impressifs psychologiques de l'argument d'autorité, qui induisent certains à ne retenir comme données fiables que celles publiées sous la signature d'un grand nom. Cela est facilement source de déviances. Cette situation est fréquente, puisque le lecteur a rarement la possibilité, ou le temps, de remonter aux sources pour vérifier lui-même la pertinence de l'information publiée.
* D'autre part, on ne peut d'une manière générale comparer que des éléments comparables avec la même unité de mesure. Dans une analyse statistique périodique de la croissance, certains font
référence par exemple à des différences chronologiques de P.I.B. ou Produit Intérieur Brut, exprimé en francs, en marks ou en dollars. Or les taux de conversion entre ces monnaies de référence
fluctuent et, d'une manière générale, il y a pour chacune une érosion monétaire permanente. La non référence à un étalon monétaire à taux constant de pouvoir d'achat, fausse plus d'une
statistique économique et démographique. Lorsque nous lisons dans notre quotidien que la croissance statistique moyenne du P.I.B. de l'année courante a atteint 1,3%, cela peut vouloir dire, non pas une
croissance, mais une stagnation si, dans le même temps, l'érosion monétaire a atteint le même taux.* Sur le plan international, un changement de référentiel peut perturber complètement l'interprétation d'une statistique. Si on compare par exemple, le niveau de vie atteint par les populations
dans des pays de développements économiques très différents, on obtient des résultats fort discordants suivant les critères référentiels choisis pour faire l'estimation. Pour certaines populations vivant par exemple dans des pays tropicaux, la possession de vêtements chauds et l'accès à un chauffage l'hiver n'a aucun intérêt, alors que cela est d'une grande importance pour les pays froids. Comparer leurs niveaux de vie, si on ne peut pas leur appliquer les mêmes critères référentiels, n'a aucun sens.* Pour un mathématicien, le lissage d'une courbe qui en efface les points singuliers, peut avoir des conséquences fâcheuses.
Pour obtenir des courbes esthétiquement présentables dans une publication, certains auteurs non mathématiciens ont tendance à en gommer les singularités qui cependant peuvent être essentielles
pour une bonne interprétation de l'évolution d'un phénomène populationnel.* On évoque souvent la notion de moyenne statistique, en oubliant que cette moyenne n'est pas toujours considérée comme une norme par la société. Prenons l'exemple de la nubilité des individus de sexe féminin, c'est à dire ayant atteint l'âge où, biologiquement, la procréation est possible pour la femme. Elle est en moyenne de 13 ans dans certains pays du Nord. Ces mêmes pays, ont cependant
fixé la moyenne d'âge juridique socialement admise pour se marier afin de procréer à 18 ans. L'écart est considérable puisqu'il équivaut à plus du tiers de la vie des femmes de cet âge.La moyenne ne doit jamais être confondue avec la norme, dans ce cas comme dans bine d'autres.
Statistiques et prévisions
Dans beaucoup de cas, les statistiques sont des actes descriptifs synchroniques, autrement dit ils sont la photographie d'un instant social donné. On a tendance à les interpréter ensuite en une
projection futurible, le plus souvent par comparaisons analogiques, soit avec le passé, soit avec des situations voisines. Seul le futur réel viendra confirmer ou le plus souvent infirmer ces projections.* Lorsque vous consultez par exemple l'annuaire statistique de l'UNESCO 1995, paru en 1996, vous constatez qu'il ne mentionne de statistiques démographiques que jusqu'en 1993. Or beaucoup de
commentateurs font en 1996 des projections pour 1997 à partir de ces données déja de trois ans plus anciennes, ce qui est leur droit, mais on peut légitimement se poser des questions sur leur
pertinence puisque la plupart ne tiennent pas compte actuellement de la baisse générale constatée du taux de remplacement des générations. Circonstance aggravante, ces prévisions sont reprises
parfois plusieurs années plus tard, par d'autres organisations internationales, pour en tirer de nouvelles conséquences prévisonnelles dans le secteur économique par exemple. Il peut
s'ensuivre des décisions gouvernementales dont les conséquences ne répondront pas à la véritable situation démo-économique.
En conclusion, lorsque vous consultez des statistiques et en particulier les statistqiues démographiques, l'extrême prudence doit être la règle. Soyez aussi circonspect qu'Hervé Le Bras et remémorez vous l'éventail des chausse-trappes que je viens d'évoquer.
Statistiques épidémiologiques
Les statistiques épidémiologiques sont à notre avis les plus fiables pour étudier l'évolution démographique du monde, ainsi que pour dresser un panorama de son état de santé qui conditionne au moins en grande partie son futur.
S'il nous paraît très difficile, voire impossible, de savoir à mieux que quelque 20% près combien nous sommes d'êtres humains actuellement vivants sur notre planète, l'emploi des statistiques
épidémiologiques permet d'avoir une bonne évaluation de la situation ainsi que de ses tendances évolutives.En comptabilisant à une époque donnée et dans un pays donné, le nombre d'enfants vivants qu'ont généré l'ensemble de la gent féminine, divisé par son effectif, on obtient un chiffre qui est
qualifié de "taux de remplacement des générations".Chaque couple devrait en principe avoir deux enfants, pour que la population ne diminue pas à la génération suivante. Mais en fait, comme il nait plus de garçons que de filles et que les garçons
meurent plus souvent en bas âge que les filles donc sans atteindre l'âge de la reproduction, et que dans l'ensemble les femmes meurent plus tard que les hommes, on admet que le taux de
remplacement des générations doive être supérieur à 2,1 pour que la population augmente.Pour obtenir une mesure de ce taux il y a plusieurs méthode. Par exemple, au cours de campagnes internationales ou nationales de vaccination obligatoires, chaque médecin demande à chaque femme
son âge et le nombre de ses enfants. Ces statistiques cumulées à l'échelle du pays, puis de la région, voire du continent, donnent une photographie de la situation populationnelle. Leur suivi au fil des
temps permet d'en vérifier et la pertinence et l'évolution, ce qui permet d'apprécier clairement une situation démographique sans introduire les erreurs statistiques évoquées plus haut.On peut même avoir une idée de sa tendance évolutive, puisqu'un taux de remplacement des générations annuel supérieur à 2,1 indique une tendance démographique croissante, alors qu'en dessous de ce chiffre c'est d'une tendance à la diminution démographique dont il faut parler.
En appliquant à rebours la formule des intérêts composés on aboutit pour une population de départ de 100 au tableau de diminution démographique suivant:
-1% l'an -3% l'an -5% l'an
après 1 an 99 97 95
après 2 ans 98,01 94,18 90,25
après 3 ans 97,03 93,29 85,5
après 4 ans 96,05 90,49 81,23
après 5 ans 95,09 87,77 77,17
après 6 ans 914,14 85,14 73,3
après 7 ans 93,2 82,6 69,63
après 8 ans 92,3 80,12 66,04
après 9 ans 91,4 77,7 62,73
après 10 ans 90,5 75,4 59,59
soit en 10 ans -9,5% -24,6% -40,41%
On est en droit maintenant de se préoccuper des conséquences de toute baisse constatée de la population suivant un tel barême.
Paris, Mai 1997