La fausse vérité du comptage Occurence !

Publié le

La fausse vérité du comptage Occurence !

Avec le retour du mouvement social, c’est aussi le retour du célèbre cabinet Occurrence. Vous connaissez Occurrence ? C’est cette entreprise « spécialisée dans le comptage du public », chargée par un groupe de médias (l’AFP, France Inter, Europe 1, Franceinfo, RMC, BFMTV, France Culture, CNews, France 2, Mediapart, Le Figaro, Le Parisien, Libération, La Croix et la presse régionale et départementale), de compter le nombre de personnes dans les manifestations. Là où les journées de manifestation sont souvent l’occasion d’un affrontement entre le chiffre de la police et celui des syndicats, Occurrence prétend fournir LE chiffre, LA vérité vraie.

En février 2018, lors des manifestations contre la réforme de la SNCF, j’avais montré les liens entre les dirigeants de ce cabinet soi-disant indépendant et Emmanuel Macron. J’avais également souligné les problèmes que posaient l’utilisation d’une technologie développée à la base pour comptabiliser les entrées et les sorties dans des établissements publics, des centres commerciaux ou des aéroports. À la suite de cela, des articles s’étaient interrogés sur la fiabilité de la méthode employée. On aurait dès lors pu attendre des précisions sur la technologie employée, une plus grande prudence dans l’annonce du chiffre obtenu ou davantage de transparence par la publication des données brutes utilisées pour calculer l’estimation finale.

Mais rien de tout ça n’a eu lieu. Ainsi, depuis la manifestation du 5 décembre, le chiffre Occurrence est attendu toute la journée et sa publication tombe comme une sentence irrévocable sur le succès et l’échec d’une manifestation. La précision du calcul n’est donc pas seulement une question scientifique. Elle devient une question politique lorsqu’on sacralise ce résultat pour en faire le fondement d’analyses médiatiques rabâchées ad nauseam sur tous les plateaux de télévision.

C’est pourquoi les études sérieuses et scientifiques effectuées à propos de la méthode du cabinet Occurrence sont d’une grande importance. C’est le cas de celle effectuée par le chercheur Bruno Andreotti dont il a publié le résultat sur Twitter. Bien sûr, vous n’en entendrez pas parler dans les médias, en particulier dans ceux qui ont fait appel au cabinet Occurrence. Il ne faut pas trop en demander.

Bruno Andreotti est physicien. Il est professeur à l’Université Paris Diderot et chercheur au Laboratoire de Physique de l’École Normale Supérieure de Paris (LPENS). Il est notamment spécialiste des milieux granulaires, ce qui lui procure une expérience dans le problème du suivi des particules sur des images vidéos. Auteur de plusieurs ouvrages et plus de cent articles scientifiques, le sérieux de son travail peut difficilement être remis en cause.

Ayant été invité par un journaliste de France Inter, Bruno Andreotti a pu assister à une opération de comptage dans les bureaux du cabinet Occurrence. À l’issue de celle-ci, il a produit un rapport, publié le 19 décembre 2019, que vous pourrez retrouver ci-dessous. Il souligne trois problèmes majeurs.

La première catégorie de problèmes concerne ce que Bruno Andreotti qualifie de problèmes de mesure. Ainsi, toute la littérature scientifique démontre qu’il est extrêmement complexe de compter une foule dense à partir d’images. En effet, il est presque impossible de séparer automatiquement des individus sur une image quand le fond n’est pas un fond immobile, comme c’est le cas dans les manifestations. Or, les situations de foule dense sont très fréquentes dans les cortèges, et le sont d’autant plus quand l’affluence est importante, comme c’est le cas des dernières manifestations contre la réforme des retraites.

De plus, l’algorithme utilisé ne tient pas compte de deux obstacles importants. Le premier est celui des personnes qui remontent la manifestation. L’algorithme prétend comptabiliser le nombre de manifestants qui traverse une ligne virtuelle. Pour être exact, il doit compter positivement ceux qui passent dans un sens, et soustraire ceux qui passent dans l’autre. Dans le cas contraire, des individus statiques au niveau de la ligne pourraient être pris en compte plusieurs fois s’ils font un pas en avant puis un pas en arrière. Or la technique de nasse utilisée notamment à Paris contraint les manifestants à l’arrivée à rebrousser chemin pour pouvoir sortir de la manifestation. Dès lors, après avoir été comptabilisés une première fois, ils sont retirés du comptage au moment où ils souhaitent quitter les lieux. Selon un sondage effectué par le chercheur à propos des manifestations parisiennes de décembre, 55% des personnes interrogées disent avoir remonté la manifestation par les trottoirs pour pouvoir partir.

L’autre obstacle concerne les manifestants qui n’effectuent pas l’intégralité du parcours. Bien que ceux-ci aient participé à la manifestation, ils ne seront pas comptabilisés s’ils ne passent pas au niveau de la ligne de comptage. Or, le déroulement des dernières manifestations, leur durée, les arrêts réguliers et souvent longs (plusieurs heures parfois en raison de ce qui peut se passer plus haut sur le cortège) ou les craintes sur leur sécurité poussent de nombreux manifestants à ne pas effectuer l’intégralité du parcours ou à emprunter des itinéraires de délestage. Toujours par sondage, Bruno Andreotti comptabilise, pour la manifestation du 17 décembre, un manifestant sur deux qui affirme ne pas avoir effectué l’intégralité du parcours.

Le deuxième problème important pointé par le chercheur concerne la présentation des mesures. Lorsque les chiffres sont annoncés par les médias, ils sont présentés avec trois chiffres significatifs (exemple : 40 500 manifestants selon Occurrence à Paris le 5 décembre). Or dans le domaine scientifique, par convention, si l’on présente plusieurs chiffres significatifs, c’est que l’on prétend que chacun d’entre eux ait un sens. Par exemple, dans le cas du 5 décembre, cela revient à dire que la méthode est capable de distinguer 40 500 manifestants de 40 400 manifestants, ou de 40 600 manifestants. Sinon, il faut annoncer un chiffre de 40 000 ou de 41 000 manifestants. Annoncer un chiffre avec une telle précision revient donc à prétendre le calculer avec une marge d’erreur de 0,1% à 0,2% : c’est tout à fait mensonger au vu des sources d’erreur présentées ci-dessus.

Le troisième problème est un problème de transparence. Si une entreprise prétend utiliser des méthodes scientifiques, la règle veut qu’elle publie sa méthode de mesure et ses éventuelles corrections. C’est ainsi que des citoyens ou des scientifiques peuvent ensuite en vérifier l’exactitude en reproduisant une expérience similaire. En ce qui concerne Occurrence, aucune de ces règles de base n’est respectée : ni les données brutes, ni les correctifs que l’entreprise reconnait leur appliquer ne sont rendues publiques. Or, comme le dit Bruno Andreotti : « dans le domaine scientifique, le refus de rendre publiques des données brutes pour permettre la vérification indépendante de leur intégrité est considérée comme une fraude de niveau IV (la plus grave) dans le référentiel établi par Pierre Corvol ».

Cette étude démontre donc que le comptage effectué par le cabinet Occurrence n’a aucune valeur scientifique. C’est un problème pour un collectif de médias qui prétend vouloir améliorer l’information des citoyens. Mais lorsqu’on fait passer une méthode remplie de problèmes méthodologiques pour la vérité, lorsqu’on fait l’impasse sur les règles élémentaires de transparence et de présentation des résultats, on n’informe pas, on désinforme.

Bien sûr, les chiffres produits par le ministère de l’intérieur ou par les syndicats n’ont pas davantage de fiabilité. Mais ces chiffres ont au moins le mérite d’afficher « d’où ils parlent ». En donnant les deux, on fournit une pluralité de points de vue qui invite le citoyen à nuancer chacune des informations.

A l’inverse, en ne donnant que le chiffre Occurrence, on fait passer pour une vérité incontestable une source peu fiable, qui contient des biais politiquement orientés. Et c’est là que le bat blesse. Car, volontairement ou pas, les erreurs présentés ci-dessus vont toujours dans le sens d’un comptage inférieur à la réalité. Et c’est le pouvoir qui se frotte les mains !