Analyse de milliards de données cellulaires : la relâche québécoise a catalysé l’épidémie

Radio-Canada | Nouvelles

Par Naël Shiab

7 mai 2020

Alors que les autorités songent à utiliser la localisation d’appareils cellulaires pour traquer le virus, Radio-Canada a eu accès aux données de 7,9 millions de téléphones au pays. Notre analyse montre à quel point les Québécois ont multiplié leurs déplacements au pire moment, en pleine semaine de relâche, lorsque le gouvernement sous-estimait la présence de la COVID-19 sur le territoire.

À la mi-mars, le premier ministre François Legault annonce que le Québec « se met sur pause ». Nombre de compagnies se retrouvent alors désoeuvrées. Drako Media, spécialisée en marketing mobile, fait partie du nombre. « On a eu une réduction très forte de nos activités, indique Laurent Elkaim, le cofondateur. Alors on s’est demandé si on pouvait partager nos données pour mieux comprendre ce qui se passe. » Les données en question : 6,7 milliards d’emplacements partagés par 7,9 millions de cellulaires au Canada.

Les données qu’ils nous ont fournies gratuitement ont d’abord été anonymisées et agrégées avant de nous être partagées, par respect pour la vie privée des individus. Les positions exactes et les identifiants des appareils ne nous ont jamais été partagés. Nous avons modélisé les déplacements entre provinces, entre régions du Québec et entre arrondissements à Montréal. Nous avons mené notre analyse en toute indépendance. Notre méthodologie se trouve à la fin de ce reportage.

Du 2 au 23 février, des semaines avant le début de la crise au pays, 133 000 Canadiens se déplacent d’une province à une autre chaque jour. Les échanges sont particulièrement importants entre le Québec et l’Ontario, les deux provinces les plus populeuses du pays. Elles seront aussi, bientôt, les plus touchées par le virus.

Fin février, les mouvements augmentent jusqu’à atteindre un pic le 6 mars, en pleine semaine de relâche québécoise. À cette date, le virus a déjà traversé la moitié de la planète, de la Chine au Canada. Il y a officiellement 49 cas confirmés de COVID-19 au pays. Dans les faits, la situation est sous-estimée : les personnes infectées sont déjà 8 fois plus nombreuses.

Des rapports épidémiologiques compilés des semaines plus tard par Statistique Canada montrent que 395 Canadiens sont déjà malades à ce moment-là. De ce nombre, 142 sont déjà infectés par transmission communautaire, sans être allés à l’étranger ou en contact avec des voyageurs. Autrement dit, le virus se transmet déjà de personne à personne au pays.

« Ces données montrent l’importance que la semaine de relâche du Québec a eue sur l’augmentation des cas. »

– Benoît Barbeau, professeur en sciences biologiques à l’UQAM et expert en virologie

« Les gens n’étaient pas nécessairement conscients qu’ils étaient porteurs, précise-t-il. Alors quand ils se sont déplacés au travers des provinces, des régions, ils sont entrés en contact avec d’autres personnes et ont été susceptibles de transmettre le virus. »

Aux déplacements intérieurs, il faut ajouter les 165 000 voyageurs qui reviennent chaque jour de l’étranger en moyenne. Les rapports épidémiologiques disponibles montrent que des centaines amèneront avec eux le virus dans leurs bagages. Les frontières internationales ne seront fermées que deux semaines plus tard.

Est-ce que les frontières provinciales auraient dû également être fermées? « Je crois que les provinces les plus touchées se devaient de limiter la propagation et d’empêcher que le virus ne se transmette dans les provinces avoisinantes », ajoute Benoît Barbeau.

À partir du 13 mars, des mesures de confinement commencent à être annoncées et les déplacements se réduisent de façon draconienne. Le nombre de malades, pour sa part, continuera d’augmenter.

Lors des trois premières semaines de février, 343 000 personnes se déplacent d’une région du Québec à une autre chaque jour. La semaine de relâche pousse de nombreux Québécois à se promener : le 6 mars, les mouvements interrégionaux doublent. La vaste majorité des déplacements sont des entrées ou des sorties de la grande région de Montréal, bientôt épicentre de l’épidémie dans la province.

À pareille date, le Québec n’a mené que 306 tests pour détecter le coronavirus, presque exclusivement sur des voyageurs. Or, 23 000 reviennent de l’étranger chaque jour dans la province et le virus a déjà été détecté dans 94 pays de par le monde. De plus, la transmission communautaire se produisait déjà en Estrie, dès fin février, comme l’a documenté La Presse le 4 avril.

« On a eu une hausse massive des cas deux semaines après la relâche. Deux semaines, c’est à peu près le temps que ça prend pour qu’une personne développe des symptômes. »

– Nimâ Machouf, épidémiologiste et chargée de cours à l’École de santé publique de l’Université de Montréal

Aujourd’hui, un cas confirmé sur deux au Québec est un Montréalais, bien que ces derniers ne représentent qu’un Québécois sur cinq. « Quand j’ai vu la concentration des cas, début avril, je me suis dit : “il faut fermer Montréal, il faut préserver les régions” », soutient Nimâ Machouf. Les autorités sanitaires, qui détiennent l’ensemble du portrait statistique, auraient dû réaliser ça avant, selon elle. « C’est une île, ça aurait été facile et les gens auraient compris. »

Le gouvernement a plutôt préféré restreindre l’accès à certaines régions considérées comme vulnérables à cause de leurs populations plus âgées. Leur réouverture graduelle a d’ailleurs commencé le 4 mai.

À Montréal, le pic de déplacements entre arrondissements et villes liées est observé le 12 mars, soit la veille de l’annonce des premières mesures de confinement par le premier ministre Legault. Les Montréalais sont conscients du danger : dès les jours qui suivent, ils réduisent leurs déplacements à l’intérieur de la ville.

À ce moment-là, la métropole n’a que 3 cas confirmés. Mais chaque jour, plus de 600 avions y décollent ou y atterrissent. La moitié des vols sont intérieurs, l’autre moitié sont des vols internationaux. « Ça, c’est notre grosse faille, déplore Nimâ Machouf. Les aéroports, on ne les a pas fermés à temps. C’est de là que le virus arrive. Il aurait fallu aviser les voyageurs d’aller en quarantaine. » C’est finalement à partir du 16 mars que le trafic aérien tombe presque à zéro.

À partir du 29 mars, les autorités divulguent le nombre de cas par arrondissements. On constate alors l’étendue du problème : la contamination de la ville est généralisée. Au moment de publier cet article, les commerces de la province – jusqu’alors fermés – ont obtenu le droit de rouvrir leurs portes partout, sauf à Montréal.

Et votre vie privée?

« Votre analyse montre à quel point ces données peuvent être très informatives sur les lacunes, les faiblesses de nos mesures », indique Benoît Barbeau. C’est d’autant plus important, souligne le professeur, qu’on s’attend à de nouvelles vagues de cas infectés dans un avenir rapproché.

Radio-Canada et Drako Media ont pris le soin d’anonymiser et d’agréger les données pour rendre impossible l’identification d’un individu. Mais une douzaine d’institutions et de compagnies se sont déjà proposées au Québec et au Canada pour créer des applications qui permettraient de retracer les contacts entre une personne infectée et le reste de la population.

Pour l’expert, il faudrait que le code source de ces applications soit partagé pour être vérifié. Il faudra aussi démontrer que la solution fonctionne vraiment. Par ailleurs, il juge que de collecter les données de localisation pour ce faire serait une erreur, car suivre un individu à la trace est extrêmement intrusif et de toute façon, ces données n’ont qu’une précision de 5 à 15 mètres, au-dessus du sol.

« Le Bluetooth est une technologie beaucoup moins risquée », explique Sébastien Gambs. Ce signal permet, par exemple, de connecter des écouteurs sans fil à un téléphone. Il fonctionne à courte distance. Il pourrait servir à détecter les autres téléphones à proximité et vérifier si ceux-ci appartiennent à une personne qui se serait déclarée contagieuse. Pour respecter la vie privée des individus, un tel système devrait fonctionner sur la base du volontariat, et l’anonymat de chaque personne devrait être garanti. « Le but, c’est que vous sachiez que vous avez été exposé et que votre risque a augmenté, mais ce n’est pas d’identifier un bouc émissaire. »

Dans tous les cas, les Canadiens devront y penser à deux fois avant d’accepter le traçage des individus. « Normalement, c’est une solution temporaire, note Sébastien Gambs. Mais on parle de deuxième et de troisième vagues. Alors quand ce système sera en place, il y a de fortes chances qu’il reste et que ça conduise à une surveillance sur le long terme. » Il rappelle les lois antiterroristes qui ont accru les pouvoirs de surveillance des gouvernements au début des années 2000 et qui sont restées en place pendant des années. La différence, cette fois-ci, c’est que la menace est virale.

Méthodologie

Les données ont été fournies par Drako Media, avec l’aide de leur analyste Gabriel Mongeau. Cette compagnie reçoit la latitude et la longitude des téléphones par l’entremise d’applications installées sur les cellulaires. Leur échantillon contient les données de 7 889 466 appareils au Canada (21 % de la population), dont 1 652 389 au Québec (19 % de la population) et 702 665 à Montréal (34 % de la population).

Les individus doivent explicitement accepter de partager leur position avec une application avant que leurs données ne soient récupérées. La précision est la même qu’un GPS, avec une marge d’erreur de 5 à 15 mètres.

Pour découper le pays en différentes zones, nous avons utilisé les régions de tri d’acheminement (forward sortation areas) de Postes Canada. Ces zones correspondent aux trois premiers caractères des codes postaux. Il y en a 1620 au Canada.

Nous avons défini un mouvement comme étant la détection d’un appareil cellulaire dans deux régions différentes lors d’une même journée.

Pour calculer les mouvements entre provinces, nous avons compilé les déplacements entre régions de tri se trouvant dans deux provinces différentes. Nous avons appliqué la même logique pour les déplacements entre régions sociosanitaires et entre villes/arrondissements liés à Montréal.

Seules les zones avec un minimum de 100 déplacements entrants ou sortants sont considérées dans notre analyse.

Pour estimer le nombre de personnes s’étant déplacées, nous avons multiplié le nombre de déplacements dans nos données proportionnellement à la population canadienne, québécoise et montréalaise.

Dans certains cas, les données de localisation sont erronées et les appareils renvoient tous la même latitude et longitude. Nous avons constaté ce type d’erreur en Alberta, notamment. Pour éviter d’inclure des anomalies dans notre analyse, nous avons filtré les régions de tri d’acheminement dont le trafic doublait brusquement en 24 h. Ces régions représentaient 4 % de l’ensemble et leur exclusion ne changeait pas la tendance générale au Québec et à Montréal.

Naël Shiab journaliste de données, Francis Lamontagne designer, Melanie Julien chef de pupitre

Go to Source