Crise sanitaire et exode urbain (1/2) : un défi méthodologique

Alexandre Coulondre détaille pour ADEQUATION la manière dont il a utilisé les données du site leboncoin dans le cadre d'une mission de recherche dont les résultats viennent d'être publiés.

L'équipe également composée de Marianne Bléhaut et Claire Juillard a étudié la thèse d'un éventuel exode urbain déclenché par la crise sanitaire et ses confinements. Son partenariat avec le site leboncoin a permis d'arriver à des conclusions précises, décrites dans un autre article par Claire Juillard.

Alexandre Coulondre, Chercheur associé au Lab’Urba

Publié le 17/02/2023

 
Alexandre Coulondre

Alexandre Coulondre, chercheur associé au LabUrba (Université Gustave Eiffel), consultant indépendant (DIT Conseil), et animateur du comité « Data » du LIFTI (Laboratoire dInitiatives Foncières et Territoriales Innovantes).

Au début de lannée 2021 a été lancé un programme de recherches intitulé « Exode Urbain : conséquences de la pandémie de la Covid-19 sur les mouvements résidentiels »[1]. Nous venions de vivre une année 2020 hors du commun faite de protocoles sanitaires et de confinements. 

Côté médiatique s’enracinait un discours assez consensuel sur l’idée d’un départ massif des centres urbains vers les campagnes. Mais quelle était l’ampleur de ce phénomène ? Pouvait-on en proposer une mesure robuste ? Les relocalisations observées étaient-elles durables ? Etaient-elles associées à des projets immobiliers ? Telles étaient les questions du programme de recherche. Télécharger le rapport 

Des données traditionnelles peu adaptées

Cet élan de connaissance sest vite confronté au problème du manque de données disponibles. 

Traditionnellement, les mouvements de population sont décrits avec les données du recensement de la population de lINSEE, notamment avec la base MIGCOM qui identifie les communes de résidence actuelles et antérieures des individus et permet ainsi de retracer les flux intercommunaux. Linconvénient de cette source est quelle est disponible avec un décalage temporel de plusieurs années. Elle ne permet donc pas de caractériser des phénomènes aussi récents que l’était la pandémie.

Les données de marché sont plus réactives. Certaines analyses se sont concentrées sur les données DVF, qui recensent les mutations immobilières. Lobjectif était de tester lhypothèse dune augmentation des volumes et des valeurs dans les marchés résidentiels ruraux. Mais ici un problème conceptuel émerge concernant lexode urbain car ces données ne caractérisent pas la provenance des acquéreurs. Dès lors, quand bien même les marchés résidentiels ruraux se valoriseraient, il serait difficile daffirmer que le phénomène est lié à des urbains se réorientant vers les campagnes.

Les données de téléphonie mobile (Bouygues Telecom, Orange, SFR) ont pu constituer une solution. Grâce à la localisation des téléphones, notamment des smartphones, il est possible didentifier le volume dutilisateurs localisés dans les territoires ruraux alors quils l’étaient préalablement dans des centres urbains. LINSEE a mobilisé ce type données pour fournir dès la fin de lannée 2020 une première mesure de lexode urbain durant les confinements, mettant ainsi à jour une vague de départs des grandes métropoles et une arrivée importante dans des espaces ruraux et littoraux[2].

Mais après les confinements, la répartition durable de la population sur le territoire a suivi des tendances plus difficiles à caractériser[3]. Un bon nombre des mobilités observées au moment des confinements étaient en fait temporaires et se sont effectuées dans le cadre dun repli vers une résidence secondaire ou occupée par des proches. La question qui restait était donc celle de lexode urbain durable, celui qui se traduit par des projets immobiliers nouveaux.

Apports des données de navigation issues des plateformes numériques

Pour mesurer ce phénomène, il a fallu dautres données. En loccurrence, les données de navigation des internautes sur les plateformes dannonces immobilières en ligne. Des centaines de milliers de biens immobiliers sont proposés chaque mois à la vente ou à la location sur des sites Internet comme leboncoin, Seloger, ou encore MeilleursAgents. Les internautes consultent en masse ces sites Internet. Médiamétrie estime à 25 millions le nombre de visiteurs uniques par mois sur les sites français de cette catégorie[4]. Autant de projets immobiliers naissants qui peuvent être décrits.

Dun point de vue méthodologique, le grand avantage des données de plateformes est lactualisation quasiment en temps réel. Il est techniquement possible dintégrer avec seulement quelques jours de décalage les informations issues des parcours de navigation.

Un autre avantage de ces données est dintégrer pour chaque visite une double localisation : celle de linternaute (via son adresse IP) et celle du bien immobilier consulté (via ladresse fournie par lannonceur). À travers une analyse systématique et agrégée de ces doubles localisations, il est possible de reconstituer le réseau des projections géographiques entre les territoires dans le cadre de projets immobiliers.

Cest ce que nous avons fait avec Marianne Bléhaut et Claire Juillard dans le cadre dun partenariat avec le site leboncoin. Leboncoin est le principal site Internet français de la catégorie puisquil réunit plus de 16 millions de visiteurs uniques par mois sur ses pages « immobilier ». De plus, le profil des internautes de ce site est assez représentatif de la population française et de sa distribution territoriale[5].

Un jeu de données portant sur la période 2019-2021 a été mis à notre disposition. Ces navigations représentent 3,5 milliards dobservations statistiques. Elles permettent de reconstituer un réseau complet de projections géographiques incluant aussi les plus petites communes (à la condition quelles affichent au moins une annonce immobilière sur la période). 

Précautions d'usage des données de plateformes

Plusieurs difficultés méthodologiques sont inhérentes à ces données de plateformes.

La première est technique. Il est nécessaire de stocker et organiser une masse dinformations bien plus importante que celle des jeux de données traditionnels sur le sujet. Il faut consolider à partir dinformations brutes des variables utiles et agrégées via notamment un appariement avec les référentiels géographiques officiels (codes communes).

La deuxième difficulté est liée aux modalités de localisation de linternaute. Ladresse IP traduit un lieu de connexion qui ne correspond pas toujours au lieu de résidence de linternaute. Il est en effet possible de naviguer sur le site depuis son lieu de travail ou de loisirs. Il existe plusieurs façons de contourner cette limite. On peut identifier une localisation principale pour chaque internaute mais cela nécessite de chainer ses différentes visites ce qui est surtout possible pour les utilisateurs identifiés à dans lespace client. On peut aussi travailler à des mailles géographiques agrégées. Ceci limite les effets de frontière, la résidence et le lieu de travail se trouvant plus souvent dans la même maille à cette échelle. En loccurrence, le zonage multicommunal en Mailles Habitat a été retenu.

La troisième difficulté est conceptuelle. Contrairement aux données traditionnelles qui caractérisent des comportements effectifs, les navigations ne se traduisent pas nécessairement par un achat ou une location immobilière futurs. Elles traduisent des intentions. Lapproche nest donc pas substituable aux autres sources de données. Elle est plutôt complémentaire. Une approche basée sur les intentions est néanmoins originale car elle témoigne des aspirations territoriales des ménages de façon beaucoup moins dépendante des conditions locales de marché. Un territoire peut en effet concentrer des navigations alors même que loffre est faible ou en décalage avec les attentes. Ce surcroit dintérêt détectable dans les données de navigation serait invisible dans une étude portant sur les comportements effectifs (transactions, déménagement, etc.).

Résultat : on ne peut pas parler d’un exode urbain post-covid

Une analyse au trimestre entre 2019 (période antérieure à la crise sanitaire) et 2021 (période la plus récente pendant l’étude) permet finalement de décrire l’évolution des projections géographiques au moment de la crise de la Covid-19 et les éventuelles réorientations allant dans le sens dun exode urbain.

En lespèce, comme développé dans l'article de Claire Juillard, lhypothèse dun accroissement des projections allant des centres urbains vers les espaces ruraux na pas réellement pu être validée. La structure des projections est relativement stable dans le temps.  Lexode urbain savère donc limité y compris lorsquil sagit daspirations. Sans les données de plateformes, il aurait fallu attendre encore plusieurs années pour éclairer ce phénomène !

 


[1] Bléhaut Marianne, Coulondre Alexandre, et Juillard Claire. Un exode urbain post-covid ? Analyse des projections géographiques des Français à partir des données du site d’annonces immobilières leboncoin, Paris, Rapport pour la POPSU et le Réseau Rural Français, 2022 (rapport disponible sur ce lien).

[2] Ce programme de recherche a été financé par le POPSU et le Réseau Rural Français. Il a abrité trois équipes de recherche ayant des méthodologies différentes. Une synthèse croisée des résultats est disponible (sur ce lien).

[3] INSEE, « 208 000 résidents parisiens en moins dans la capitale pendant le premier confinement », Insee Flash, n°52, 2020 (article disponible sur ce lien).

[4] INSEE, « Retour partiel des mouvements de population avec le déconfinement », Insee Analyse, n°54, 2020 (article disponible sur ce lien).

[5] Médiamétrie NetRatings, Audience Internet Global, Avril 2021.

© ryoji-iwata -Unsplash

Réagissez