Le blog francophone consacré
aux technologies Esri

PatronyMap, une géographie des personnalités dans les noms de voies françaises


En France, sur 1,6 millions de voies, près de 300 000 portent des noms de personnalités (scientifiques, artistes, responsables politiques, militaires,...). Depuis juin 2013, le registre des voies et des lieux-dits utilisé par la DGFIP (appelé fichier FANTOIR) est diffusé en Open Data. Afin de valoriser le caractère géographique de ces données, j'ai essayé d'extraire de cette base de données les noms de personnalités et de les présenter à travers une application: PatronyMap. Il s'agit d'une DataViz géographique permettant de cartographier la répartition de ces noms de personnalités sur le territoire métropolitain. Cette approche cartographique permet, par exemple, d'appréhender des phénomènes ou des tendances géographiques liés à l'histoire ou à l'activité d'une personne localement, nationalement ou internationalement connue.


L'application web présente une cartographie interactive affichant les communes dont les voies portent le nom d'une personnalité de votre choix. L'utilisateur peut rechercher une personnalité puis visualiser les communes contenant une voie correspondant à ce nom. 


L'application propose également une approche comparative de la répartition Homme/Femme dans ces dénominations de voies. Pour cela, l'application permet un accès rapide aux 100 noms de personnalités masculines et féminines que l'on retrouve le plus fréquemment dans les noms de voie en France métropolitaine.

Traitement des données FANTOIR

Le traitement, il y a eu tout d'abord une première extraction de noms de voie à partir du fichier FANTOIR (plus de 7 millions de lignes). La codification du fichier permet assez facilement de distinguer les noms de communes, de lieux-dits, ... des informations concernant les voies. L'étape suivante a été en revanche plus complexe car elle consistait à extraire uniquement les noms de personnalités. Sans trop rentrer dans les détails, il a fallu tout d'abord une première phase de traitement appliquant des règles liées à la structure du nom de voie (recherche d'articles du type: "du", "de la", ... ou de mots clés tels "église","fontaine","foret","bois", "11 novembre", ...). Ceci m'a permis d'exclure une part importante de voies. Ensuite, une seconde phase de traitement basée sur la recherche de prénoms, d'abréviations (Général, Maréchal, Colonel, Comtesse, ...) et de noms (Colette, Napoléon, Molière, ...) m'ont permis de réaliser une extraction de noms de personnalités. Enfin, un dernier traitement basé sur des recherches Wikipédia m'a permis de rechercher des noms de personnalités parmi les derniers milliers de noms de voies non déterminés.

Autres aspects techniques concernant l'application

L'application web a été développée à l'aide de l'API JavaScript ArcGIS. Elle consomme des données statiques (3 fichiers CSV) pour les listes des top 100 Homme et Femme et pour la récupération des localisations correspondant à chaque code INSEE. 

Pour la fonction de recherche libre, ce sont des 2 Feature Services hébergés sur la plateforme ArcGIS Online qui ont été utilisés. Vous remarquerez que les temps de réponses sur ces services web sont très performants pour assurer l'implémentation de l'autocompletion dans la zone de recherche. Le premier Feature Service permet de retrouver, parmi une liste d'environ 98 000 noms de personnalités, celles qui correspondent à la chaine recherchée. Le deuxième Feature Service est utilisée pour retrouver l'ensemble des communes contenant une voie portant le nom de la personnalité choisi par l'utilisateur (environ 300 000 occurrences de voies). 

On notera d'ailleurs, pour l'autocompletion dans la zone de recherche, l'utilisation de librairie Typeahead.js couplée à ArcGIS Online, un projet publié sur Github par Christophe il y a quelques temps.

Le code source de l'application ainsi que les données utilisées sont disponibles sur l'espace GitHub d'Esri France.

What next ?

Cette application n'est que la première étape d'un projet un peu plus ambitieux dans lequel on souhaite pouvoir étudier la répartition Homme/Femme dans la dénomination des noms de voies françaises. L'objectif est d'identifier d'éventuels phénomènes ou disparités géographiques dans ce ratio Homme/Femme. Il faut, pour cela, être capable d'affecter un genre à chaque nom de voie ce qui n'est pas facilement automatisable notamment à cause du manque de normalisation dans la saisie des noms de voies dans FANTOIR. Si vous avez des idées, je suis à votre disposition pour en discuter...

Partager cet article:

Rejoindre la discussion

    Les commentaires à propos de cet article:

4 comments :

Anonyme a dit…


Sur Facebook, Esri France présente cette app en laissant croire que c'est déjà possible de faire des stats, mais ils vont un peu vite, à moins de préciser que ça ne peut être qu'approximatif.

Il y a du boulot (en plus de celui de trier les genres). Certaines personnes sont "nommées" différemment selon les rues : parfois on a leur prénom ou bien leur titre ("Docteur", "Général"...). Du coup on a plusieurs groupes pour une seule personne, ce qui fait que le TOP100 pourrait être faux.

Parfois on a que le nom et rien d'autre. Dans ce cas l'appli nous "empêche" de les chercher (donc il n'existent pas selon cette carte).

Sans oublier les homonymes...

Bref, l'appli est sympa mais... Bon courage !

William a dit…

Merci pour cette appli très intéressante. Une question néanmoins. Dans la BDD, vous faite la distinction entre Anne de Bretagne et la duchesse Anne. Or, il s'agit de la même personne, non ?

Aurelia a dit…

Bonjour,
merci, cette appli a l'air très interessante.
Malheureusement je ne peux pas y accéder en cliquant dessus, faut il un code?
Comment puis-je y accéder ?

Merci

Gaëtan Lavenu a dit…

Bonjour,

Il y avait effectivement un soucis sur cette application qui utilisait le fond de carte "World Dark Gray" à l'époque en version beta. Il est désormais disponible en tant que fond de carte standard ArcGIS mais son URL avait changé. Ceci est corrigé et l'application fonctionne de nouveau.

Merci pour votre retour.