Jeu de données attendu depuis longtemps par tous les aficionados de la cartographie statistique, les Contours… IRIS® de l’IGN sont désormais disponibles en licence ouverte. Oui, c’est ouvert mais c’est une marque déposée de l’INSEE comme l’indique la base de données de l’INPI. D’où le ®. Ce qui est rigolo, c’est que les trois points de suspension après Contours font partie intégrante de la marque. On peut le voir comme pour souligner le côté flou ou flottant de ces contours, dont on aurait du mal à cerner les limites. Et c’est vrai que quand on creuse un peu le sujet, on se pose vite des questions.

Pour ceux qui n’auraient jamais été dessillés sur le sujet, reprenons un peu la généalogie de ce jeu de données (oui, je parle comme j’INSPIRE maintenant). Les IRIS sont des subdivisions communales construites par agrégations d’îlots (voir la documentation officielle) à vocation de représentation statistique plus fine que la commune. Ils ont été définis par l’INSEE pour le recensement de 1999, et ont porté alors à l’occasion le joli nom d’IRIS2000 (c’était l’époque où on regardait encore K2000 à la TV, et le directeur de la statistique de l’époque était fan de David Hasselhoff, qui fait d’ailleurs son grand retour actuellement avec son clip True Survivor que je conseille à tous, même s’il faut se fader 30 secondes de pub avant d’en profiter). Bref, pour les communes de plus de 10000 habitants et certaines de plus de 5000, l’INSEE établit donc des subdivisions, calées sur la voirie avec donc des délimitations genre « de la droite de la Rue du Marteau entre les n° 12 et 146 à la gauche de la Rue du Sabot, ce qui rend franchement agréable le travail de numérisation. C’est pour cela que ce jeu de données était revendu par quelques officines seulement qui, partant du fait que le boulot était éminemment pénible et qu’il s’adressait essentiellement à des activités de géomarketing où on se fait de la thune, le faisaient payer plus cher que l’ArcMap (pas de ® ici, vous pouvez aller déposer la marque) qui servait à les visualiser.

Comme à chaque fois qu’un jeu de données dépend d’un autre (ici la voirie), son cycle de vie devient un peu compliqué. Car si la description des IRIS donnée par l’INSEE ne change pas, leur représentation graphique dépend de la base de données voirie utilisée. Certes ce sont principalement des axes importants qui servent de limites, mais des différences subtiles peuvent exister entre bases voirie, et perturber le bon déroulement d’un géocodage à l’IRIS par exemple si on n’utilise pas la même base voirie pour travailler. Et comme évidemment les IRIS ont été régulièrement révisés pour s’adapter aux évolutions démographiques, il faut co-utiliser les bonnes versions chaque.

On ne peut donc que se réjouir de l’ouverture de cette donnée, et sachant ce que nous savons, nous intéresser à sa généalogie dans la documentation fournie. On y apprend (paragraphe 1.3.1) que la géométrie provient d’un GEOROUTE®, recalé sur un référentiel proche du RGE® IGN (mais pas tout à fait le RGE donc) et enfin généralisé. Les communes non subdivisées sont issues du GEOFLA® comme les limites des communes subdivisées pour garantir la cohérence du tout. Il est donc par ailleurs précisé que « La géométrie des contours d’Iris étant issue d’une généralisation des limites fournies par l’INSEE, les requêtes spatiales fines à l’adresse ou au bâtiment doivent être effectuées avec Iris… GE (Grande Échelle), produit IGN compatible géographiquement avec la précision de ces données. » On vous explique donc que pour du travail de précision il faudra plutôt utiliser un autre produit, ce qui peut sembler de bonne guerre puisque c’est la précision qui fait la valeur. La documentation IGN est d’ailleurs fort bien fait puisqu’elle illustre l’étape de généralisation par cette image :

Exemple

On y comprend que la source IRIS… GE proposée en bleu est transformée en Contours… IRIS® montrée en rouge après un bon exercice de généralisation. Tout est donc clair.

Sauf que… Quand on récupère le jeu de données (qui est en fait une collection composée de jeux départementaux préalablement regroupés par régions désignées par leur code. Il va falloir réviser la nomenclature) et qu’on l’examine, on y trouve des géométries plutôt similaires à IRIS… GE et donc non généralisées :

Iris... Contours

On est donc tenté de superposer tout ça avec les limites de communes issues du GEOFLA®, pour voir… que rien ne colle…

GEOFLA

Alors on inspire un grand coup, et on va voir un vieil épisode de K2000 parce que tout ça est finalement bien trop compliqué pour nous. Mais on a hâte que grâce à l’OpenData le citoyen lambda prenne son destin en main et utilise toutes ces données à bon escient…

 

MISE A JOUR DU 7 MAI 2015

L’IGN vient de mettre en ligne une version 2.0 des Contours… IRIS® 2014 avec des géométries parfaitement alignées sur celles du GEOFLA Communal. On peut donc féliciter l’IGN pour sa réactivité et se précipiter sur le nouveau jeu de données ! Autre amélioration, plus pratique : les différents shapefiles départementaux sont désormais tous dans le même répertoire et non plus classés par code région, ce qui rend beaucoup plus facile leur manipulation.

iris

Rien que pour vos yeux…
Étiqueté avec :    

4 pesnées sur “Rien que pour vos yeux…

  • 3 mai 2015 à 22:43
    Permalien

    Ah! La révélation met à l’épreuve ceux de peu de foi.
    Mais n’est-ce pas le principe même de la transparence? Montrer que les données idéalisées sont en fait les mêmes que celles que l’on manipule habituellement, c’est-à-dire avec des problèmes de généalogie (Géoroute n’existe plus depuis quoi, 15 ou 20 ans?), de mise à jour, de variation du processus…
    Et donc que les résultats des études doivent être appréhendées avec humilité (ce qui, je le reconnais, n’est pas bien facile à vendre à des industries, mêmes « pétées de thunes »).
    L’avantage est que cela aide les organismes à les voir sous leur vrai jour et ensuite les améliorer.
    Je le dis sans ironie, et pas seulement en ce jour du Seigneur : l’humilité est la voie du salut, mes fils!

    NB : les images sont-elles sous copyright pour ne pas s’afficher, ou est-ce mon IP qui les bloquent?

    Répondre
  • 4 mai 2015 à 8:04
    Permalien

    Paradoxalement on se retrouve dans ce cas avec un jeu de données de meilleure précision que prévu, ce qui est quand-même rare.
    Sinon les images devraient s’afficher d’elles-même ssous tout navigateur du XXIe siècle. Si vous utilisez Lynx cependant, le phénomène que vous rencontrez est normal.

    A bientôt

    Répondre
  • 14 mai 2015 à 15:53
    Permalien

    Super article et bonne nouvelle : on va pouvoir fabriquer un Géofla communes plus précis par agrégation des IRIS non ?

    Répondre
  • Ping : Info’s carto statistique » Le blog SIG & URBA

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.