Archive pour le mot-clef ‘ETL’

Léger changement de cap pour le module spatial de l’ETL Talend

Dimanche 13 juin 2010
Depuis son lancement en 2007, le produit Spatial Data Integrator a émmergé comme une solution de traitement et gestion de données géographiques. En effet, partant du large spectre fonctionnel fourni par Talend (+ de 500 composants aujourd’hui), les « géocomposants » permettent la réalisation de traitements (eg. validation de géométrie, calcul de distance, agrégation, intersection) et la gestion (eg. création de métadonnées, publication dans un catalogue) de données géospatiales.
Cependant, il était difficile de suivre le rythme de progression de Talend Open Studio (également appelé TOS). Afin de bénéficier des avancées rapides faites par l’équipe de Talend, il a été décidé de pouvoir connecter le module spatial sur une installation de TOS existante.
Pour cela, l’architecture utilise maintenant des points d’extension pour l’ensemble des plugins du module spatial (type Geometry, librairies, composants, routines, assistants). Ainsi, le processus de création d’une nouvelle version est grandement simplifié. L’utilisation de plugins et la suppression des « patches » permettent également une prise en main beaucoup plus aisée pour d’éventuels nouveaux contributeurs.
La version 4.0.1 sortie vendredi dernier est donc la première ébauche de cette nouvelle architecture qui devrait être finalisée lors de la sortie de la version suivante. Cette version bénéficie donc des fonctionnalités de la version 4.0.1 de TOS, de corrections de bugs ainsi que quelques ajouts fonctionnels.

Un nuage de lait avec votre analyse thématique ?

Lundi 16 juin 2008

Le groupe de recherche GeoSOA, mené par l’éminent Thierry Badard, nous signale la sortie de GeoKettle, que tout estivant ayant traversé le Lot pourra facilement traduire par GeoBouilloire, qui n’est pas destinée à éliminer les impuretés de vos données cartos, mais à réaliser du data-mining en 3 mn chrono !

C’est, pour reprendre les termes du communiqué, une version « spatialisée » de Pentaho Data Integration, outil ETL (Extract, Transform, Load) dédié à l’agrégation de sources de données différentes dans des entrepôts de données. GeoKettle intègre ainsi l’ensemble de la suite décisionnelle Pentaho, afin de donner une dimension géographique tant à la présentation du résultat des analyses (ça c’est facile) qu’à leur exploration elle-même. Pour faire court, la dimension géographique devient une des composantes analytiques, permettant par exemple de consolider les indicateurs en fonction d’entités administratives, ou d’énoncer des contraintes d’ordre spatial (distance par exemple) à leur composition.

Il semblerait donc qu’après le rapprochement entre CampToCamp et Talend, autre éditeur d’ETL OpenSource, le GéoDécisionnel ait le vent en poupe et constitue le nouveau territoire de la géomatique.