Oracle Data Integrator Application Adapter for Hadoop

Oracle a développé un produit de type ETL basé sur Apache Hive : Oracle Data Integrator Application Adapter for Hadoop.
Les développements sont en SQL et Hive génére un job de Map/Reduce permettant d’exploiter les données sous Apache Hadoop.

D’autres produits ETL intégrent aussi maintenant un générateur de Map/Reduce :
Talend Big Data qui est en fait le produit ETL Talend Open Studio avec des composants comme Apache Pig dans la palette. Le gros apport de cette solution est de pouvoir générer des executables java (librairie jar) qui ne nécessite pas de runtime Talend sur les serveurs.
– Informatica a aussi intégré une version Big Data à leur produit PowerCenter

L’élément principal à regarder lors du choix d’un de ces produits est de vérifier que le produit ETL reste juste un IDE et que le code généré ne demande pas un produit à installer sur les serveurs. Seul Talend Big Data semble respecter cette règle

Leave a Reply

Your email address will not be published. Required fields are marked *

Human comment ? *