top of page
Rechercher
  • Photo du rédacteurHerve Blanc

Pourquoi j’ai choisi de devenir partenaire Dataiku

Dernière mise à jour : 18 mars

Je ne me souviens pas très bien quand j’ai entendu parler de dataiku pour la1ère fois mais quand j’ai commencé mon activité de conseil, axée sur l’IA, il était clair pour moi que je devais faire une bonne sélection et choisir une plateforme IA afin de pouvoir apporter de l’efficacité à mes clients et projets.


dataiku

biZNov

J’ai d’abord pris en considération le fait qu’une grande partie des données sous-utilisées dans les entreprises sont des données tabulaires. J’aurais pu choisir scikit-learn à l’époque, mais étant une entreprise de 1 personne, je ne voulais pas investir de temps dans la maîtrise de chaque composant impliqué dans la valeur de l’apprentissage automatique (et j’avoue que je ne suis plus le codeur quotidien que j’ai été).


Je voulais être capable de produire rapidement un POC d’un modèle prédictif (preuve de concept) en quelques jours (et non en semaines) afin que les entreprises moyennes puissent exploiter rapidement le potentiel de valeur de leurs données. Dataiku englobe toutes les manipulations de données impliquées dans l’EDA (analyse exploratoire des données) et il est bien centré sur la construction et l’évaluation de modèles d’apprentissage automatique.


La plate-forme prend également en charge nativement la nature itérative des projets d’IA (également appelés MLOps) et apporte une cohérence du début au déploiement.


L’architecture de Dataiku est basée sur des composants open source éprouvés servant des produits Big Data et d’apprentissage automatique dans le monde entier, donc je sais qu’elle sera aussi capable de passer à l’échelle (et ne nécessitera pas de débogage complexe ou de refonte complète au milieu de l’exécution du programme).


MLOps continuous delivery and automation pipelines

Ensuite, le travail d’équipe est un autre attribut clé qui a eu une grande influence dans le choix de dataiku. J’ai utilisé des représentations graphiques en flux dans bon nombre de mes expériences de travail précédentes. Une vue de flux est un moyen très efficace de communiquer les différentes étapes de traitement impliquées dans tout projet de données, tout en permettant d’abstraire sa complexité à l’aide de composition.


Ce n’est pas non plus un secret, les plates-formes low code ou no code sont à la mode et il y a une bonne raison à cela: les spécialistes sont des ressources rares, qu’il s’agisse de développeurs ou de data scientists. Nous vivons à l’ère du zettaoctet depuis des années déjà, et il y a fondamentalement plus de cas d’utilisation et de données que les entreprises ont de spécialistes pour tout gérer par eux-mêmes.


Il est donc essentiel d’avoir le bon outil pour fédérer et rendre productifs les citoyens de la donnée (un citoyen de la donnée, c’est tout le monde dans votre entreprise, tous les non-spécialistes). En partageant la même plate-forme, les nombreux citoyens de la donnée collaboreront efficacement et aideront les data scientists à mieux comprendre les différents flux de travail que l’entreprise a développés, et qui sont à l’origine toutes ces données. Cette étroite collaboration autour des données et de la production d’IA facilite la création de valeur commerciale et évite en grande partie les inefficacités latentes causées par les disparités ou l’accès aux outils.


collaboration autour des données et de la production d’IA

Encore une fois, être une entreprise de 1 personne conseillant les entreprises sur de nombreux projets différents rend chaque projet unique. La plate-forme d’IA que j’allais utiliser devait être complète, de sorte que la connexion aux différentes sources de données de l’entreprise ne nécessiterait pas beaucoup de travail sur mesure, voire aucun, mais elle devait être ouverte afin qu’elle puisse évoluer pour des besoins spécifiques si nécessaire.


Dataiku est également complet dans les différents modèles que vous pouvez choisir, ce qui rend très simple l’utilisation d’AutoML sur toutes ces options, l’extensibilité est aussi disponible pour apporter tout code d’IA spécifique au nécessaire projet. L’ensemble des visualisations de données incluses dans la plateforme correspond très bien aux besoins d’interaction des différents acteurs pour discuter de la plupart des différents défis d’un projet d’IA (performance des modèles de prédiction, explicabilité, dérive des données).


De plus, en servant plusieurs clients, je ne pouvais pas m’imaginer être un goulot d’étranglement ; potentiellement bloquant, pour mes clients. Dataiku est livré avec des cours de formation en ligne gratuits qui permettent l’apprentissage des employés de mes clients en suivant mes recommandations et / ou à leur propre rythme.



Il y a probablement beaucoup d’autres raisons de choisir et d’utiliser Dataiku (gouvernance, sécurité, ...), j’ai juste voulu partager les raisons qui m’ont poussé à devenir partenaire Dataiku, pour mieux répondre aux besoins de mes clients.


N'hésitez pas à contacter Hervé @ biZNov si vous avez des questions ou me faire savoir s’il y a d'autres sujets que vous aimeriez voir traiter sur ce blog. .


Et n'oubliez pas de diffuser l'information si vous avez aimé cet article de blog , Il suffit de cliquer sur les boutons de réseaux sociaux ci-dessous. Partager, c'est apprécier :-)

Comments


bottom of page