Des taux de rotation élevés sont réels. De nombreuses raisons expliquent la tendance croissante des gens à changer d’équipe : changements de carrière, migrations internes, années sabbatiques, etc. L’époque où les gens restaient pour toujours dans la même entreprise est révolue…
Aujourd’hui, les entreprises qui souhaitent garder une longueur d’avance sur la concurrence doivent être capables d’accepter ce phénomène et de s’y préparer. Une grande partie de cette préparation implique d'avoir un plan d'onboarding fiable.
Aujourd'hui, nous allons nous concentrer sur le processus d'intégration des équipes d'apprentissage automatique et de science des données. Nous pensons qu'il est encore plus difficile d'assurer un flux de travail cohérent pour ce type de tâches. Eh bien, c’est aussi le domaine que nous connaissons le mieux !
Pourquoi l'intégration des collaborateurs ML est-elle plus difficile que celle des autres ?
Le caractère unique d'une équipe ML est qu'elle traite généralement différentes dimensions :
- Data-driven business processes
- Explorations et expériences
- Données et plateformes de données
- Clouds publics/privés
- Technologie et modèles ML
La prise en charge de ces dimensions nécessite diverses équipes dédiées telles que des product owners, business analysts, data analysts, data scientists, ingénieurs ML, ingénieurs data, ingénieurs software, et ingénieurs DevOps.
Accompagner un nouvel employé dans tous ces domaines peut être très pénible, en lui donnant accès à tous les outils, stockages de données et modèles ML.
Le pire dans tout ça, c'est que vous devrez le faire assez souvent...
En raison de l'évolution rapide du paysage technologique, des graves pénuries de talents du marché, des possibilités de combiner plusieurs rôles en un seul, etc., les équipes choisissent les transitions rôle/équipe à un rythme plus rapide que les autres rôles dans d'autres types de produits logiciels.
Dans nos observations personnelles, nous constatons que cela se produit au moins une fois tous les trois à six mois. En anticipant des ratios similaires, nous avons vu que la meilleure stratégie est de se concentrer sur le partage des connaissances et l’appropriation, combiné à un solide processus d’intégration/sortie.
"Dans notre organisation, il y a beaucoup de changements dans nos équipes de recherche en Data science. En tant que chef d'équipe, je dois généralement consacrer au moins une journée par semaine à l'intégration et à la formation des nouveaux collaborateurs, c'est une grande partie de mon travail." Sophie, chef d'équipe IA
Comment 🥑 Picsellia 🥑 peut faciliter vos onboardings ?
L'un des plus gros problèmes liés à l'intégration des talents dans votre équipe ML est l'hétérogénéité des outils et des processus. Chez Picsellia, nous pensons qu'il ne faut pas construire une boîte à outils avec 6 outils… c'est pourquoi nous avons combinés 6 outils dans une seule plateforme pour vous aider à rendre vos processus aussi fluides que possible.
Notre philosophie repose sur 3 piliers :
- Traçabilité
- Reproductibilité
- Observabilité
Ces piliers peuvent paraître un peu abstraits alors traduisons-les en questions…
- Où sont toutes nos expériences ?
- Comment puis-je m'assurer que toutes mes données ne sont pas obsolètes ?
- Comment donner accès aux travaux antérieurs de l'entreprise à mon nouveau collaborateur ?
Le suivi de vos expériences est essentiel pour les nouveaux employés
Comme vous le savez, le deep learning est principalement un processus d’essais et d’erreurs, impliquant de nombreuses expérimentations. Au démarrage d’un projet, il est bien impossible d’éviter cette étape, MAIS une fois que votre équipe a fait les premiers essais, vous DEVEZ pouvoir y accéder pour que vos nouveaux employés sachent quoi NE PAS essayer ! Cela permettra à votre équipe d'économiser beaucoup de temps et à votre entreprise beaucoup d'argent sur les coûts des GPU cloud.
Liez toujours vos datasets à votre entraînement
Assurer la traçabilité est également une chose extrêmement importante à faire. Vous souhaitez que vos ingénieurs nouvellement embauchés puissent accéder à n'importe quel dataset, modèles et expériences en moins de 3 clics :)
La question: "où sont les datasets ?" est l’une des questions les plus fréquemment posées au sein des organisations.
Le moyen le plus efficace de garantir qu’aucune information ne soit perdue est de toujours lier chaque formation à son dataset et à son architecture de base correspondante.
Construisez votre base de connaissances
L’objectif d’une base de connaissances est de fournir un portail numérique organisé et en libre-service permettant de localiser et d’accéder rapidement aux informations pertinentes sur un sujet ou un domaine spécifique. Il est également utile pour le partage et le transfert de connaissances, car il permet de compiler, d'organiser et de communiquer les données nécessaires au public visé.
Une base de connaissances peut être structurée de différentes manières, comme une base de données, une bibliothèque numérique ou une collection de documents, dans le but final de créer une source unique de données accessible à tous les utilisateurs.
En matière de Machine Learning, les bases de connaissances prennent souvent la forme de registres, où vous trouverez tous les modèles qui ont été entraînés et les Datasets que possèdent vos entreprises.
Pour résumer, l’intégration des data scientists et des collaborateurs du ML se termine souvent par un processus stressant et chronophage. Ces types de professionnels nécessitent un processus d'intégration sur mesure en raison de la complexité des équipes ML, de l'évolution rapide des technologies et des opportunités dynamiques que le marché ne cesse de créer. C'est pourquoi un onboarding efficace doit donner la priorité à la traçabilité, à la reproductibilité et à l'observabilité des outils et des processus. Dans un scénario aussi complexe, il est crucial que les organisations soient capables de suivre leurs expériences, de relier leurs datasets à leur entraînements à des fins de traçabilité et de constituer une base de connaissances dans laquelle les nouveaux et les anciens employés peuvent localiser et accéder aux informations pertinentes dont ils ont besoin. .
Une stratégie d'intégration bien planifiée vous permettra, à vous et à vos équipes, d'économiser beaucoup de temps et d'argent !