Comment réunir 9 data scientists travaillant sur 5 modèles de vision par ordinateur et 1 million d'images pour entraîner un modèle d'inspection visuelle et le déployer en production pour la première fois.
ENERGIE
LEAD DATA SCIENTISTS
PASSAGE A L'ÉCHELLE
L'équipe de data science d'un grand opérateur énergétique de la région APAC a décidé d'utiliser la vision par ordinateur pour améliorer le processus d'inspection visuelle à distance du réseau de transport d'électricité.
Les images sont collectées par des équipes d'opérateurs de drones et des patrouilles à pied dans le terrain. Elles sont examinées manuellement par des ingénieurs formés pour identifier les anomalies. Les images d'une seule tour génèrent des Go de données, prennent des jours pour être analysées et sont sujettes à des erreurs.
Avec des ressources minimales - un outil de versioning de données open-source, du GPU, un espace de stockage de données, une infrastructure de serving et des notebooks - l'équipe Datascience a réalisé un premier POC. Elle a ensuite dû évaluer les bénéfices de l'utilisation de la computer vision pour les opérateurs de contrôle dans le cadre d'un projet pilote de trois mois avec de nouveaux ensembles de données de production.
1 semaine
De 1 mois à 1 semaine pour itérer sur un modèle.
+33%
Le temps libéré pour les data scientists.
50%
De 100 % à 50 % des images examinées manuellement. Seulement 30 % de faux positifs.
Datalake : un datalake centralisé pour indexer, rechercher et stocker toutes les données et tracer les sources et les métadonnées.
Système de monitoring : un système de surveillance des modèles et des données pour évaluer la qualité et les performances. a model & data monitoring system to assess quality & performance.
Registre des modèles : un point de vérité unique pour versionner et centraliser tous les modèles.
Entraînement continu : une interface dédiée permet aux experts métier d'examiner les prédictions, et aux images revues de mettre automatiquement à jour de nouveaux jeux de données d'entraînement.