Cloud AutoML - Vision

← Cloud AutoML

Obtenir des informations à partir d’images depuis le cloud ou directement sur l’appareil de l’utilisateur

AutoML Vision permet de créer facilement des modèles de machine learning sachant classifier des images conformément aux besoins spécifiques d’une entreprise.

Une particularité de AutoML Vision est la capacité à déployer un modèle au plus près de l’utilisateur c’est à dire directement sur sa machine, par exemple un smartphone ou un site web.

AutoML Vision est capable de produire des modèles entraînés sur des jeux de données à l’échelle, allant jusqu’à 1 million d’images, 5000 labels et 30 Mo par image.

Cas d’usage de AutoML Vision

AutoML Vision peut créer des modèles pour des cas d’usage comme: la classification d’images ou la détection d’objets dans une image.

AutoML Vision est, entre autres, utilisé l’inspection industrielle, la recherche visuelle de produits, la classification de documents, la recherche d’image.

AutoML Vision Classification

AutoML Vision Classification permet de construire des modèles de machine learning spécifiques capables de classer les images par rapport aux catégories définies par une entreprise.

AutoML Vision Object Detection

AutoML Vision Object Detection permet de construire des modèles de machine learning spécifiques capables de détecter et d’extraire des objets multiples dans une image. Il permet également d’obtenir des informations sur les objets détectés, comme leur position (bounding box) et leurs catégories.

AutoML Vision Edge Image Classification et Object Detection

Au moment de l’entraînement du modèle, il est possible de choisir le type de modèle Edge désiré à partir de cas d’usages spécifiques comme la faible latence, un usage général ou une haute qualité de prédiction. Les modèles Edge sont typiquement moins précis que les modèles hébergés dans le cloud mais sont embarquables directement sur la machine de l’utilisateur et évitent des round-trips réseau lors pour uploader une image sur laquelle faire des prédictions ou permettent tout simplement de travailler hors ligne.

AutoML Vision Edge permet d’exporter des modèles dans de nombreux formats comme TensorFlow Lite, Edge TPU compiled TensorFlow Lite, TensorFlow.js for Web ou encore pour Core ML (iOS / macOS).

Processus de construction d’un modèle AutoML Vision

AutoML Vision permet d’importer des jeux de données massifs par exemple uploadant directement les images depuis un ordinateur, ou en créeant des jeux de données CSV associés à des images stockées dans Cloud Storage. Une interface web permet de construire et d’examiner visuellement un jeu de données.

Pour entraîner le modèle il suffit de préciser le nombre d’heures d’entraînement désirées et la précision du modèle souhaitée. AutoML Vision utilisera les résultats des travaux de recherche de Google, comme la Neural Architecture Search, pour déterminer l’architecture de modèle la plus performante par rapport au jeu de données.

Une fois le modèle entraîné, AutoML Vision fournira un ensemble de métriques expliquant les performances du modèle ou l’importance des caractéristiques du jeu de données.

Enfin, il ne reste plus qu’à déployer le modèle, par exemple sous la forme d’une API REST facilement accessible ou un export pour Edge Device.