Google vision API : Une image vaut 1000 mots !

Dans un précédent article nous évoquions le machine learning et son importance fondamentale dans le développement d’aujourd’hui. Dans la suite de cette évolution Google, en mettant à disposition son API Google Vision, est une parfaite illustration du machine learning maintenant exploitable par tous par l’intermédiaire d’un service cloud et des grands changements à venir dans l’industrie du cloud computing

Google Vision API comment ça marche ?

Google vision API est un service cloud qui permet une analyse granulaire des images. Elle est basée sur des principes de machine learning et son évolution constante rend les algorithmes d’analyse de plus en plus puissants et performants.
Dans le détail cette API va pouvoir analyser 6 critères distincts sur n’importe quelle image présente sur internet :

LABEL_DETECTION: une analyse performante de l’image afin d’en extraire des mots clefs descriptifs et une indexation sémantique.
TEXT_DETECTION: Avec une reconnaissance OCR (optical character Recognition) l’api va être capable d’extraire toutes les informations textuelles d’une image, de la plaque d’immatriculation à un panneau de signalisation en passant par la lecture d’une étiquette et de fournir un texte éditable pour la base de donnés
FACE_DETECTION: Détection des visages et identification mais également analyses des émotions visibles (sourire, tristesse etc.)
LANDMARK_DETECTION: Détection d’éléments géographiques et architecturaux identifiants (monument, montagne etc.)
LOGO_DETECTION: Détection des logos des entreprises
SAFE_SEARCH_DETECTION: Détection des paramètres safe search qui déterminent les images inappropriées ou explicites dans les résultats de recherche Google (ex : nudité ou violence)

En passant par l’API on pourra donc appliquer plusieurs critères de reconnaissance aux images en sélectionnant les plus pertinents par rapport à la fonction du programme

Google vision API, quelles évolutions pour vos projets ?

Les implications de cette API sont énormes et multiples, mais focalisons-nous sur les intérêts marketing immédiats à travers quelques exemples (non exhaustifs).L’analyse des mots-clefs d’une image va permettre d’accélérer les processus de référencement SEO en automatisant l’indexation des images, manipulation auparavant fastidieuse et couteuse en ressources humaines sur des opérations de grande envergure.

L’analyse faciale peut permettre de collecter un data unique de réaction de consommateurs à un produit par exemple, mais également d’obtenir des informations sociologique à travers des images offrant ainsi un nouveau champ d’investigation pour le CRM

La reconnaissance des textes, au-delà du potentiel évident pour les bases de données, va permettre, par exemple, une détection automatique et performante des langues et ainsi une distillation contextuelle et géographique du contenu.
La reconnaissance des logos va également permettre des analyses fines sur la propagation des marques et les habitudes consommateurs

Mais une utilisation de l’API très intéressante et applicable immédiatement c’est bien évidement le safe search qui va permettre une modération rapide et automatisée sur des opérations interactives avec des consommateurs, éliminant quasiment intégralement des postes couteux de modération qui étaient nécessaires jusqu’ici afin d’éviter de mauvaises surprises légales sur les opérations marketing ( ex un jeu concours de photo qui tourne mal à cause d’images inappropriées)

Il reste encore beaucoup d’application de cette technologie à trouver, mais nous percevons déjà le potentiel d’utilisation de ces critères

Google Vision API : internet comprend enfin les images

Cette application du machine learning est une évolution majeure dans les procédés de fabrication web : l’image passe d’un statut illustratif à un statut informatif et sémantique et devient ainsi une source de Data complémentaire et supplémentaire.

Google prend en charge tous les aspects lourds du machine learning et offre, à travers cette API, un énorme potentiel d’analyse, facile à mettre en place et peu onéreux.

Pour utiliser, pour vos projets actuels et futurs, l’API Google vision le Studio Connecté peut mettre en place une étude de faisabilité technique afin de donner du sens à vos images !