Une plateforme end-to-end complète pour automatiser le traitement de documents
Document AI est une plateforme unifiée permetant d’automatiser le traitement de documents, notamment la classification, l’extraction de contenu, l’enrichissement des données au sein de documents complexes. Grâce à Document AI il est possible de transformer, à grande échelle, des documents en contenu structuré pour comprendre leur contenu.
Les types de documents supportés par Document AI
Document AI met à disposition des utilisateurs de Google Cloud différents processors qui vont analyser les documents. Ces processors sont accessibles via une API unifiée.
Parmis les processors on notera:
- un Document OCR (Optical Character Recognition) qui peut identifier et extraire du texte dans différents types de documents comme des PDF, TIFF, GIF.
- un Form Parser qui sait extraire du contenu d’éléments de formulaires comme des champs de saisie, des checkboxes, des tables, des dates
- un Document splitter qui sait découper des documents, par exemple un PDF contenant plusieurs fichiers scannés
- des parsers Lending qui savent analyser des formulaires des impôts fédéraux Américains (type W9, 1040, W2, 1099-MISC,…)
- des parsers Procurement qui savent analyser les factures d’achat et les reçus.
Il est ainsi possible de travailler sur des documents génériques (OCR, Form, Splitter) ou sur des documents plus spécialisés (Lending, Procurement).
Google Cloud travaille activement à l’enrichissement de l’ensemble des processors disponibles.
Quelques cas d’utilisation de Document AI
Grâce à Document AI il est possible:
- d’automatiser les flux de travail de validation de la conformité des données
- d’accélérer l’analyse de documents et la prise de décision en extrayant automatiquement des données structurées à partir de documents
- de tirer parti des informations soumises par les utilisateurs ou clients afin d’améliorer les scores de satisfaction
Comment utiliser Document AI ?
Document AI s’utilise simplement en deux étapes principales.
Il faut d’abord créer un processor en fonction du type de document que l’on veut analyser.
Une fois ce processor créé, il sera accessible via une URL et une API unifiée. Un appel REST ou l’utilisation des librairies Google Cloud permettront simplement de transmettre un document on-line (si petite taille) ou off-line (si grande taille) au processor qui retournera alors le résultat de son analyse.