arrow_back

Extraction de documents personnalisée avec Document AI Workbench

Accédez à plus de 700 ateliers et cours

Extraction de documents personnalisée avec Document AI Workbench

Atelier 1 heure universal_currency_alt 5 crédits show_chart Intermédiaire
info Cet atelier peut intégrer des outils d'IA pour vous accompagner dans votre apprentissage.
Accédez à plus de 700 ateliers et cours

GSP1142

Logo des ateliers d'auto-formation Google Cloud

Présentation

Document AI est une solution de reconnaissance de documents qui exploite des données non structurées (par exemple, des documents, des e-mails, des factures, des formulaires, etc.) et en facilite la compréhension, l'analyse et l'utilisation. L'API fournit une structure via la classification de contenu, l'extraction d'entités, la recherche avancée, etc. Document AI Workbench vous permet d'améliorer la justesse du traitement des documents en créant des modèles entièrement personnalisés à l'aide de vos propres données d'entraînement.

Vous pouvez créer des extracteurs de documents personnalisés (CDE, Custom Document Extractor) spécifiquement adaptés à vos documents, et entraînés et évalués à l'aide de vos données. Ce type de processeur identifie et extrait les entités de vos documents. Vous pouvez ensuite utiliser le processeur entraîné dans d'autres documents. Vous utiliserez généralement un CDE pour des documents d'un même type, tels que les formulaires d'inscription de votre établissement.

Dans cet atelier, vous allez apprendre à utiliser Document AI Workbench pour créer et entraîner un extracteur de documents personnalisé qui traite les documents W-2 (formulaire fiscal aux États-Unis). La plupart des tâches de préparation des documents ont été effectuées afin que vous puissiez vous concentrer sur les autres mécanismes de création d'un CDE.

Objectifs

Dans cet atelier, vous apprendrez à effectuer les tâches suivantes :

  • Créer un extracteur de documents personnalisé dans Document AI Workbench
  • Définir et créer le schéma du processeur
  • Importer des documents
  • Annoter les documents manuellement dans Document AI Workbench
  • Utiliser l'IA générative pour étiqueter automatiquement des documents
  • Lancer un job d'entraînement pour le processeur

Préparation

Avant de cliquer sur le bouton "Démarrer l'atelier"

Lisez ces instructions. Les ateliers sont minutés, et vous ne pouvez pas les mettre en pause. Le minuteur, qui démarre lorsque vous cliquez sur Démarrer l'atelier, indique combien de temps les ressources Google Cloud resteront accessibles.

Cet atelier pratique vous permet de suivre les activités dans un véritable environnement cloud, et non dans un environnement de simulation ou de démonstration. Des identifiants temporaires vous sont fournis pour vous permettre de vous connecter à Google Cloud le temps de l'atelier.

Pour réaliser cet atelier :

  • Vous devez avoir accès à un navigateur Internet standard (nous vous recommandons d'utiliser Chrome).
Remarque : Ouvrez une fenêtre de navigateur en mode incognito (recommandé) ou de navigation privée pour effectuer cet atelier. Vous éviterez ainsi les conflits entre votre compte personnel et le compte temporaire de participant, qui pourraient entraîner des frais supplémentaires facturés sur votre compte personnel.
  • Vous disposez d'un temps limité. N'oubliez pas qu'une fois l'atelier commencé, vous ne pouvez pas le mettre en pause.
Remarque : Utilisez uniquement le compte de participant pour cet atelier. Si vous utilisez un autre compte Google Cloud, des frais peuvent être facturés à ce compte.

Démarrer l'atelier et se connecter à la console Google Cloud

  1. Cliquez sur le bouton Démarrer l'atelier. Si l'atelier est payant, une boîte de dialogue s'affiche pour vous permettre de sélectionner un mode de paiement. Sur la gauche, vous trouverez le panneau "Détails concernant l'atelier", qui contient les éléments suivants :

    • Le bouton "Ouvrir la console Google Cloud"
    • Le temps restant
    • Les identifiants temporaires que vous devez utiliser pour cet atelier
    • Des informations complémentaires vous permettant d'effectuer l'atelier
  2. Cliquez sur Ouvrir la console Google Cloud (ou effectuez un clic droit et sélectionnez Ouvrir le lien dans la fenêtre de navigation privée si vous utilisez le navigateur Chrome).

    L'atelier lance les ressources, puis ouvre la page "Se connecter" dans un nouvel onglet.

    Conseil : Réorganisez les onglets dans des fenêtres distinctes, placées côte à côte.

    Remarque : Si la boîte de dialogue Sélectionner un compte s'affiche, cliquez sur Utiliser un autre compte.
  3. Si nécessaire, copiez le nom d'utilisateur ci-dessous et collez-le dans la boîte de dialogue Se connecter.

    {{{user_0.username | "Username"}}}

    Vous trouverez également le nom d'utilisateur dans le panneau "Détails concernant l'atelier".

  4. Cliquez sur Suivant.

  5. Copiez le mot de passe ci-dessous et collez-le dans la boîte de dialogue Bienvenue.

    {{{user_0.password | "Password"}}}

    Vous trouverez également le mot de passe dans le panneau "Détails concernant l'atelier".

  6. Cliquez sur Suivant.

    Important : Vous devez utiliser les identifiants fournis pour l'atelier. Ne saisissez pas ceux de votre compte Google Cloud. Remarque : Si vous utilisez votre propre compte Google Cloud pour cet atelier, des frais supplémentaires peuvent vous être facturés.
  7. Accédez aux pages suivantes :

    • Acceptez les conditions d'utilisation.
    • N'ajoutez pas d'options de récupération ni d'authentification à deux facteurs (ce compte est temporaire).
    • Ne vous inscrivez pas à des essais sans frais.

Après quelques instants, la console Cloud s'ouvre dans cet onglet.

Remarque : Pour accéder aux produits et services Google Cloud, cliquez sur le menu de navigation ou saisissez le nom du service ou du produit dans le champ Recherche. Icône du menu de navigation et champ de recherche

Activer Cloud Shell

Cloud Shell est une machine virtuelle qui contient de nombreux outils pour les développeurs. Elle comprend un répertoire d'accueil persistant de 5 Go et s'exécute sur Google Cloud. Cloud Shell vous permet d'accéder via une ligne de commande à vos ressources Google Cloud.

  1. Cliquez sur Activer Cloud Shell Icône Activer Cloud Shell en haut de la console Google Cloud.

  2. Passez les fenêtres suivantes :

    • Accédez à la fenêtre d'informations de Cloud Shell.
    • Autorisez Cloud Shell à utiliser vos identifiants pour effectuer des appels d'API Google Cloud.

Une fois connecté, vous êtes en principe authentifié et le projet est défini sur votre ID_PROJET : . Le résultat contient une ligne qui déclare l'ID_PROJET pour cette session :

Your Cloud Platform project in this session is set to {{{project_0.project_id | "PROJECT_ID"}}}

gcloud est l'outil de ligne de commande pour Google Cloud. Il est préinstallé sur Cloud Shell et permet la complétion par tabulation.

  1. (Facultatif) Vous pouvez lister les noms des comptes actifs à l'aide de cette commande :
gcloud auth list
  1. Cliquez sur Autoriser.

Résultat :

ACTIVE: * ACCOUNT: {{{user_0.username | "ACCOUNT"}}} To set the active account, run: $ gcloud config set account `ACCOUNT`
  1. (Facultatif) Vous pouvez lister les ID de projet à l'aide de cette commande :
gcloud config list project

Résultat :

[core] project = {{{project_0.project_id | "PROJECT_ID"}}} Remarque : Pour consulter la documentation complète sur gcloud, dans Google Cloud, accédez au guide de présentation de la gcloud CLI.

Tâche 1 : Activer l'API Document AI

Avant de pouvoir utiliser Document AI, vous devez activer l'API.

  1. Dans Cloud Shell, exécutez la commande suivante pour activer l'API Document AI.
gcloud services enable documentai.googleapis.com

L'écran qui s'affiche devrait ressembler à ce qui suit :

Operation "operations/..." finished successfully.
  1. Exécutez la commande suivante pour installer les bibliothèques clientes Python pour Document AI.
pip3 install --upgrade google-cloud-documentai

L'écran qui s'affiche devrait ressembler à ce qui suit :

... Installing collected packages: google-cloud-documentai Successfully installed google-cloud-documentai-2.15.0

Vous êtes maintenant prêt à utiliser l'API Document AI.

Activer l'API Document AI

Tâche 2 : Créer un processeur

Vous devez d'abord créer le processeur d'extraction de document personnalisée que vous allez utiliser pour cet atelier.

Vous devez d'abord créer une instance d'analyseur de formulaires à utiliser sur la plate-forme Document AI lors de ce tutoriel.

  1. Dans le menu de navigation, sélectionnez Afficher tous les produits. Sous Intelligence artificielle, sélectionnez Document AI.

Page de présentation de Document AI

  1. Cliquez sur Créer un processeur personnalisé.

  2. Dans la zone Extracteur personnalisé, cliquez sur Créer un processeur.

  3. Donnez-lui le nom lab-custom-extractor et sélectionnez la région US (États-Unis) dans la liste.

  4. Cliquez sur Créer pour créer le processeur.

Cliquez sur Vérifier ma progression pour valider l'objectif.

Créer un processeur

Tâche 3 : Définir les champs du processeur

Vous êtes maintenant sur la page de présentation du processeur que vous venez de créer.

Page de présentation de l'extraction de documents personnalisée

Vous pouvez spécifier les champs que vous souhaitez extraire à l'aide de celui-ci et commencer à étiqueter les documents.

  1. Cliquez sur l'onglet Premiers pas. Le menu Champs s'affiche.

  2. Cliquez sur Créer un champ.

  3. Saisissez le nom du champ. Sélectionnez le type de données et l'occurrence. Cliquez sur Créer. Consultez la section Définir le schéma du processeur pour obtenir des instructions détaillées sur la création et la modification d'un schéma.

  4. Créez chacune des étiquettes suivantes pour le schéma du processeur.

Nom Type de données Occurrence
control_number Nombre Facultatif multiple
employees_social_security_number Nombre Obligatoire multiple
employer_identification_number Nombre Obligatoire multiple
employers_name_address_and_zip_code Adresse Obligatoire multiple
federal_income_tax_withheld Argent Obligatoire multiple
social_security_tax_withheld Argent Obligatoire multiple
social_security_wages Argent Obligatoire multiple
wages_tips_other_compensation Argent Obligatoire multiple

Vous pouvez également créer et utiliser d'autres types d'étiquettes dans le schéma de votre processeur, tels que des cases à cocher et des entités tabulaires. Par exemple, les formulaires W-2 contiennent des cases à cocher Statutory employee (Employé légal), Retirement plan (Régime de retraite) et Third party sick pay (Indemnités tierces en cas de maladie) que vous pouvez également ajouter au schéma.

créer et gérer des étiquettes pour différents champs

Cliquez sur Vérifier ma progression pour valider l'objectif. Créer des étiquettes

Tâche 4 : Importer un exemple de document

Ensuite, vous allez importer un exemple de PDF W-2 et lui attribuer une étiquette.

  1. Cliquez sur Importer un exemple de document.

  2. Dans la barre latérale, cliquez sur Importer des documents depuis Google Cloud Storage.

  3. Pour cet exemple, saisissez le nom de ce bucket dans le chemin source. Cela renvoie directement vers un document.

cloud-samples-data/documentai/Custom/W2/PDF/W2_XL_input_clean_2950.pdf
  1. Cliquez sur Importer.

Vous êtes redirigé vers la console d'étiquetage.

Tâche 5 : Ajouter une étiquette à un document

Le processus de sélection de texte dans un document et d'application d'étiquettes est appelé annotation.

  1. Lorsque vous vous trouvez dans la console d'étiquetage, notez que de nombreuses étiquettes sont déjà renseignées.

étiquettes générées sur l'exemple de document

Remarque : Les résultats peuvent différer légèrement de ceux de l'exemple.
  1. Pour utiliser les étiquettes suggérées, pointez sur chacune des étiquettes dans le panneau latéral, puis cliquez sur la coche pour confirmer qu'elles sont correctes. Vous pouvez modifier les valeurs si elles ne correspondent pas au texte du document.

  2. Dans cet exemple, les valeurs au bas du document n'ont pas été identifiées automatiquement. Vous devez donc les étiqueter manuellement.

  3. Utilisez l'outil Cadre de délimitation par défaut ou Sélectionner du texte pour les valeurs multilignes, afin de sélectionner le contenu et de lui appliquer l'étiquette.

Remarque : L'outil Sélectionner du texte ne fonctionne pas pour toutes les valeurs textuelles. Utilisez Cadre de délimitation si nécessaire. Vous pouvez également sélectionner des champs non textuels tels que des cases à cocher à l'aide de l'outil Cadre de délimitation.
  1. Dans cet exemple, la valeur de wages_tips_other_compensation a été sélectionnée à l'aide de l'outil Cadre de délimitation, et cette étiquette a été appliquée.

sélectionner des salaires avec l'outil cadre de délimitation

  1. Examinez les valeurs textuelles détectées afin de vous assurer qu'elles correspondent au texte exact du document.

Une fois l'opération terminée, le document W-2 étiqueté devrait se présenter comme suit :

document W-2 étiqueté

  1. Si nécessaire, vous pouvez cliquer sur Créer un champ pour ajouter un champ au schéma à partir de cette page.

  2. Cliquez sur Marquer comme étiqueté lorsque vous avez terminé d'annoter le document.

Vous êtes redirigé vers l'onglet Premiers pas.

Tâche 6 : Créer une version du processeur à l'aide du modèle de fondation

Après avoir étiqueté un seul document, vous pouvez créer une version du processeur à l'aide du modèle de fondation pré-entraîné pour extraire des entités.

  1. Cliquez sur l'onglet Build.

cliquez sur l'onglet "Build"

  1. Sous Appeler un modèle de fondation, cliquez sur Créer une version.

  2. Saisissez un nom pour la version de votre processeur, par exemple w2-foundation-model.

  3. Cliquez sur Créer. La création prend quelques minutes.

Remarque : Une fois que vous avez créé une version du processeur, vous ne pouvez pas supprimer les champs que vous avez créés. Vous pouvez les désactiver sur leurs pages respectives si vous n'en avez plus besoin.
  1. (Facultatif) Cliquez sur l'onglet Déployer et utiliser. Vous pouvez y consulter les versions du processeur disponibles et l'état de déploiement de la nouvelle version.

Vous allez tester et évaluer cette version dans la suite de cet atelier.

Cliquez sur Vérifier ma progression pour valider l'objectif.

Créer une version du processeur à l'aide du modèle de fondation

Tâche 7 : Utiliser l'IA générative pour étiqueter automatiquement des documents

Le modèle de fondation peut extraire avec précision des champs à partir de types de documents divers, mais vous pouvez également fournir des données d'entraînement supplémentaires afin d'améliorer sa justesse pour des structures de documents spécifiques.

Document AI Workbench utilise les noms d'étiquettes que vous avez définis et les annotations précédentes pour faciliter et accélérer l'étiquetage des documents à grande échelle grâce à l'étiquetage automatique.

  1. Accédez à la page Build.

  2. Cliquez sur Importer des documents.

  3. Dans la barre latérale, cliquez sur Importer des documents depuis Google Cloud Storage.

  4. Saisissez le nom de ce bucket dans Chemin source. Il contient des PDF W-2 non étiquetés.

cloud-samples-data/documentai/Custom/W2/AutoLabel
  1. Dans la liste Répartition des données, sélectionnez Répartition automatique. Les documents sont automatiquement répartis de la manière suivante : 80 % dans l'ensemble d'entraînement et 20 % dans l'ensemble de test.

  2. Dans la section Étiquetage automatique, cochez la case Importer avec l'étiquetage automatique.

  3. Sélectionnez la version du processeur du modèle de fondation que vous venez de créer pour étiqueter les documents.

  4. Cliquez sur Importer et attendez que les documents soient importés. Vous pouvez quitter cette page et y revenir plus tard.

  5. Vous devez vérifier les documents étiquetés automatiquement avant de pouvoir les utiliser à des fins d'entraînement ou de test. Cliquez sur Démarrer l'étiquetage pour afficher les documents étiquetés automatiquement.

  6. Pour utiliser les étiquettes suggérées, pointez sur chaque annotation, puis cliquez sur la coche pour confirmer qu'elle est correcte. Vous pouvez modifier les valeurs si elles ne correspondent pas au texte du document.

  7. Cliquez sur Marquer comme étiqueté lorsque vous avez terminé d'annoter le document.

  8. Répétez l'opération pour chaque document étiqueté automatiquement. Pour ce tutoriel, vous pouvez ignorer les documents dont l'étiquetage automatique a échoué.

Tâche 8 : Importer des documents d'entraînement pré-étiquetés

Cet atelier vous fournit des données pré-étiquetées. Si vous utilisez votre propre projet, vous devez déterminer comment étiqueter vos données. Pour en savoir plus, consultez la section Options d'étiquetage. En général, plus la quantité de données d'entraînement est importante, plus la justesse est élevée.

  1. Accédez à la page Build.

  2. Cliquez sur Importer des documents.

  3. Dans la barre latérale, cliquez sur Importer des documents depuis Google Cloud Storage.

  4. Saisissez le chemin suivant dans Chemin source. Ce bucket contient des documents pré-étiquetés au format Document JSON.

cloud-samples-data/documentai/Custom/W2/JSON-2
  1. Dans la liste Répartition des données, sélectionnez Répartition automatique. Les documents sont automatiquement répartis de la manière suivante : 80 % dans l'ensemble d'entraînement et 20 % dans l'ensemble de test. Ne cochez pas la case Importer avec l'étiquetage automatique.

  2. Cliquez sur Importer. L'importation prend plusieurs minutes.

  3. (Facultatif) Sur la page Build, vous pouvez accéder à la console Gérer l'ensemble de données pour afficher et modifier tous les documents et étiquettes de l'ensemble de données.

Tâche 9 : Entraîner le processeur

Maintenant que vous disposez de suffisamment de données d'entraînement et de test, vous pouvez entraîner le processeur. Comme l'entraînement peut prendre plusieurs heures, assurez-vous d'avoir configuré le processeur avec des données et des étiquettes adaptées avant de commencer l'entraînement.

  1. Sous Entraîner un modèle personnalisé, cliquez sur Créer une version.

    S'il n'est pas possible de cliquer sur Créer une version, cliquez sur Voir toutes les conditions requises pour en savoir plus sur les exigences concernant l'ensemble de données.

  2. Dans le champ Nom de la version, saisissez un nom pour cette version du processeur (par exemple, w2-custom-model).

  3. (Facultatif) Cliquez sur Afficher les statistiques d'étiquette pour accéder à des informations sur les étiquettes des documents. Cela peut vous aider à déterminer votre couverture. Cliquez sur Fermer pour revenir à la configuration de l'entraînement.

  4. Sous Méthode d'entraînement du modèle, sélectionnez Basée sur un modèle.

  5. Cliquez sur Démarrer l'entraînement.

  6. (Facultatif) Cliquez sur l'onglet Déployer et utiliser. Vous pouvez y consulter les versions du processeur disponibles et l'état d'entraînement de la nouvelle version.

afficher l'état de l'entraînement du processeur personnalisé

Cliquez sur Vérifier ma progression pour valider l'objectif.

Entraîner le modèle

Parfait ! Vous avez lancé l'entraînement de votre premier processeur Document AI personnalisé. Comme le job d'entraînement prendra environ quelques heures, l'atelier s'arrête ici. Si vous souhaitez savoir comment déployer et tester la version du modèle, consultez la section suivante de la documentation.

Félicitations !

Félicitations, vous avez utilisé Document AI pour créer un processeur d'extraction de document personnalisée, importer un ensemble de données et étiqueter des exemples de documents. Vous pouvez désormais utiliser ce processeur pour analyser des documents dans ce format, exactement comme vous le feriez avec tout autre processeur spécialisé. Vous pouvez également utiliser ce processeur pour étiqueter de nouveaux documents à l'aide de l'étiquetage automatique, ainsi que Document AI Workbench pour gérer vos données et vos jobs d'entraînement.

Étapes suivantes et informations supplémentaires

Consultez les ressources suivantes pour en savoir plus sur Document AI et la bibliothèque cliente Python :

Formations et certifications Google Cloud

Les formations et certifications Google Cloud vous aident à tirer pleinement parti des technologies Google Cloud. Nos cours portent sur les compétences techniques et les bonnes pratiques à suivre pour être rapidement opérationnel et poursuivre votre apprentissage. Nous proposons des formations pour tous les niveaux, à la demande, en salle et à distance, pour nous adapter aux emplois du temps de chacun. Les certifications vous permettent de valider et de démontrer vos compétences et votre expérience en matière de technologies Google Cloud.

Dernière mise à jour du manuel : 17 mars 2025

Dernier test de l'atelier : 17 mars 2025

Copyright 2025 Google LLC. Tous droits réservés. Google et le logo Google sont des marques de Google LLC. Tous les autres noms d'entreprises et de produits peuvent être des marques des entreprises auxquelles ils sont associés.

Avant de commencer

  1. Les ateliers créent un projet Google Cloud et des ressources pour une durée déterminée.
  2. Les ateliers doivent être effectués dans le délai imparti et ne peuvent pas être mis en pause. Si vous quittez l'atelier, vous devrez le recommencer depuis le début.
  3. En haut à gauche de l'écran, cliquez sur Démarrer l'atelier pour commencer.

Utilisez la navigation privée

  1. Copiez le nom d'utilisateur et le mot de passe fournis pour l'atelier
  2. Cliquez sur Ouvrir la console en navigation privée

Connectez-vous à la console

  1. Connectez-vous à l'aide des identifiants qui vous ont été attribués pour l'atelier. L'utilisation d'autres identifiants peut entraîner des erreurs ou des frais.
  2. Acceptez les conditions d'utilisation et ignorez la page concernant les ressources de récupération des données.
  3. Ne cliquez pas sur Terminer l'atelier, à moins que vous n'ayez terminé l'atelier ou que vous ne vouliez le recommencer, car cela effacera votre travail et supprimera le projet.

Ce contenu n'est pas disponible pour le moment

Nous vous préviendrons par e-mail lorsqu'il sera disponible

Parfait !

Nous vous contacterons par e-mail s'il devient disponible

Un atelier à la fois

Confirmez pour mettre fin à tous les ateliers existants et démarrer celui-ci

Utilisez la navigation privée pour effectuer l'atelier

Ouvrez une fenêtre de navigateur en mode navigation privée pour effectuer cet atelier. Vous éviterez ainsi les conflits entre votre compte personnel et le compte temporaire de participant, qui pourraient entraîner des frais supplémentaires facturés sur votre compte personnel.