🇫🇷 Maîtrisez le nœud Information Extractor

Accueil » 📂N8N » 📂Noeuds » 🇫🇷 Maîtrisez le nœud Information Extractor

Valentin Charrier présentant le guide complet du Noeud Information Extractor N8N Français

Le nœud Information Extractor de N8N utilise l’intelligence artificielle pour extraire automatiquement des données structurées depuis n’importe quel texte. Noms, prénoms, âges, emails, numéros de téléphone : vous définissez un schéma JSON et l’IA analyse le contenu pour en extraire les informations correspondantes. Ce nœud transforme des textes non structurés (emails, PDF, pages web) en données exploitables dans vos workflows d’automatisation.

Qu’est-ce que le nœud Information Extractor ?

Le nœud Information Extractor analyse un texte en entrée et en extrait des informations selon un schéma que vous définissez. Contrairement aux expressions régulières (regex) qui nécessitent des patterns précis, ce nœud utilise un modèle d’IA (GPT, Claude, Mistral) pour comprendre le contexte et identifier les données pertinentes, même si elles sont dispersées ou formulées différemment.

Exemple concret : vous recevez un email contenant « Bonjour, je suis Marie Dupont, j’ai 34 ans et vous pouvez me joindre au 06 12 34 56 78 ». Le nœud extrait automatiquement : nom = « Dupont », prénom = « Marie », âge = 34, téléphone = « 06 12 34 56 78 ».

Configurer le modèle IA

Le nœud Information Extractor nécessite un modèle d’IA connecté. Vous pouvez utiliser OpenAI directement ou passer par un agrégateur comme OpenRouter qui donne accès à plusieurs modèles.

Connexion du modèle

Ajoutez le nœud Information Extractor à votre workflow. Sur le côté gauche, vous verrez une entrée pour le modèle IA. Connectez-y un nœud de modèle (OpenAI, OpenRouter, Anthropic, etc.).

Choix du modèle

Pour l’extraction d’informations simples, un modèle léger comme GPT-4.1 mini suffit amplement. Il est rapide, économique et performant pour ce type de tâche. Réservez les modèles plus puissants (GPT-4, Claude 3.5) pour des extractions complexes ou des textes ambigus.

Panneau Settings : paramètres avancés

Le panneau Settings du nœud contient plusieurs options importantes pour contrôler le comportement de l’extraction.

Always Output Data

Activez cette option pour garantir une sortie même si aucune information n’est extraite. Le workflow continue vers le nœud suivant avec une donnée vide plutôt que de s’arrêter. Utile pour éviter les blocages dans des workflows complexes.

Execute Once

Quand vous avez plusieurs items en entrée, cette option exécute le nœud uniquement sur le premier item. Pratique pour tester votre configuration avant de traiter un lot complet.

Retry on Fail

Configure les tentatives en cas d’erreur. Vous pouvez définir le nombre de réessais, le délai entre chaque tentative, et le comportement final (continuer sur une branche alternative ou arrêter le workflow).

Description et titre

Ajoutez une description explicite (ex: « Extraction prénom, nom, âge ») et activez « Display Note in Flow » pour afficher cette description directement sur le nœud dans l’éditeur. Facilite la lecture des workflows complexes.

Configurer le schéma type

Le schéma type définit les informations que l’IA doit extraire du texte. C’est le cœur de la configuration du nœud. N8N propose plusieurs méthodes pour définir ce schéma.

Méthode 1 : From Attribute Description

La méthode la plus simple : vous ajoutez manuellement chaque champ à extraire avec son type et sa description.

Nom du champ : identifiant technique (ex: « nom », « prenom », « age »)
Type : string (texte), number (nombre), boolean (vrai/faux)
Description : explication pour l’IA (ex: « Le nom de famille d’une personne »)
Required : cochez si le champ est obligatoire

Limitation : cette méthode extrait un seul résultat. Si votre texte contient plusieurs personnes, seule la première sera extraite.

Méthode 2 : Auto Format JSON

Vous définissez la structure de sortie en JSON. Plus technique mais plus précis.

{
  "nom": {
    "type": "string"
  },
  "prenom": {
    "type": "string"
  },
  "age": {
    "type": "number"
  }
}

Même limitation : un seul résultat en sortie.

Méthode 3 : Generate from JSON Example (recommandée)

La méthode la plus puissante : vous fournissez un exemple de la structure attendue. Pour extraire plusieurs résultats, utilisez un tableau.

[
  {
    "nom": "nom d'une personne",
    "prenom": "prénom d'une personne",
    "age": 30
  }
]

Les crochets [ ] indiquent un tableau : l’IA comprend qu’elle doit extraire toutes les occurrences, pas seulement la première. La valeur 30 pour l’âge indique que c’est un nombre (et non une chaîne de caractères).

Extraction simple vs extraction multiple

Méthode	Résultats	Usage
From Attribute Description	1 seul	Email unique, titre de document
Auto Format JSON (objet)	1 seul	Fiche contact unique
Generate from JSON Example (tableau)	Multiples	Liste de contacts, tous les emails d’un texte

Traiter les résultats avec Split Out

Quand vous utilisez l’extraction multiple, le nœud Information Extractor retourne un seul item contenant un tableau. Pour traiter chaque élément individuellement dans la suite du workflow, utilisez le nœud Split Out.

Configuration

Ajoutez un nœud Split Out après Information Extractor. Dans le champ « Fields To Split Out », sélectionnez output (ou glissez-déposez le champ depuis le panneau de données). Le nœud transforme le tableau en items individuels.

Exemple

Entrée (1 item) : { output: [{nom: "Dupont"}, {nom: "Martin"}, {nom: "Bernard"}] }

Sortie (3 items) : {nom: "Dupont"}, {nom: "Martin"}, {nom: "Bernard"}

Vous pouvez ensuite itérer sur chaque personne pour créer des fiches contacts, envoyer des emails personnalisés, etc.

Options avancées

System Prompt amélioré

Dans les options du nœud, vous pouvez ajouter un prompt système personnalisé pour guider l’IA. Exemple : « Extrait tous les noms, prénoms et âges que tu trouves. Ignore les mentions de personnes fictives ou les exemples. »

Badge Processing

Le réglage « Badge Processing » affine le comportement de l’extraction. Le mode par défaut « from attribute description » convient pour les extractions simples. Pour des extractions multiples, privilégiez les formats JSON.

Cas d’usage pratiques

Traitement d’emails : extraire automatiquement nom, email, téléphone des demandes de contact
Analyse de CV : récupérer compétences, expériences, formations depuis des PDF
Scraping intelligent : extraire des données structurées depuis des pages web
Qualification de leads : identifier entreprise, poste, budget mentionnés dans un message
Extraction de factures : récupérer montant, date, numéro de facture depuis des documents

Comprendre les symboles du schéma de données

Dans l’interface N8N, les icônes à côté des champs indiquent leur type :

Traits horizontaux empilés : tableau (plusieurs éléments)
Forme de carton/boîte : objet (structure avec propriétés)
AB : chaîne de caractères (string)
# : nombre (number)

Ces indicateurs visuels permettent de vérifier rapidement que la structure de sortie correspond à vos attentes.

Quotien Intellectuel pour illustrer l'apprentissage du noeud N8N

Comment configurer le nœud Information Extractor pour extraire plusieurs personnes d'un même texte ?

Activez 'Execute Once' dans les Settings pour que le nœud analyse le texte plusieurs fois et agrège les résultats. Utilisez la méthode 'Generate from JSON Example' avec un tableau (crochets [ ]) contenant un objet exemple. L'IA comprend qu'elle doit extraire toutes les occurrences correspondant à ce modèle. Connectez plusieurs nœuds Information Extractor en série, chacun configuré pour extraire une personne différente. Utilisez la méthode 'From Attribute Description' et cochez l'option 'Extract Multiple'. Le nœud parcourt automatiquement le texte pour trouver toutes les correspondances.

Conclusion

Le nœud Information Extractor transforme des textes non structurés en données exploitables grâce à l’IA. La clé d’une extraction réussie réside dans le choix du bon schéma : utilisez « Generate from JSON Example » avec un tableau pour extraire plusieurs éléments, puis le nœud Split Out pour les traiter individuellement.

Ce nœud ouvre des possibilités d’automatisation puissantes : traitement d’emails, analyse de documents, qualification de leads. Pour aller plus loin, explorez nos autres ressources N8N ou contactez notre équipe pour un accompagnement sur vos workflows d’extraction de données.

Qu’est-ce que le nœud Information Extractor dans N8N ?

Le nœud Information Extractor utilise l’intelligence artificielle pour extraire automatiquement des données structurées (noms, emails, téléphones, dates…) depuis n’importe quel texte. Vous définissez un schéma JSON décrivant les informations à extraire, et l’IA analyse le contenu pour les identifier et les retourner au format structuré.

Quel modèle IA utiliser avec Information Extractor ?

Pour des extractions simples (noms, emails, numéros), un modèle léger comme GPT-4.1 mini suffit : il est rapide et économique. Réservez les modèles plus puissants (GPT-4, Claude 3.5) pour des textes complexes, ambigus ou des extractions nécessitant une compréhension fine du contexte.

Comment extraire plusieurs éléments d’un même texte ?

Utilisez la méthode ‘Generate from JSON Example’ avec un tableau (crochets [ ]) contenant un objet exemple. Les méthodes ‘From Attribute Description’ et ‘Auto Format JSON’ avec un objet simple n’extraient qu’un seul résultat. Le tableau indique à l’IA de chercher toutes les occurrences.

À quoi sert le nœud Split Out après Information Extractor ?

Quand Information Extractor retourne un tableau (plusieurs résultats), Split Out transforme ce tableau en items individuels. Si vous extrayez 21 personnes d’un texte, vous obtenez 1 item contenant un tableau de 21 éléments. Split Out le convertit en 21 items distincts pour les traiter un par un dans la suite du workflow.

Que fait l’option Always Output Data dans les Settings ?

Always Output Data garantit une sortie même si aucune information n’est extraite. Le workflow continue vers le nœud suivant avec une donnée vide plutôt que de s’arrêter. C’est utile pour éviter les blocages dans des workflows où l’absence de données est un cas normal à gérer.

Peut-on utiliser Information Extractor sur des PDF ou des pages web ?

Oui, à condition de convertir d’abord le contenu en texte. Pour un PDF, utilisez un nœud de lecture PDF qui extrait le texte, puis passez ce texte à Information Extractor. Pour une page web, utilisez un nœud HTTP Request suivi d’un nœud HTML Extract pour récupérer le contenu textuel.