IA locale avec n8n, Ollama et Qdrant : le guide complet

Tu veux automatiser des tâches répétitives avec l’IA locale, mais tu hésites à envoyer tes données sensibles sur des serveurs cloud ? Tu n’es pas seul. De nombreuses PME et TPE freinent leur adoption de l’intelligence artificielle par crainte de la confidentialité, du RGPD, ou simplement parce qu’elles veulent garder le contrôle total sur leurs informations.

Bonne nouvelle : il existe une approche souveraine où l’IA et l’automatisation tournent directement chez toi, sans dépendre d’un service externe. Dans ce guide, je te montre comment combiner n8n (ton moteur d’automatisation), Ollama (l’IA qui tourne en local) et Qdrant (la base vectorielle pour retrouver tes documents). Le tout sans fuite de données.

Pourquoi choisir une IA locale pour ton entreprise ? 🔐

Avant de plonger dans la technique, comprends bien les enjeux. Utiliser une IA en cloud (comme ChatGPT ou Claude) implique d’envoyer tes données sur des serveurs que tu ne contrôles pas. Pour beaucoup d’entreprises, c’est un problème majeur.

Critère	IA Cloud (OpenAI, etc.)	IA Locale (Ollama + n8n)
Confidentialité des données	❌ Données envoyées à l’externe	✅ Tout reste chez toi
Conformité RGPD	⚠️ Complexe à justifier	✅ Maîtrise totale
Coût à l’usage	💰 Paiement par token/requête	✅ Gratuit après installation
Dépendance internet	❌ Nécessite une connexion	✅ Fonctionne hors ligne
Performance	✅ Serveurs puissants	⚠️ Dépend de ton hardware
Mise en place	✅ Immédiate	⚠️ Configuration initiale

💡 Conseil pro : L’IA locale n’est pas forcément moins performante. Les modèles open source comme Llama 3, Mistral ou Qwen 3 rivalisent aujourd’hui avec les modèles propriétaires pour de nombreux cas d’usage en entreprise.

Les 3 piliers de ta stack IA locale avec n8n

Pour construire une infrastructure d’automatisation IA souveraine, tu as besoin de trois composants qui travaillent ensemble :

1. n8n : le chef d’orchestre de tes automatisations

n8n est une plateforme d’automatisation No Code / Low Code que tu peux héberger toi-même. C’est le cœur de ton système : il connecte tes applications, déclenche des workflows et fait communiquer tous tes outils.

Open source et auto-hébergeable
Plus de 400 intégrations natives
Intégration native avec Ollama et Qdrant
Workflows visuels sans coder

2. Ollama : l’IA qui tourne sur ta machine

Ollama te permet de faire tourner des modèles de langage (LLM) directement sur ton serveur ou ton ordinateur. En 2026, Ollama propose plus de 40 000 intégrations et supporte les derniers modèles open source.

Installation en une ligne de commande
Compatible avec Llama 3, Mistral, Qwen 3, CodeLlama…
API compatible OpenAI (facile à intégrer)
Fonctionne sur Mac, Linux et Windows

3. Qdrant : la mémoire vectorielle de ton IA

Qdrant est une base de données vectorielle open source. Elle permet à ton IA de « se souvenir » de tes documents et de retrouver des informations pertinentes. C’est le composant essentiel pour le RAG (Retrieval-Augmented Generation).

Recherche sémantique ultra-rapide
Écrit en Rust pour des performances optimales
Déploiement Docker simple
Utilisé par Bosch, HubSpot, Bayer…

Installation de ta stack IA locale en 15 minutes ⚡

Voici comment mettre en place ta base d’automatisation IA souveraine. Tu auras besoin de Docker installé sur ta machine.

Étape 1 : Installer Ollama

Ollama s’installe en une seule commande sur Linux/Mac :

curl -fsSL https://ollama.com/install.sh | sh

Sur Windows, télécharge l’installateur depuis ollama.com/download.

Ensuite, télécharge un modèle. Pour commencer, je te recommande Llama 3.2 (3B) ou Mistral :

ollama pull llama3.2
# ou
ollama pull mistral

Étape 2 : Lancer Qdrant avec Docker

Démarre Qdrant en une commande :

docker run -p 6333:6333 qdrant/qdrant

Qdrant sera accessible sur http://localhost:6333.

Étape 3 : Configurer n8n avec Docker Compose

Crée un fichier docker-compose.yml :

version: '3.8'
services:
  n8n:
    image: n8nio/n8n:latest
    ports:
      - "5678:5678"
    environment:
      - N8N_HOST=localhost
      - N8N_PORT=5678
      - N8N_PROTOCOL=http
    volumes:
      - n8n_data:/home/node/.n8n
    restart: unless-stopped

volumes:
  n8n_data:

Lance le tout avec :

docker compose up -d

n8n est maintenant accessible sur http://localhost:5678.

Étape 4 : Connecter Ollama dans n8n

Dans n8n, va dans Credentials
Crée une nouvelle credential Ollama
Indique l’URL : http://host.docker.internal:11434 (ou http://localhost:11434 si n8n n’est pas dans Docker)
Teste la connexion

💡 Astuce Docker : Si n8n tourne dans Docker et Ollama sur ta machine hôte, utilise host.docker.internal pour que les conteneurs puissent communiquer.

Créer ton premier workflow IA local 🤖

Maintenant que ta stack est en place, construisons un workflow concret : un assistant qui répond aux questions sur tes documents.

Architecture du workflow

Voici les nœuds dont tu auras besoin :

Chat Trigger : pour recevoir les questions
AI Agent : pour orchestrer la réponse
Ollama Chat Model : ton modèle local
Qdrant Vector Store : pour retrouver les documents pertinents
Embeddings Ollama : pour convertir le texte en vecteurs

Configuration du nœud Ollama Chat Model

Dans n8n, ajoute le nœud Ollama Chat Model avec ces paramètres :

Paramètre	Valeur recommandée
Model	llama3.2 ou mistral
Temperature	0.7 (plus créatif) ou 0.3 (plus précis)
Top P	0.9
Context Window	4096

Exemple de configuration JSON pour l’AI Agent

{
  "systemMessage": "Tu es un assistant d'entreprise. Tu réponds aux questions en te basant uniquement sur les documents fournis. Si tu ne trouves pas l'information, dis-le clairement.",
  "maxIterations": 5,
  "returnIntermediateSteps": false
}

Cas d’usage concrets pour ta PME 📋

Voici des exemples d’automatisations que tu peux mettre en place avec cette stack :

Tri automatique des emails

Configure un workflow qui :

Récupère tes emails entrants via IMAP
Analyse le contenu avec Ollama
Classe automatiquement (urgent, commercial, support…)
Crée des tâches dans ton outil de gestion

Assistant documentation interne

Indexe tes procédures et documentations dans Qdrant, puis :

Tes collaborateurs posent des questions en langage naturel
L’IA retrouve les documents pertinents
Elle génère une réponse contextualisée

Préparation de réponses clients

Quand un ticket arrive :

L’IA analyse la demande
Elle recherche dans l’historique des réponses similaires
Elle propose un brouillon de réponse
Un humain valide avant envoi

🎯 Résultat : Une entreprise de taxi a gagné 15 heures par semaine en automatisant la gestion de ses réservations et la communication client avec n8n.

Optimiser les performances de ton IA locale

Faire tourner une IA en local demande des ressources. Voici mes recommandations :

Configuration matérielle minimale

Composant	Minimum	Recommandé
RAM	8 Go	16-32 Go
CPU	4 cœurs	8+ cœurs
GPU (optionnel)	–	NVIDIA avec 8+ Go VRAM
Stockage	20 Go SSD	50+ Go SSD

Choisir le bon modèle

Plus le modèle est grand, plus il est performant mais gourmand :

Modèles 3B-7B : rapides, tournent sur la plupart des machines
Modèles 13B-30B : meilleure qualité, nécessitent plus de RAM
Modèles 70B+ : qualité premium, GPU recommandé

Pour une PME, je recommande de commencer avec Mistral 7B ou Llama 3.2 3B qui offrent un excellent rapport qualité/ressources.

Sécurité et bonnes pratiques 🛡️

Même en local, applique ces règles de sécurité :

Isole ton infrastructure : n8n, Ollama et Qdrant ne doivent pas être exposés sur Internet sans protection
Configure un reverse proxy : utilise Nginx ou Traefik avec HTTPS
Sauvegarde régulièrement : ta base Qdrant et tes workflows n8n
Mets à jour : les versions récentes corrigent des failles de sécurité
Limite les accès : utilise les fonctionnalités d’authentification de n8n

Aller plus loin : les ressources pour maîtriser ta stack

Tu as maintenant les bases pour déployer une IA locale et souveraine. Pour approfondir :

Explore les nœuds AI Agent de n8n pour des workflows plus complexes
Teste différents modèles Ollama selon tes cas d’usage
Apprends le RAG (Retrieval-Augmented Generation) pour des réponses plus précises
Configure des workflows de veille automatique pour ton secteur

Besoin d’aide pour mettre en place cette stack dans ton entreprise ? Chez Ocade Fusion, on accompagne les PME dans leur transformation avec l’automatisation et l’IA locale. Contacte-nous pour un audit gratuit de tes processus.

Sources :