Pourquoi nous masquons vos données avant tout envoi à l'IA

L’IA, une boîte noire qu’il faut savoir border

L’intelligence artificielle change profondément la façon dont on peut analyser des documents financiers. Là où une équipe humaine mettrait des semaines à éplucher des milliers de factures, un modèle bien instrumenté le fait en quelques heures.

Mais il faut être lucide : ces modèles sont opérés par des fournisseurs tiers (OpenAI, Anthropic). Leur faire passer brut le nom de vos fournisseurs, vos RIB ou vos contacts, c’est partager une cartographie commerciale qui n’a pas à sortir de votre entreprise.

C’est pourquoi nous avons fait un choix très précis : l’IA ne voit jamais vos données telles qu’elles sont.

Le principe : anonymisation par mapping

Avant chaque appel à un modèle d’IA, Finareo fait passer vos documents par une étape d’anonymisation automatique. Concrètement :

Avant (donnée brute)	Après (envoyée à l’IA)
Carrefour Maroc SARL	`SUPP_001`
RIB : 011 780 0000123…	`IBAN_017`
contact@carrefour.ma	`CTC_009`
Cap. social : 50 M MAD	`CAPITAL_AMT`

L’IA voit toujours :

La structure du document (en-tête, lignes de facture, totaux, TVA)
Les montants (essentiels pour détecter une anomalie)
Les dates (essentielles pour les patterns)

Mais elle ne voit jamais qui est qui.

Le mapping ne quitte pas notre infrastructure

La table de correspondance entre SUPP_001 et “Carrefour Maroc SARL” est conservée uniquement sur l’infrastructure Finareo. Elle ne transite jamais vers les fournisseurs d’IA, et n’est jamais loguée côté tiers.

Une fois la réponse de l’IA reçue, nous remettons localement les vrais noms dans le résultat avant de vous l’afficher. Vous voyez les vraies données. Le tiers n’a vu que des tokens.

En complément : Zero Data Retention contractualisé

L’anonymisation ne nous suffisait pas. Nous voulions aussi une garantie contractuelle.

Nos contrats enterprise avec OpenAI et Anthropic incluent une clause de Zero Data Retention :

Aucune donnée envoyée n’est conservée chez eux
Aucune donnée envoyée ne sert à entraîner ou améliorer leurs modèles
Chaque appel est sans état : pas de fonction “conversation”, pas de mémoire

Concrètement, si le fournisseur d’IA était piraté demain, il n’y aurait rien à voler concernant vos documents — ils ne sont tout simplement plus là.

Et côté Finareo ?

Nous gardons trace des appels que nous faisons aux modèles d’IA — mais sans le contenu :

✅ Conservé chez nous : modèle utilisé, durée d’appel, nombre de tokens, identifiant technique
❌ Pas conservé : le contenu envoyé, sauf debug ponctuel avec votre accord explicite

C’est ce qui nous permet de monitorer la qualité du service sans constituer une seconde copie de vos données.

Pourquoi ce choix est important

L’argument simple que nous entendons parfois est : “Les LLM sont déjà sûrs, vous n’avez pas besoin d’anonymisation.” C’est faux pour trois raisons :

La défense en profondeur : plusieurs couches indépendantes valent mieux qu’une seule, même excellente
L’avenir des fournisseurs : leurs politiques peuvent changer, leurs modèles évoluer — l’anonymisation, elle, dépend de nous
La séparation des préoccupations : ce n’est pas au fournisseur d’IA de garantir la confidentialité de vos noms de fournisseurs — c’est à nous

En pratique

Quand vous lisez dans une analyse Finareo que “le fournisseur X a été surfacturé de 12 % sur le contrat Y”, sachez que :

L’IA qui a détecté l’écart n’a jamais vu le nom de X ni le nom du contrat Y
Le rapprochement entre SUPP_001 et “X” a été fait localement, chez nous
Les contrats que nous avons signés avec nos fournisseurs d’IA sont disponibles pour consultation sous NDA

C’est ce que nous appelons travailler avec l’IA — sans lui confier votre business.