DocumentsImagesMédiasOutils PDF

Email Extractor en Ligne

Extrait toutes les adresses e-mail de n'importe quel texte en un instant.

Traité dans votre navigateur — aucun texte envoyé à un serveur

Nettoie et extrais des e-mails en quelques secondes

Conforme RFC 5322

Détecte tous les formats d'e-mail valides, y compris les nouveaux TLD et les sous-domaines.

100 % privé

Ton texte ne quitte jamais le navigateur. Aucun envoi à un serveur, aucun log.

Sans doublons

Déduplication automatique. Chaque e-mail n'apparaît qu'une seule fois dans le résultat.

Instantané

Extraction en quelques millisecondes, quelle que soit la longueur du texte.

Trois étapes, sans complications

1

Colle ton texte

Colle le contenu dont tu veux extraire des e-mails : texte brut, HTML, code source, listes.

2

Extraction automatique

L'extracteur détecte toutes les adresses e-mail valides instantanément en utilisant le motif RFC 5322.

3

Copie la liste propre

Obtiens la liste dédupliquée d'e-mails, une adresse par ligne, prête à l'emploi.

Des questions ?

L'extracteur utilise un motif basé sur RFC 5322, le standard qui définit le format des adresses e-mail sur Internet. Le motif détecte la partie locale (avant @), qui peut contenir des lettres, chiffres, points, tirets et signes plus, suivie de @ et du domaine. Le domaine peut inclure des sous-domaines et accepte n'importe quel TLD valide, y compris les nouveaux TLD de plus de 3 caractères comme .academy, .photography ou .email.

L'extracteur reconnaît les adresses avec des sous-domaines (utilisateur@mail.entreprise.com) et des TLD de n'importe quelle longueur (utilisateur@exemple.photography). Il n'est pas limité à .com, .net, .org — il accepte tous les TLD enregistrés auprès de l'ICANN, y compris les 1500+ TLD génériques et nationaux actuellement disponibles. Les adresses avec des caractères Unicode dans le domaine ne sont pas détectées car elles nécessitent une conversion Punycode préalable.

Oui. L'extracteur supprime automatiquement les adresses en double. La comparaison est insensible à la casse en pratique : bien que la partie locale soit techniquement sensible à la casse selon RFC 5321, tous les serveurs de messagerie modernes la traitent comme insensible. Le résultat final contient chaque adresse unique exactement une fois, dans l'ordre d'apparition.

Le traitement se fait entièrement dans ton navigateur — le texte que tu colles n'est jamais envoyé à un serveur. C'est particulièrement important quand tu travailles avec du texte contenant des informations personnelles. Rappelle-toi qu'extraire des e-mails de sites web sans permission peut violer la politique de confidentialité du site et, dans l'Union européenne, le RGPD, qui protège les adresses e-mail comme données personnelles.

Les cas d'usage les plus courants sont : nettoyer et consolider des listes de contacts provenant de plusieurs sources, extraire des e-mails de documents exportés depuis des CRM ou ERP, collecter des adresses depuis des réponses à des newsletters ou des formulaires, analyser des fichiers de logs, et extraire des contacts depuis des fichiers texte ou des exports CSV avec un format irrégulier.

Format des e-mails selon RFC 5322 et éthique de la collecte d'adresses

Le format des adresses e-mail est défini par RFC 5322 (Internet Message Format), publié en 2008 comme mise à jour de RFC 2822, lui-même une mise à jour du RFC 822 original de 1982. La spécification distingue la partie locale (avant @) du domaine. La partie locale peut contenir des caractères alphanumériques et spéciaux comme des points, tirets et signes plus, bien qu'en pratique les serveurs modernes n'acceptent qu'un sous-ensemble. Le domaine doit être un nom d'hôte valide avec au moins un point.

La collecte massive d'e-mails comporte des implications juridiques et éthiques importantes. Le RGPD dans l'Union européenne classe les adresses e-mail comme données personnelles et exige une base légale pour leur traitement. La loi CAN-SPAM aux États-Unis réglemente l'utilisation des e-mails collectés à des fins marketing. Le Computer Fraud and Abuse Act (CFAA) a été utilisé pour poursuivre le scraping non autorisé de données. L'usage le plus éthique consiste à nettoyer et traiter des données pour lesquelles tu as déjà une autorisation.

Dans les flux de nettoyage de données, l'extracteur d'e-mails est un outil courant dans les pipelines ETL (Extract, Transform, Load). Les formats d'entrée les plus courants sont : exports CSV de CRM avec e-mails mélangés dans des champs de notes, fichiers texte contenant de la correspondance copiée, soumissions en format libre, et exports de bases de données en JSON ou XML. La déduplication est l'étape la plus critique avant l'importation dans des outils d'e-mail marketing comme Mailchimp, ActiveCampaign ou HubSpot.