Extractor de Emails
Extrae todas las direcciones de email de cualquier texto.
Por qué usarlo
Limpia y extrae emails en segundos
RFC 5322 compliant
Detecta todos los formatos de email válidos incluyendo nuevos TLDs y subdominios.
100% privado
Tu texto nunca sale del navegador. Sin envíos a servidor, sin logs.
Sin duplicados
Deduplicación automática. Cada email aparece una sola vez en el resultado.
Instantáneo
Extracción en milisegundos, sin importar la longitud del texto.
Cómo funciona
Tres pasos, sin complicaciones
Pega tu texto
Pega el contenido del que quieres extraer emails: texto plano, HTML, código fuente, listas.
Extracción automática
El extractor detecta todas las direcciones de email válidas al instante usando el patrón RFC 5322.
Copia la lista limpia
Obtén la lista deduplicada de emails, una por línea, lista para usar.
Preguntas frecuentes
¿Tienes dudas?
El extractor usa un patrón basado en RFC 5322, el estándar que define el formato de las direcciones de correo electrónico de Internet. El patrón detecta la parte local (antes de @), que puede contener letras, números, puntos, guiones y signos más, seguida de @ y el dominio. El dominio puede incluir subdominios y acepta cualquier TLD válido, incluyendo los nuevos TLDs de más de 3 caracteres como .academy, .photography o .email.
El extractor reconoce direcciones con subdominios en el dominio (usuario@mail.empresa.com) y con TLDs de cualquier longitud (usuario@ejemplo.photography). No está limitado a .com, .net, .org — acepta todos los TLDs registrados por ICANN, incluyendo los más de 1500 TLDs genéricos y de países disponibles actualmente. Las direcciones con caracteres Unicode en el dominio (internacionalizados) no se detectan, ya que requieren conversión Punycode previa.
Sí. El extractor deduplicado de emails elimina automáticamente las direcciones repetidas del resultado. La comparación es insensible a mayúsculas/minúsculas según la especificación: la parte local es teóricamente case-sensitive según RFC 5321, pero en la práctica todos los servidores de correo modernos la tratan como insensible. El resultado final contiene cada dirección única una sola vez, en orden de aparición.
El procesamiento ocurre completamente en tu navegador — el texto que pegas nunca se envía a ningún servidor. Esto es especialmente importante cuando trabajas con texto que contiene información personal. Ten en cuenta que extraer emails de sitios web sin permiso puede violar la política de privacidad del sitio y, en la Unión Europea, el Reglamento General de Protección de Datos (GDPR), que protege las direcciones de email como datos personales y limita su recopilación y uso sin consentimiento.
Los casos de uso más comunes son: limpiar y consolidar listas de contactos de múltiples fuentes, extraer emails de documentos exportados de CRMs o ERPs, recopilar direcciones de respuestas a newsletters o formularios, analizar archivos de log en busca de emails de usuarios, verificar qué emails hay en un bloque de texto antes de importarlo, y extraer contactos de archivos de texto plano o exportaciones CSV con formato irregular.
El formato de email según RFC 5322 y la ética del scraping
El formato de las direcciones de correo electrónico está definido por RFC 5322 (Internet Message Format), publicado en 2008 como actualización del RFC 2822, que a su vez actualizó el RFC 822 original de 1982. La especificación distingue la parte local (antes del @) del dominio. La parte local puede contener caracteres alfanuméricos y especiales como puntos, guiones, signos más y comillas, aunque en la práctica los servidores modernos solo aceptan un subconjunto. El dominio debe ser un nombre de host válido con al menos un punto.
La recopilación masiva de emails (email scraping) tiene implicaciones legales y éticas significativas. El GDPR (Reglamento General de Protección de Datos) en la Unión Europea clasifica las direcciones de email como datos personales y requiere base legal para su tratamiento. La CAN-SPAM Act en Estados Unidos regula el uso de emails recopilados para marketing. La Computer Fraud and Abuse Act (CFAA) ha sido usada para procesar el scraping no autorizado de datos. El uso más ético es limpiar y procesar datos de los que ya tienes autorización.
En los flujos de trabajo de limpieza de datos (data cleaning), el extractor de emails es una herramienta habitual en pipelines de ETL (Extract, Transform, Load). Los formatos de entrada más comunes son: exportaciones CSV de CRMs con emails mezclados en campos de notas, archivos de texto con correspondencia copiada, respuestas a formularios con formato libre, y exportaciones de bases de datos en JSON o XML. La deduplicación es el paso más crítico antes de importar a herramientas de email marketing como Mailchimp, ActiveCampaign o HubSpot.