DokumenGambarMediaAlat PDF

Ekstrak Email dari Teks Online

Ekstrak semua alamat email dari teks apa pun secara instan.

Diproses di browser Anda - tidak ada teks yang dikirim ke server mana pun

Bersihkan dan ekstrak email dalam hitungan detik

Sesuai RFC 5322

Mendeteksi semua format email yang valid termasuk TLD baru dan subdomain.

100% privat

Teks Anda tidak pernah meninggalkan browser. Tanpa pengiriman ke server, tanpa log.

Tanpa duplikat

Deduplikasi otomatis. Setiap email muncul hanya sekali dalam hasil.

Instan

Ekstraksi dalam milidetik, terlepas dari panjang teks.

Tiga langkah, tanpa kerumitan

1

Tempelkan teks Anda

Tempelkan konten yang ingin Anda ekstrak emailnya: teks biasa, HTML, kode sumber, daftar.

2

Ekstraksi otomatis

Ekstraktor mendeteksi semua alamat email yang valid secara instan menggunakan pola RFC 5322.

3

Salin daftar yang bersih

Dapatkan daftar email yang sudah dideduplikasi, satu per baris, siap digunakan.

Ada pertanyaan?

Ekstraktor menggunakan pola berdasarkan RFC 5322, standar yang mendefinisikan format alamat email Internet. Pola tersebut mendeteksi bagian lokal (sebelum @), yang dapat berisi huruf, angka, titik, tanda hubung, dan tanda plus, diikuti oleh @ dan domain. Domain dapat menyertakan subdomain dan menerima TLD valid apa pun, termasuk TLD baru yang lebih panjang dari 3 karakter seperti .academy, .photography, atau .email.

Ekstraktor mengenali alamat dengan subdomain di bagian domain (user@mail.company.com) dan TLD dengan panjang berapa pun (user@example.photography). Ekstraktor tidak terbatas pada .com, .net, .org, melainkan menerima semua TLD yang terdaftar di ICANN, termasuk lebih dari 1500 TLD generik dan kode negara yang tersedia saat ini. Alamat dengan karakter Unicode di domain (internasionalisasi) tidak terdeteksi karena memerlukan konversi Punycode terlebih dahulu.

Ya. Ekstraktor email secara otomatis menghapus alamat yang duplikat dari hasil. Perbandingan dilakukan tanpa membedakan huruf besar-kecil dalam praktik: meskipun bagian lokal secara teknis bersifat case-sensitive menurut RFC 5321, semua server email modern memperlakukannya sebagai tidak case-sensitive. Hasil akhir berisi setiap alamat unik tepat satu kali, berurutan sesuai kemunculannya.

Pemrosesan terjadi sepenuhnya di browser Anda, teks yang Anda tempelkan tidak pernah dikirim ke server mana pun. Hal ini sangat penting saat bekerja dengan teks yang mengandung informasi pribadi. Perlu dicatat bahwa mengekstrak email dari situs web tanpa izin dapat melanggar kebijakan privasi situs tersebut dan, di Uni Eropa, melanggar GDPR yang melindungi alamat email sebagai data pribadi dan membatasi pengumpulan serta penggunaannya tanpa persetujuan.

Kasus penggunaan yang paling umum adalah: membersihkan dan mengkonsolidasikan daftar kontak dari berbagai sumber, mengekstrak email dari dokumen yang diekspor dari CRM atau ERP, mengumpulkan alamat dari balasan newsletter atau pengiriman formulir, menganalisis file log untuk mencari email pengguna, memeriksa email apa yang ada dalam blok teks sebelum mengimpornya, dan mengekstrak kontak dari file teks biasa atau ekspor CSV dengan format tidak beraturan.

Format email menurut RFC 5322 dan etika pengumpulan data email

Format alamat email didefinisikan oleh RFC 5322 (Internet Message Format), yang diterbitkan pada tahun 2008 sebagai pembaruan RFC 2822, yang sendiri merupakan pembaruan RFC 822 asli dari tahun 1982. Spesifikasi membedakan bagian lokal (sebelum @) dari domain. Bagian lokal dapat berisi karakter alfanumerik dan karakter khusus seperti titik, tanda hubung, tanda plus, dan tanda kutip, meskipun dalam praktiknya server modern hanya menerima subset tertentu. Domain harus berupa nama host yang valid dengan setidaknya satu titik.

Pengumpulan email secara massal memiliki implikasi hukum dan etika yang signifikan. GDPR di Uni Eropa mengklasifikasikan alamat email sebagai data pribadi dan memerlukan dasar hukum untuk pemrosesannya. CAN-SPAM Act di Amerika Serikat mengatur penggunaan email yang dikumpulkan untuk pemasaran. Computer Fraud and Abuse Act (CFAA) telah digunakan untuk menuntut pengambilan data yang tidak sah. Penggunaan paling etis adalah membersihkan dan memproses data yang sudah Anda miliki otorisasinya.

Dalam alur kerja pembersihan data, ekstraktor email merupakan alat umum dalam pipeline ETL (Extract, Transform, Load). Format input yang paling umum adalah: ekspor CSV dari CRM dengan email yang tercampur dalam field catatan, file teks dengan korespondensi yang disalin, pengiriman formulir dalam format bebas, serta ekspor basis data dalam JSON atau XML. Deduplikasi adalah langkah paling penting sebelum mengimpor ke alat pemasaran email seperti Mailchimp, ActiveCampaign, atau HubSpot.