DokumenGambarMediaAlat PDF

Kompres Audio Online

Kurangi ukuran file audio dengan menurunkan bitrate. Gratis, di browser Anda, tanpa mengunggah file.

Drag your file here

.mp3, .wav, .ogg, .flac, .aac · up to 100 MB

Processed in your browser — file never uploadedFree
Note: The first conversion loads the FFmpeg engine (~25MB). Subsequent conversions will be faster.

Kompresi audio tanpa kehilangan yang penting

Kontrol bitrate

Pilih antara 64 dan 320 kbps. Rumus tepat untuk menghitung ukuran file yang dihasilkan.

100% privat

Kompresi berlangsung di browser Anda. Audio Anda tidak pernah diunggah ke server mana pun.

Kompatibilitas universal

Output dalam MP3 atau AAC. Kompatibel dengan semua perangkat dan platform.

Hingga 80% lebih kecil

Kurangi file audio menjadi sebagian kecil dari ukuran aslinya dalam hitungan detik.

Tiga langkah, tanpa kerumitan

1

Unggah file audio Anda

Seret atau pilih file MP3, AAC, OGG, atau format audio lainnya. Hingga 200 MB, tanpa pendaftaran.

2

Pilih bitrate target

Pilih antara 64 dan 320 kbps untuk kebutuhan Anda. 64-96 kbps untuk suara, 128-192 kbps untuk musik kasual, 256-320 kbps untuk hi-fi.

3

Unduh audio yang dikompresi

Bandingkan ukuran file asli dan baru sebelum mengunduh. Penghematan khas adalah 50-80% dibandingkan file aslinya.

Ada pertanyaan?

Ya, mengurangi bitrate dalam format kompresi lossy (MP3, AAC, OGG) berarti membuang informasi pendengaran. Codec modern seperti AAC-LC, yang dikembangkan oleh koalisi MPEG pada 1997 dengan kontribusi dari Dolby, Fraunhofer, AT&T, Sony, dan Nokia, menggunakan model psikoacoustik untuk membuang informasi yang paling tidak dapat dirasakan oleh telinga manusia secara selektif. Model psikoacoustik menganalisis spektrum frekuensi dalam jendela waktu (biasanya 20-50 ms) dan mengidentifikasi dua fenomena: masking frekuensi (suara keras pada satu frekuensi membuat suara lemah pada frekuensi terdekat tidak terasa, prinsip yang ditemukan oleh Harvey Fletcher pada 1920-an dan diformalisasi dalam kontur equal-loudness Fletcher-Munson, 1933) dan masking temporal (suara keras membuat suara dalam sekitar 100 ms sebelum dan 200 ms sesudahnya tidak terasa). Pada 128 kbps, AAC dan MP3 mempertahankan semua informasi yang relevan secara perceptual bagi sebagian besar pendengar dalam kondisi mendengarkan normal. Di bawah 96 kbps, artefak mulai terdengar dalam konten musik yang kompleks.

Pilihan bitrate optimal tergantung pada konten dan konteks mendengarkan. Untuk podcast dan konten suara: 64 kbps mono adalah standar industri (digunakan oleh sebagian besar podcast di Spotify, Apple Podcasts, dan Overcast), setara dengan sekitar 28 MB per jam. Pada 64 kbps, suara bicara direproduksi dengan kejelasan penuh karena bandwidth spektral suara manusia (85 Hz hingga 8 kHz untuk sebagian besar inteligibilitas) jauh lebih sempit dari musik. Untuk streaming musik kasual: 128 kbps sudah memadai untuk mendengarkan melalui speaker Bluetooth atau headphone kelas menengah. Spotify menggunakan 128 kbps OGG/Vorbis untuk pengguna gratis. Untuk musik dengan mendengarkan penuh perhatian: 192-256 kbps. Apple Music menggunakan 256 kbps AAC-LC sebagai format dasar untuk seluruh katalognya. Untuk file referensi atau pengarsipan: 320 kbps MP3 atau, lebih baik lagi, FLAC (lossless).

Rumus tepat untuk menghitung ukuran file audio terkompresi adalah: Ukuran (MB) = (Bitrate dalam kbps x Durasi dalam detik) / 8 / 1024. Contoh konkret: lagu 4 menit (240 detik) pada 320 kbps menempati (320 x 240) / 8 / 1024 = 9,375 MB. Lagu yang sama pada 128 kbps menempati 3,75 MB (60% lebih sedikit). Pada 64 kbps menempati 1,875 MB (80% lebih sedikit dari 320 kbps). Sebagai perbandingan, WAV tidak terkompresi dari lagu yang sama pada 44,1 kHz, 16-bit, stereo menempati sekitar 40,6 MB. Album 12 lagu berisi lagu 4 menit pada 128 kbps menempati total 45 MB, versus 487 MB dalam WAV tidak terkompresi. Perbedaan 10x ini menjelaskan mengapa format lossy sangat penting untuk membuat distribusi musik digital layak pada era 1990-2000-an dengan kecepatan internet pada masa itu.

Kompresi lossy adalah metode kompresi data yang mengurangi ukuran file dengan secara permanen membuang informasi yang dianggap tidak esensial bagi pengalaman perceptual pengguna. Dalam audio, codec lossy seperti MP3 (paten oleh Fraunhofer IIS dan Thomson Consumer Electronics, paten fundamental kedaluwarsa pada 2017), AAC (standar ISO/IEC 13818-7:1997), dan OGG Vorbis (open source, dikembangkan oleh Xiph.Org Foundation sejak 1998) mengeksploitasi keterbatasan sistem pendengaran manusia untuk membuang informasi yang tidak dapat dirasakan. Kompresi lossless seperti FLAC (Free Lossless Audio Codec, dibuat oleh Josh Coalson pada 2001) menerapkan algoritma yang mirip ZIP tetapi dioptimalkan untuk sinyal audio, biasanya mencapai rasio kompresi 2:1 hingga 3:1 tanpa membuang informasi apa pun. Kompresi lossy, di sisi lain, dapat mencapai rasio 10:1 hingga 20:1 karena membuang informasi yang tidak relevan secara pendengaran, dengan konsekuensi kompresi tidak dapat dibalik: audio asli tidak dapat dipulihkan dari file terkompresi.

CBR (Constant Bitrate) dan VBR (Variable Bitrate) adalah dua strategi alokasi bit dalam encoding audio lossy. CBR mempertahankan bitrate tetap sepanjang seluruh file: jika Anda memilih 128 kbps CBR, setiap detik audio menempati tepat 128.000 bit, terlepas dari apakah detik itu mengandung keheningan, ucapan sederhana, atau musik kompleks dengan densitas spektral tinggi. Ini menjamin ukuran file yang dapat diprediksi dan memudahkan streaming, tetapi tidak efisien karena mengalokasikan bit yang sama untuk momen sederhana dan kompleks. VBR mengalokasikan lebih banyak bit ke segmen audio paling kompleks dan lebih sedikit bit untuk momen yang lebih sederhana, mempertahankan kualitas perceptual yang lebih seragam. Dalam MP3, LAME VBR dengan -V 2 (kira-kira setara dengan rata-rata 190 kbps) menghasilkan hasil yang tidak dapat dibedakan dari 320 kbps CBR bagi sebagian besar pendengar dalam uji ABX buta, dengan ukuran file yang jauh lebih kecil. AAC VBR dengan kualitas 3-4 (dalam FFmpeg) adalah padanannya untuk AAC.

Ya, mengompresi file yang sudah terkompresi secara lossy (seperti MP3 ke MP3, atau MP3 ke AAC) menyiratkan degradasi kualitas tambahan dibandingkan mengompresi dari sumber lossless (WAV atau FLAC). Fenomena ini dikenal sebagai generational loss. Setiap siklus kompresi lossy memperkenalkan artefak psikoacoustik baru: artefak dari kompresi pertama (pre-ringing, distorsi frekuensi tinggi, pumping rentang dinamis) bergabung dengan artefak kompresi kedua, dan model psikoacoustik codec kedua mungkin mengalokasikan bit secara suboptimal karena materi input tidak lagi memiliki properti statistik audio PCM alami. Dalam praktiknya, pada bitrate 128 kbps atau lebih tinggi, perbedaan antara mengompresi dari WAV dan dari MP3 320 kbps hanya dapat didengar dalam uji ABX yang sangat terkontrol dan tidak terasa dalam mendengarkan kasual. Namun, mengompresi MP3 64 kbps menjadi 32 kbps menghasilkan artefak yang terdengar jelas bahkan bagi pendengar yang tidak terlatih. Rekomendasi umum adalah selalu mulai dari sumber berkualitas tertinggi yang tersedia untuk operasi transcoding apa pun.

Kompresi audio: bitrate, kualitas, dan psikoacoustik yang dijelaskan

Kompresi audio lossy adalah salah satu teknologi paling berpengaruh di era digital. Pemahaman teknis tentang cara kerjanya memungkinkan keputusan yang tepat tentang bitrate yang sesuai untuk setiap kasus penggunaan. Prinsip fundamental codec audio lossy modern, termasuk MP3 (MPEG-1 Audio Layer III), AAC (Advanced Audio Coding), dan OGG Vorbis, adalah model psikoacoustik: sekumpulan algoritma yang menganalisis konten spektral audio dan menentukan informasi mana yang dapat dibuang tanpa dirasakan oleh telinga manusia. Model psikoacoustik mengeksploitasi dua fenomena persepsi pendengaran manusia yang terdokumentasi dengan baik. Pertama adalah masking frekuensi simultan: ketika dua nada diputar secara bersamaan, yang lebih keras dapat membuat yang lebih pelan tidak terasa jika cukup berdekatan dalam frekuensi. Fenomena ini diteliti secara sistematis oleh Harvey Fletcher di Bell Laboratories pada 1920-an dan diformalisasi dalam kontur equal-loudness Fletcher-Munson (1933), yang diperbarui sebagai ISO 226:2003. Fenomena kedua adalah masking temporal: suara keras menekan suara lain selama sekitar 100 ms sebelum (pre-masking) dan 200 ms setelah (post-masking). Codec audio mengalokasikan bit hanya ke komponen spektral yang melebihi ambang masking, membuang semua yang jatuh di bawahnya.

Hubungan antara bitrate dan kualitas yang dirasakan tidak linier. Peningkatan kualitas berkurang dengan hukum hasil yang semakin berkurang saat bitrate meningkat. Dalam MP3 dengan encoder LAME (LAME Ain't an MP3 Encoder, encoder referensi open source yang dikembangkan sejak 1998): pada 64 kbps, suara bicara sepenuhnya dapat dipahami tetapi musik menunjukkan artefak yang terdengar. Pada 96 kbps, dapat diterima untuk musik dalam konteks tidak menuntut. Pada 128 kbps, dianggap standar kualitas minimum untuk musik; sebagian besar pendengar yang tidak terlatih tidak dapat mendeteksi perbedaan dari aslinya dalam uji buta. Pada 192 kbps, hanya pendengar dengan pelatihan pendengaran dan peralatan fidelitas tinggi yang mendeteksi perbedaan dalam konten musik yang kompleks. Pada 256 kbps, transparan untuk hampir semua pendengar dalam hampir semua kondisi. Pada 320 kbps, batas atas standar MP3; perbedaan dibandingkan FLAC tidak dapat dideteksi bahkan dalam uji ABX terkontrol dengan peralatan fidelitas tinggi. Rumus untuk menghitung ukuran file audio terkompresi adalah: Ukuran (MB) = (Bitrate_kbps x Durasi_detik) / 8000.

Kasus penggunaan utama berdasarkan bitrate yang direkomendasikan untuk audio terkompresi adalah: suara bicara mono (podcast, audiobook, panggilan): 32-64 kbps. Telepon VoIP menggunakan codec khusus seperti Opus pada 6-64 kbps; WhatsApp dan Telegram menggunakan Opus pada 32-64 kbps untuk panggilan suara. Podcast yang didistribusikan melalui RSS: 64 kbps mono adalah standar de facto industri; Spotify merekomendasikan 128 kbps stereo untuk kualitas maksimum di platform mereka. Musik streaming kasual: 128-192 kbps. Spotify Free menggunakan 128 kbps OGG/Vorbis di mobile. Musik untuk mendengarkan penuh perhatian: 256-320 kbps. Apple Music menggunakan 256 kbps AAC; Amazon Music HD menggunakan hingga 850 kbps FLAC. File kerja dan master: WAV atau FLAC tidak terkompresi, terlepas dari penggunaan akhir. Format Opus, yang distandarisasi oleh IETF pada 2012 (RFC 6716), mengungguli MP3 dan AAC pada bitrate rendah (8-64 kbps) dan merupakan format pilihan untuk komunikasi real-time (WebRTC) dan streaming adaptif modern.