DokumentyObrazyMediaNarzędzia PDF

Kompresuj Audio Online

Zmniejsz rozmiar pliku audio przez obniznie bitrate. Bezplatnie, w Twojej przegladarce, bez wgrywania plikow.

Drag your file here

.mp3, .wav, .ogg, .flac, .aac · up to 100 MB

Processed in your browser — file never uploadedFree
Note: The first conversion loads the FFmpeg engine (~25MB). Subsequent conversions will be faster.

Kompresuj audio bez utraty tego, co wazne

Kontrola bitrate

Wybierz miedzy 64 a 320 kbps. Dokladny wzor do obliczenia wynikowego rozmiaru.

100% prywatne

Kompresja odbywa sie w Twojej przegladarce. Twoje audio nigdy nie trafia na zadny serwer.

Uniwersalna kompatybilnosc

Wyjscie w MP3 lub AAC. Kompatybilnosc ze wszystkimi urzadzeniami i platformami.

Do 80% mniejszy

Zmniejsz pliki audio do ulamka oryginalnego rozmiaru w sekundach.

Trzy kroki, żadnych komplikacji

1

Wgraj plik audio

Przeciagnij lub wybierz plik MP3, AAC, OGG lub inny format audio. Do 200 MB, bez rejestracji.

2

Wybierz docelowy bitrate

Wybierz miedzy 64 a 320 kbps dla swojego przypadku uzycia. 64-96 kbps dla mowy, 128-192 kbps dla casualowej muzyki, 256-320 kbps dla hi-fi.

3

Pobierz skompresowane audio

Porownaj oryginalny i nowy rozmiar pliku przed pobraniem. Typowe oszczednosci to 50-80% wzglednie oryginalu.

Masz pytania?

Tak, redukcja bitrate w stratnych formatach kompresji (MP3, AAC, OGG) oznacza odrzucanie informacji sluchowych. Nowoczesne kodeki jak AAC-LC, opracowany przez koalicje MPEG w 1997 roku z wkladami Dolby, Fraunhofer, AT&T, Sony i Nokia, uzywaja modeli psychoakustycznych do selektywnego odrzucania informacji, ktore ludzkie ucho jest najmniej zdolne postrzegac. Model psychoakustyczny analizuje spektrum czestotliwosci w oknach czasowych (zazwyczaj 20-50 ms) i identyfikuje dwa zjawiska: maskowanie czestotliwosci (glosny dzwiek przy jednej czestotliwosci sprawia, ze slabe dzwieki przy poblizkich czestotliwosciach sa niespostrzegalne) i maskowanie temporalne (glosny dzwiek sprawia, ze dzwieki w ciagu okolo 100 ms przed i okolo 200 ms po sa niespostrzegalne). Przy 128 kbps, AAC i MP3 zachowuja wszystkie percepcyjnie istotne informacje dla wiekszosci sluchaczy w normalnych warunkach sluchania. Ponizej 96 kbps, artefakty takie jak pre-ringing, pompowanie i znieksztalcenia wysokich czestotliwosci zaczynaja byc slyszalne w zlozonych tresciach muzycznych.

Optymalne wybor bitrate zalezy od tresci i kontekstu sluchania. Dla podcastow i mowionej tresci glosowej: 64 kbps mono to branzynoowy standard (uzywany przez wiekszosc podcastow na Spotify, Apple Podcasts i Overcast), odpowiadajacy okolo 28 MB na godzine. Dla casualowego streamingu muzyki: 128 kbps jest akceptowalne do sluchania przez glosniki Bluetooth lub sluchawki sredniej klasy. Spotify uzywa 128 kbps OGG/Vorbis dla uzytkownikow bezplatnych i 160 kbps dla premium na mobile. Dla muzyki z uwaznym sluchaniem: 192-256 kbps. Apple Music uzywa 256 kbps AAC-LC jako formatu bazowego dla calej biblioteki. Dla plikow referencyjnych lub archiwizacji: 320 kbps MP3 lub, lepiej, FLAC (bezstratny). Profesjonalni producenci muzyczni dystrybuuja mastery w WAV 24-bit/96 kHz do platform, ktore nastepnie wewnetrznie dokonuja transkodowania.

Dokladny wzor do obliczania rozmiaru skompresowanego pliku audio to: Rozmiar (MB) = (Bitrate w kbps x Czas trwania w sekundach) / 8 / 1024. Konkretne przyklady: 4-minutowa piosenka (240 sekund) przy 320 kbps zajmuje (320 x 240) / 8 / 1024 = 9,375 MB. Ta sama piosenka przy 128 kbps zajmuje 3,75 MB (60% mniej). Przy 64 kbps zajmuje 1,875 MB (80% mniej niz 320 kbps). Dla porownania, nieskompresowany WAV tej samej piosenki przy 44,1 kHz, 16-bit, stereo zajmuje okolo 44 100 x 2 x 2 x 240 / 1024 / 1024 = 40,6 MB. 12-sciezkowy album z 4-minutowymi piosenkami przy 128 kbps zajmuje lacznie 45 MB, w porownaniu do 487 MB w nieskompresowanym WAV. Ta 10-krotna roznica wyjasnia, dlaczego stratne formaty byly niezbedne do umozliwienia dystrybucji muzyki cyfrowej w latach 90. i 2000.

Kompresja stratna to metoda kompresji danych, ktora zmniejsza rozmiar pliku przez trwale odrzucanie informacji uznawanych za nieistotne dla percepcyjnego doswiadczenia uzytkownika. W audio, stratne kodeki jak MP3 (patentowany przez Fraunhofer IIS i Thomson Consumer Electronics, podstawowe patenty wygasly w 2017), AAC (standard ISO/IEC 13818-7:1997) i OGG Vorbis (open source, opracowany przez Xiph.Org Foundation od 1998) wykorzyostuja ograniczenia ludzkiego systemu sluchowego do odrzucania informacji, ktore nie moga byc postrzegane. Kompresja bezstratna jak FLAC (Free Lossless Audio Codec, stworzony przez Josha Coalsona w 2001 roku) stosuje algorytmy podobne do ZIP, ale zoptymalizowane dla sygnalow audio, osiagajac zazwyczaj wspolczynniki kompresji 2:1 do 3:1 bez odrzucania jakichkolwiek informacji. Kompresja stratna, z drugiej strony, moze osiagnac stosunki 10:1 do 20:1, poniewaz odrzuca informacje nieistotne dla ucha, kosztem tego, ze kompresja jest nieodwracalna.

CBR (Constant Bitrate) i VBR (Variable Bitrate) to dwie strategie alokacji bitow w stratnym kodowaniu audio. CBR utrzymuje staly bitrate przez caly plik: jezeli wybierzesz 128 kbps CBR, kazda sekunda audio zajmuje dokladnie 128 000 bitow, niezaleznie od tego, czy ta sekunda zawiera cisz, prosta mowe czy zlozoną muzyke o wysokiej gestosci spektralnej. Gwarantuje to przewidywalny rozmiar pliku i ulatwia streaming, ale jest nieefektywne, poniewaz przydziela te same bity do prostych i zlozonych momentow. VBR przydziela wiecej bitow do najbardziej zlozonych segmentow audio (wieksza gestosc spektralna, wiecej informacji do zakodowania) i mniej do prostszych momentow (cisze, monotonna mowa), utrzymujac bardziej jednolita jakosc percepcyjna. W MP3, LAME VBR z -V 2 (odpowiadajacy w przyblizeniu 190 kbps srednio) daje wyniki nieodroznialne od 320 kbps CBR dla wiekszosci sluchaczy w slepych testach ABX, przy znacznie mniejszym rozmiarze pliku.

Tak, kompresja juz stratnie skompresowanego pliku (jak MP3 do MP3 lub MP3 do AAC) wiaze sie z dodatkowym pogorszeniem jakosci w porownaniu z kompresja ze zrodla bezstratnego (WAV lub FLAC). To zjawisko jest znane jako utrata pokoleniowa. Kazdy cykl kompresji stratnej wprowadza nowe artefakty psychoakustyczne: artefakty z pierwszej kompresji (pre-ringing, znieksztalcenia wysokich czestotliwosci, pompowanie zakresu dynamicznego) laczą sie z artefaktami drugiej kompresji, a model psychoakustyczny drugiego kodeka moze nieoptymalnee przydzielac bity, poniewaz material wejsciowy nie ma juz wlasciwosci statystycznych naturalnego audio PCM. W praktyce, przy przeplywnosciach 128 kbps lub wyzszych, roznica miedzy kompresja z WAV a z 320 kbps MP3 jest slyszalna tylko w wysoko kontrolowanych testach ABX i jest niespostrzegalna w casualowym sluchaniu. Jednak kompresja 64 kbps MP3 do 32 kbps daje wyraznie slyszalne artefakty nawet dla nieprzeszkolonych sluchaczy. Ogolna rekomendacja to zawsze zaczynaC od zrodla o najwyzszej dostepnej jakosci dla kazdej operacji transkodowania.

Kompresja audio: bitrate, jakosc i psychoakustyka - wyjasnienie

Stratna kompresja audio to jedna z najbardziej wplywowych technologii ery cyfrowej. Techniczne zrozumienie jej dzialania umozliwia podejmowanie swiadomych decyzji dotyczacych odpowiedniego bitrate dla kazdego przypadku uzycia. Fundamentalna zasada nowoczesnych stratnych kodeków audio, w tym MP3 (MPEG-1 Audio Layer III), AAC (Advanced Audio Coding) i OGG Vorbis, to model psychoakustyczny: zestaw algorytmow analizujacych spektralna zawartosc audio i okreslajacych, jakie informacje moga byc odrzucone bez postrzegania przez ludzkie ucho. Model psychoakustyczny wykorzyostuje dwa dobrze udokumentowane zjawiska ludzkiej percepcji sluchowej. Pierwsze to jednoczesne maskowanie czestotliwosci: kiedy dwa tony sa odtwarzane jednoczesnie, glosniejszy moze sprawiac, ze cichszy jest niespostrzegalny, jezeli sa wystarczajaco blisko w czestotliwosci. Zjawisko to bylo systematycznie badane przez Harveya Fletchera w Bell Laboratories w latach 20. i sformalizowane w konturach rownej glosnosci Fletchera-Munsona (1933), zaktualizowanych jako ISO 226:2003. Drugie zjawisko to maskowanie temporalne: glosny dzwiek maskuje inne dzwieki przez okolo 100 ms przed (pre-maskowanie) i 200 ms po (post-maskowanie). Kodeki audio przydzielaja bity tylko do komponentow spektralnych, ktore przekraczaja prog maskowania.

Zaleznosc miedzy bitrate a percepcyjna jakoscia nie jest liniowa. Ulepszenia jakosci maleja zgodnie z prawem malejacych zwrotow wraz ze wzrostem bitrate. W MP3 z enkoderem LAME (LAME Ain't an MP3 Encoder, enkoder referencyjny open source rozwijany od 1998): przy 64 kbps, mowiona mowa jest w pelni zrozumiala, ale muzyka wykazuje slyszalne artefakty. Przy 96 kbps, akceptowalne dla muzyki w niskowymagajacych kontekstach. Przy 128 kbps, uwazane za minimalny standard jakosci dla muzyki; wiekszosc nieprzeszkolonych sluchaczy nie moze wykryc roznicy od oryginalu w slepym tescie. Przy 192 kbps, tylko sluchacze z wyksztalceniem sluchowym i sprzetem hi-fi wykrywaja roznice w zlozonych tresciach muzycznych. Przy 256 kbps, przezroczysty dla praktycznie wszystkich sluchaczy w prawie wszystkich warunkach. Przy 320 kbps, gorny limit standardu MP3; roznice w porownaniu z FLAC sa niewykrywalne nawet w kontrolowanych testach ABX z sprzetem hi-fi. Wzor do obliczania rozmiaru skompresowanego pliku audio to: Rozmiar (MB) = (Bitrate_kbps x Czas_trwania_sekundy) / 8000.

Glowne przypadki uzycia wedlug zalecanego bitrate dla skompresowanego audio to: mowiona mowa mono (podcasty, audiobooki, polaczenia): 32-64 kbps. Telefonia VoIP (Voice over IP) uzywa wyspecjalizowanych kodeków jak Opus przy 6-64 kbps lub G.711 przy 64 kbps; WhatsApp i Telegram uzywaja Opus przy 32-64 kbps dla polaczen glosowych. Podcasty dystrybuowane przez RSS: 64 kbps mono to de facto standard branzynoowy; Spotify rekomenduje 128 kbps stereo dla maksymalnej jakosci na swojej platformie. Casualowy streaming muzyki: 128-192 kbps. Spotify Free uzywa 128 kbps OGG/Vorbis na mobile. Muzyka do uwaznego sluchania: 256-320 kbps. Apple Music uzywa 256 kbps AAC; Amazon Music HD uzywa do 850 kbps FLAC. Pliki robocze i mastery: nieskompresowany WAV lub FLAC, niezaleznie od koncowego zastosowania. Szczegolnym przypadkiem jest kompresja audio dla aplikacji webowych i mobilnych. Standard W3C dla audio w przeglajdarkach (Web Audio API, specyfikacja 2011) obsluguje MP3, AAC, OGG/Vorbis, WAV i Opus. Dla muzycznych tel w aplikacjach webowych rekomendacja to AAC przy 128 kbps (uniwersalne wsparcie w iOS Safari) lub OGG/Vorbis przy 128 kbps z MP3 jako fallback dla Safari. Format Opus, znormalizowany przez IETF w 2012 roku (RFC 6716), przewyzsza MP3 i AAC przy niskich przeplywnosciach i jest preferowanym formatem dla komunikacji w czasie rzeczywistym (WebRTC).