Comprimir Audio Online
Reduce el tamaño de archivos de audio ajustando el bitrate. Gratis, en tu navegador, sin subir archivos.
.mp3, .wav, .ogg, .flac, .aac · hasta 100 MB
Qué puedes hacer
Comprime audio sin perder lo que importa
Control de bitrate
Elige entre 64 y 320 kbps. Fórmula exacta para calcular el tamaño resultante.
100% privado
La compresión ocurre en tu navegador. Tu audio nunca se sube a ningún servidor.
Compatible universal
Salida en MP3 o AAC. Compatible con todos los dispositivos y plataformas.
Hasta 80% menos
Reduce archivos de audio a una fracción del tamaño original en segundos.
Cómo funciona
Tres pasos, sin complicaciones
Sube tu archivo de audio
Arrastra o selecciona tu archivo MP3, AAC, OGG u otro formato de audio. Hasta 200 MB, sin registro.
Elige el bitrate destino
Selecciona entre 64 y 320 kbps según tu caso de uso. 64-96 kbps para voz, 128-192 kbps para música casual, 256-320 kbps para alta fidelidad.
Descarga el audio comprimido
Compara el tamaño original y el nuevo antes de descargar. El ahorro típico es del 50-80% respecto al archivo original.
Preguntas frecuentes
¿Tienes dudas?
Sí, reducir el bitrate en formatos con compresión con pérdida (MP3, AAC, OGG) implica descartar información auditiva. Los codecs modernos como AAC-LC, desarrollado por la coalición MPEG en 1997 con contribuciones de Dolby, Fraunhofer, AT&T, Sony y Nokia, usan modelos psicoaudioacústicos para descartar selectivamente la información que el oído humano es menos capaz de percibir. El modelo psicoaudioacústico analiza el espectro de frecuencias en ventanas temporales (típicamente 20-50 ms) e identifica dos fenómenos: enmascaramiento de frecuencia (un sonido fuerte en una frecuencia hace imperceptibles los sonidos débiles en frecuencias cercanas, principio descubierto por Harvey Fletcher en los años 1920 y formalizado en las curvas de igual sonoridad Fletcher-Munson, 1933) y enmascaramiento temporal (un sonido fuerte hace imperceptibles los sonidos en los ~100 ms anteriores y ~200 ms posteriores). A 128 kbps, AAC y MP3 preservan toda la información perceptualmente relevante para la mayoría de los oyentes en condiciones normales de escucha. Por debajo de 96 kbps, comienzan a ser audibles artefactos como pre-ringing, pumping y distorsión en los altos en contenido musical complejo.
La elección del bitrate óptimo depende del contenido y del contexto de escucha. Para podcasts y contenido de voz hablada: 64 kbps en mono es el estándar de la industria (usado por la mayoría de los podcasts en Spotify, Apple Podcasts y Overcast), equivalente a aproximadamente 28 MB por hora. A 64 kbps, la voz hablada se reproduce con total claridad ya que el ancho de banda espectral de la voz humana (85 Hz a 8 kHz para la mayor parte de la inteligibilidad) es significativamente más estrecho que el de la música. Para música streaming casual: 128 kbps es aceptable para escucha en altavoces Bluetooth o auriculares de gama media. Spotify usa 128 kbps OGG/Vorbis para usuarios gratuitos y 160 kbps para premium en móvil. Para música con escucha atenta: 192-256 kbps. Apple Music usa 256 kbps AAC-LC como formato base para toda su biblioteca. Para archivos de referencia o archivo: 320 kbps MP3 o, mejor aún, FLAC (lossless). Los productores de música profesionales distribuyen masters en WAV 24-bit/96 kHz a las plataformas, que luego los transcodifican internamente.
La fórmula exacta para calcular el tamaño de un archivo de audio comprimido es: Tamaño (MB) = (Bitrate en kbps × Duración en segundos) / 8 / 1024. Ejemplos concretos: una canción de 4 minutos (240 segundos) a 320 kbps ocupa (320 × 240) / 8 / 1024 = 9.375 MB. La misma canción a 128 kbps ocupa 3.75 MB (60% menos). A 64 kbps ocupa 1.875 MB (80% menos que 320 kbps). Para comparación, el WAV sin comprimir de la misma canción a 44.1 kHz, 16-bit, estéreo ocupa aproximadamente 44,100 × 2 × 2 × 240 / 1,024 / 1,024 = 40.6 MB. Un album de 12 canciones de 4 minutos a 128 kbps ocupa 45 MB total, frente a 487 MB en WAV sin comprimir. Esta diferencia de factor 10x explica por qué los formatos con pérdida fueron esenciales para hacer viable la distribución digital de música en los años 1990-2000 con las velocidades de internet de la época (modem 56k: 7 KB/s; ADSL 1 Mbps: 125 KB/s).
La compresión con pérdida (lossy compression) es un método de compresión de datos que reduce el tamaño del archivo descartando permanentemente información que se considera no esencial para la experiencia perceptual del usuario. En audio, los codecs con pérdida como MP3 (patentado por Fraunhofer IIS y Thomson Consumer Electronics, patentes fundamentales expiradas en 2017), AAC (estándar ISO/IEC 13818-7:1997) y OGG Vorbis (open source, desarrollado por la Xiph.Org Foundation desde 1998) explotan las limitaciones del sistema auditivo humano para descartar información que no puede ser percibida. La compresión sin pérdida como FLAC (Free Lossless Audio Codec, creado por Josh Coalson en 2001) aplica algoritmos similares a ZIP pero optimizados para señales de audio, típicamente logrando ratios de compresión de 2:1 a 3:1 sin descartar ninguna información. La compresión con pérdida, en cambio, puede lograr ratios de 10:1 a 20:1 porque descarta información auditivamente irrelevante, a costa de que la compresión no es reversible: no se puede recuperar el audio original a partir del archivo comprimido.
CBR (Constant Bitrate) y VBR (Variable Bitrate) son dos estrategias de asignación de bits en la codificación de audio con pérdida. CBR mantiene un bitrate fijo a lo largo de todo el archivo: si se elige 128 kbps CBR, cada segundo de audio ocupa exactamente 128,000 bits, sin importar si ese segundo contiene silencio, voz simple o música compleja con alta densidad espectral. Esto garantiza un tamaño de archivo predecible y facilita el streaming (el servidor puede calcular con exactitud cuántos bytes se necesitan para cualquier posición en el archivo), pero es ineficiente porque asigna los mismos bits a momentos simples y complejos. VBR asigna más bits a los segmentos de audio más complejos (mayor densidad espectral, más información para codificar) y menos bits a los momentos más simples (silencios, voz monótona), manteniendo una calidad perceptual más uniforme. En MP3, LAME VBR con -V 2 (aproximadamente equivalente a 190 kbps de media) produce resultados indistinguibles de 320 kbps CBR en la mayoría de los oyentes en pruebas ABX ciegas, con un tamaño de archivo significativamente menor. AAC VBR con calidad 3-4 (en FFmpeg) es el equivalente para AAC.
Sí, comprimir un archivo ya comprimido con pérdida (como MP3 a MP3, o MP3 a AAC) implica una degradación de calidad adicional respecto a comprimir desde una fuente sin pérdida (WAV o FLAC). Este fenómeno se conoce como generational loss o degradación generacional. Cada ciclo de compresión con pérdida introduce nuevos artefactos psicoaudioacústicos: los artefactos de la primera compresión (pre-ringing, distorsión de alta frecuencia, pumping en el rango dinámico) se suman a los artefactos de la segunda compresión, y el modelo psicoaudioacústico del segundo codec puede distribuir los bits de forma subóptima porque el material de entrada ya no tiene las propiedades estadísticas del audio PCM natural. En la práctica, a bitrates de 128 kbps o superiores, la diferencia entre comprimir desde WAV y desde un MP3 de 320 kbps es audible solo en pruebas ABX muy controladas y es imperceptible en escucha casual. Sin embargo, comprimir un MP3 de 64 kbps a 32 kbps produce artefactos claramente audibles incluso para oyentes no entrenados. La recomendación general es siempre partir de la fuente de mayor calidad disponible para cualquier operación de transcodificación.
Comprimir audio: bitrate, calidad y psicoacústica explicados
La compresión de audio con pérdida es una de las tecnologías más influyentes de la era digital. La comprensión técnica de cómo funciona permite tomar decisiones informadas sobre el bitrate apropiado para cada caso de uso. El principio fundamental de los codecs de audio con pérdida modernos, incluyendo MP3 (MPEG-1 Audio Layer III), AAC (Advanced Audio Coding) y OGG Vorbis, es el modelo psicoaudioacústico: un conjunto de algoritmos que analizan el contenido espectral del audio y determinan qué información puede descartarse sin que sea percibida por el oído humano. El modelo psicoaudioacústico explota dos fenómenos bien documentados de la percepción auditiva humana. El primero es el enmascaramiento simultáneo de frecuencias: cuando dos tonos se reproducen simultáneamente, el más intenso puede hacer imperceptible al más débil si están suficientemente cerca en frecuencia. Este fenómeno fue investigado sistemáticamente por Harvey Fletcher en los Laboratorios Bell en los años 1920 y formalizado en las curvas de igual sonoridad Fletcher-Munson (1933), actualizadas como ISO 226:2003. El segundo fenómeno es el enmascaramiento temporal: un sonido intenso enmascara los sonidos durante aproximadamente 100 ms anteriores (pre-masking) y 200 ms posteriores (post-masking). Los codecs de audio asignan bits solo a los componentes espectrales que superan el umbral de enmascaramiento, descartando todo lo que queda por debajo de él.
La relación entre bitrate y calidad percibida no es lineal. Las mejoras de calidad disminuyen con la ley de los rendimientos decrecientes a medida que aumenta el bitrate. En MP3 con el codificador LAME (LAME Ain't an MP3 Encoder, el codificador de referencia de código abierto desarrollado desde 1998): a 64 kbps, la voz hablada es completamente inteligible pero la música presenta artefactos audibles (pre-ringing en percusiones, distorsión en altos). A 96 kbps, aceptable para música en contextos de baja exigencia. A 128 kbps, considerado el estándar mínimo de calidad para música; la mayoría de los oyentes no entrenados no detecta diferencia con el original en una prueba ciega. A 192 kbps, solo los oyentes con entrenamiento auditivo y equipos de alta fidelidad detectan diferencias en contenido musical complejo. A 256 kbps, transparente para prácticamente todos los oyentes en casi todas las condiciones. A 320 kbps, el límite superior del estándar MP3; diferencias respecto a FLAC son indetectables incluso en pruebas ABX controladas con equipos de alta fidelidad. La fórmula para calcular el tamaño de un archivo de audio comprimido es: Tamaño (MB) = (Bitrate_kbps × Duración_segundos) / 8000. Esta fórmula asume CBR (Constant Bitrate). Para VBR (Variable Bitrate), el tamaño varía según la complejidad del contenido, pero el bitrate promedio especificado en el codificador sirve como estimación.
Los principales casos de uso por bitrate recomendado para audio comprimido son: voz hablada mono (podcasts, audiolibros, llamadas): 32-64 kbps. La telefonía VoIP (Voice over IP) usa codecs especializados como Opus a 6-64 kbps o G.711 a 64 kbps; WhatsApp y Telegram usan Opus a 32-64 kbps para llamadas de voz. Podcasts distribuidos por RSS: 64 kbps mono es el estándar de facto de la industria; Spotify recomienda 128 kbps estéreo para máxima calidad en su plataforma. Música para streaming casual: 128-192 kbps. Spotify Free usa 128 kbps OGG/Vorbis en móvil. Música para escucha atenta: 256-320 kbps. Apple Music usa 256 kbps AAC; Amazon Music HD usa hasta 850 kbps FLAC. Archivos de trabajo y másters: WAV o FLAC sin comprimir, independientemente del uso final. Un caso especial es la compresión de audio para web y aplicaciones móviles. El estándar W3C para audio en navegadores (Web Audio API, especificación de 2011, implementada en Chrome 10, Firefox 25, Safari 6) soporta MP3, AAC, OGG/Vorbis, WAV y OPUS. Para fondos musicales en aplicaciones web, la recomendación es AAC a 128 kbps (soporte universal en iOS Safari) o OGG/Vorbis a 128 kbps con fallback a MP3 para Safari. Para efectos de sonido UI (botones, notificaciones), 64-96 kbps es suficiente dado el contenido de corta duración y baja complejidad espectral. El formato Opus, estandarizado por IETF en 2012 (RFC 6716), supera a MP3 y AAC a bitrates bajos (8-64 kbps) y es el formato preferido para comunicaciones en tiempo real (WebRTC) y streaming adaptativo moderno.