Reput A Mhadhres - Sir Dark Parrokian - Pipiloco McGraw - Rossanita - Tumay. Toda la info sobre estos ilustres personajes y sus aportes al conocimiento y la humanidad, aquí.

martes, diciembre 07, 2004

MP3 comelón de frecuencias

Para muchos no es ninguna novedad el saber como funciona y qué es lo que hace el formato mp3 para comprimir audio: agarrar el rango de frecuencias no audibles por el ser humano, y borrarlas del archivo para que este pese menos. Pero de casualidad "descubrí" hace poco que se podía representar gráficamente todo esto, mientras estaba probando la vista espectral de un programa de audio (el AdobeAudition), y de paso entendí como se lee este tipo de vista. Ahora paso a explicar todo, para quienes no sepan de que tratan estos términos.

Lo que tenemos acá al costado es una vista espectral por colores. La vista espectral muestra todo el espectro de frecuencias de un sonido en un determinado lapso de tiempo. Un espectro de frecuencias es justamente, la muestra de todas las frecuencias de las que se compone un sonido. Ahora, ¿cómo leemos esta vista? facil:
- está partida en 2 porque el audio que estamos analizando es estéreo, si fuera mono entonces habría un solo espectro. así que se tiene que hacer 2 lecturas, la del canal derecho y la del izquierdo.
- el eje vertical representa las frecuencias, desde la más baja (abajo) hasta la más alta (arriba)
- el eje horizontal representa la duración del sonido que estamos analizando.
- los colores se leen como aparece en el degradado que hay abajo de la imágen: mientras más amarillo sea el color, significa que las frecuencias abarcadas por ese color tienen gran intensidad y suenan más que las frecuencias de tono rojizo (que corresponderían a una intensidad media) y que las de tono azul (que son las que se escuchan menos). Por ejemplo acá vemos que las frecuencias bajas son las que tienen la mayor intensidad, porque están amarillas.
- hay una línea que dice umbral de audición, esto quiere decir que aproximadamente a partir de esta línea (20 000 Hz) hacia arriba se encuentran las frecuencias que el oído humano no puede oir.
Entonces, tenemos una muestra de audio no comprimido (como por ejemplo el audio del formato WAV) a la que le hacemos la vista espectral, y el resultado es el que aparece en la imágen de arriba. Si se dan cuenta, el rango de frecuencias altas no audibles (de 20 000 Hz para arriba) sí contiene información, osea que hay frecuencias sonando en ese rango.

Ahora vamos a comprimir el archivo en formato MP3. Se puede usar varios bitrates para comprimir el archivo; mientras mayor se el número de bitrate, mayor será la calidad del archivo. Los bitrates estándar generalmente son 320, 256, 192, 160, 128, 96, 80 (y dos más intermedios que no recuerdo). Probaremos primero con el de 320 Kbps:

Haganle click a la imagen para agrandarla, y van a comprobar que las frecuencias altas (las no audibles) ya presentan vacíos grandes (zonas negras) y hay una que otra zona que muestra información, aunque el cambio no ha sido demasiado radical con la relación a la imágen de la muestra original.

Ahora vamos hacia el otro extremo: vamos a comprimir el archivo en el bitrate más bajo, el de 80. Este es el resultado:

Esta vez sin necesidad de agrandar la imágen se puede comprobar que el corte ha sido grande, dejando una zona vacía ya no sólo en el rango de frecuencias altas no audibles, sino también en el de las frecuencias altas que sí oímos (de todas maneras van a tener que agrandar la imágen para que se den cuenta). El resultado es un sonido más opaco, apagado, oscuro. Cuando quitas frecuencias altas, lo que estás haciendo es quitar brillo al sonido, por eso se escucha opaco.

Aunque estos bitrates que he mostrado no son los más populares, el primero porque genera archivos que ocupan mucho espacio, y el segundo porque la calidad del audio es malísima (si lo que se busca no es calidad, sino simplemente transmitir una señal sonora como por ejemplo una conversación telefónica, esta podría ser una buena elección por el poco espacio que ocupa). Los bitrates más populares son los de 192, 160 y 128 kbps. El de 128 está cada vez más siendo desechado porque efectivamente se notan muchas veces perdidas en la claridad y calidad del sonido (dependiendo de qué audio sea el que comprimimos). Pienso que 160 y 192 kbps son una buena elección, dependiendo de qué tanto espacio dispongamos, y que tan exigentes con la calidad del archivo vayamos a ser. Claro que si se dispone de mucho espacio en disco, se puede comprimir en los bitrates mayores, eso ya es cuestión de cada quién y del sonido que quiere del archivo a comprimir.

Ahora, hay otras alternativas como el mp3PRO que ofrece calidad a menores bitrates (lo cual es beneficioso porque a menos bitrate de compresión menos espacio utilizado en disco por el archivo) Lo que hace el mp3PRO encoder (codificador) es comprimir y guardar la información de las frecuencias que ha cortado en el mismo archivo -supongo que en un metaTag dentro del mismo archivo-, para que el mp3PRO decoder (decodificador) pueda reconstruír esas frecuencias por medio de algún algoritmo de descompresión. Otras alternativas son los formatos relativamente nuevos, como el MPC y el OGG Vorbis que tambien ofrecen mayor calidad a menos bitrate de compresión.

3 Comments:

Blogger PeRcY said...

Excelente tu vision y tu experimentacion con esto d los sonidos, sobre todo en la forma q lo cuentas, creo q es muy explicativo, me encanto y lo voy a recomendar, sobre todo a mis amigos, q como yo, son unos loquitos bajando musica y muchas veces no entendemos este cambio en el sonido y pensamos q la transmision de datos no fue la adecuada o hubo una falla en ella, pero creo q esto lo explica todo, otra vez gracias...

1:08 p. m.

 
Blogger TUMAY said...

de nada percy.
si quieres meterte más a esto del audio y estas cosas, acá a la derecha hay varios links que fácil te pueden interesar, algunos con manuales de audio.
cualquier cosa, posteas un comentario nomás.-
saludos!

3:12 p. m.

 
Blogger Unknown said...

Muy buena entrada. Me estoy iniciando en esto de la música y sus propiedades, y me ha venido de perlas, además que es muy fácil apreciar la diferencias entre unos bitrates y otros de forma visual.
¡Gracias! =)

1:05 p. m.

 

Publicar un comentario

<< Home

 
.