PRACTICAS DE Audio
Actividad 1
PROPOSICIÓN
Compruebe el sistema de sonido del que dispone su equipo y realice la captura de pantalla que lo muestra.
La pantalla de administración de dispositivos del Windows informa muy poco sobre el dispositivo.
Se puede comprobar que es un equipo de audio de alta definición manufacturado por Realtek.
La documentación del equipo indica que se trata de un controlador de audio Realtek ALC3246.
Este controlador dispone de hasta 8 canales de salida con 24 bits y tasa de muestreo de até 192.000 Hz, aún que sean disponibles apenas 2 canales por limitaciones del altavoz conectado al dispositivo. Los demás están disponibles apenas por conexiones HDMI para dispositivos con surround.
Para entrada, dispone de 2 canales con una cuantización de 24-bit por canal y tasa de muestreo de 48.000 Hz.
Actividad 2
PROPOSICIÓN
compare la calidad de la reproducción con el espacio requerido en cada una de las representaciones. Mantenga en todos los casos la frecuencia de muestreo y número de canales del CD-A original (44.100Hz / 2 canales). ¿Cuál cree que representa un mejor compromiso entre ambos factores?
Discusión Preliminar
Se realizo la descarga de una muestra de alta calidad (HiFi), en teoría de mejor calidad que de un CD de audio convencional en formato CD-A con la intención de permitir un más grande rango de comparación.
El sitio http://www.2l.no/hires/ disponibilidad muchos ejemplos de grabaciones originales provenientes de discos del tipo DXD. Son grabaciones originales en formato digital en alta calidad y que están disponibles en formato DSF y FLAC. Como muestras, están disponibles para pruebas y ensayos, respectadas las referencias a el sitio de http://www.2l.no/ . Informaciones adicionales en el sitio y por email en lyd@lindberg.no
La obra elegida para pruebas fue un techo de la “Cantata Rv 679: Che Giova Il Sospirar, Povero Core - Recitativo II”, de Antonio Vivaldi, del álbum “Bellezza Crudel – VIVALDI” en interpretación de Tone Wik y Barokkanerne, de 2008
Los ficheros DSF disponen de metadata que puede ser importado para formato FLAC pero es perdido en otros formatos. Este contenido incluye informaciones de la música, del álbum y de la grabación.
La grabación tiene duración de 44,04 segundos, con una tasa de muestreo 352.800 por canal, en 5.1 canales con 24 bits por amuestra. El fichero disponible en formato DSF ocupa 93.227.317 Bytes. En formato FLAC ocupa 214.690.190 Bytes.
Para conversión de los diferentes formatos se utilizó el aplicativo FFMPEG versión N-88193 en linea de comando. Importante destacar dos aspectos:
- El conversión en formatos sin perdidas no utiliza directamente la referencia de tasa de bits para definición de la calidad y compresión pero si niveles de calidad, por lo cual se experimentaran algunas posibilidades.
- El formato OGA es la extensión de formato OGG para audio y esta fue utilizada por el tema de compatibilidad con en aplicativo de conversión.
Para comparación, ofertamos una amuestra y abajo un comparativo de los diferentes formatos testados:
Fichero WaV Más Alta Calidad
Fichero MP3 192kbps
Fichero MP3 128kbps
Fichero MP3 32kbps
Fichero M4A 32kbps
Original DSF
Fichero:
2L-056_03_mch_DSD64.dsf
Tasa de Bits (aproximada):
16.667 kbps
Tamaño:
93.227.317 Bytes
Tasa de Compresión:
1,0
Origen:
Descarga de http://www.2l.no/
Fichero original em formato nativo de distribuición
Original FLAC
Fichero:
2L-056_03_mch_DSD64-original.FLAC
Tasa de Bits (aproximada):
38.381 kbps
Tamaño:
214.690.190 Bytes
Tasa de Compresión:
0,4
Origen:
Descarga de http://www.2l.no/
Fichero em formato FLAC distribuido
OGA CONVERTIDO DEL DSF
Fichero:
2L-056_03_mch_DSD64.oga
Tasa de Bits (aproximada):
3.211 kbps
Tamaño:
17.961.256 Bytes
Tasa de Compresión:
5,2
Origen:
ffmpeg -i 2L-056_03_mch_DSD64.dsf -vn -ar 44100 -ac 2 -ab -f oga 2L-056_03_mch_DSD64.oga
En el encoder FFMPEG, el container OGG (extensión OGA para OGG Audio), utiliza FLAC, por eso el tamaño es próximo. No son perceptibles diferencias para el original
OGA con 128kbps
Fichero:
2L-056_03_mch_DSD64-128kbps.oga
Tasa de Bits (aproximada):
1.146 kbps
Tamaño:
6.412.894 Bytes
Tasa de Compresión:
14,5
Origen:
ffmpeg -i 2L-056_03_mch_DSD64.dsf -vn -ar 44100 -ac 2 -ab 128k -f oga 2L-056_03_mch_DSD64-128kbps.oga
Pequeña perdida de calidad que se nota por una menor profundidad de sonidos. Mas grave las perdidas que el verificado en ficheros MP3
FlaC CON 192kbps
Fichero:
2L-056_03_mch_DSD64.FLAC
Tasa de Bits (aproximada):
3.198 kbps
Tamaño:
17.888.381 Bytes
Tasa de Compresión:
5,2
Origen:
ffmpeg -i 2L-056_03_mch_DSD64.dsf -vn -ar 44100 -ac 6 -ab 192k -f flac 2L-056_03_mch_DSD64.FLAC
No son perceptibles diferencias significativas para el original.
FLAC con 128kbps
Fichero:
2L-056_03_mch_DSD64-128kbps.FLAC
Tasa de Bits (aproximada):
1.143
Tamaño:
6.392.642 Bytes
Tasa de Compresión:
14,6
Origen:
ffmpeg -i 2L-056_03_mch_DSD64.dsf -vn -ar 44100 -ac 6 -ab 128k -f flac 2L-056_03_mch_DSD64-128kbps.FLAC
Mismo que el OGA de mesma tasa de bits.
WAV CON 192kbps
Fichero:
2L-056_03_mch_DSD64-192kbps.wav
Tasa de Bits (aproximada):
4.075 kbps
Tamaño:
22.795.306 Bytes
Tasa de Compresión:
4,1
Origen:
ffmpeg -i 2L-056_03_mch_DSD64.dsf -vn -ar 44100 -ac 6 -ab 192k -f wav 2L-056_03_mch_DSD64.wav
Son perdidas informaciones de metadatos y el tamaño del fichero es aún un poco más largo que el equivalente FLAC y OGA. No son perceptibles diferencias en la calidad del audio para el original
WAV CON 128KBPS
Fichero:
2L-056_03_mch_DSD64-128kbps.wav
Tasa de Bits (aproximada):
1.359
Tamaño:
7.599.122 Bytes
Tasa de Compresión:
12,3
Origen:
ffmpeg -i 2L-056_03_mch_DSD64.dsf -vn -ar 44100 -ac 6 -ab 128k -f wav 2L-056_03_mch_DSD64-128kbps.wav
Son perdidos metadatos pero no son muy relevantes las diferencias para el original en la calidad de audio, aun que sea significativa la reducción del tamaño del fichero.
MP3 con 192kbps
Fichero:
2L-056_03_mch_DSD64-192kbps.mp3
Tasa de Bits (aproximada):
185
Tamaño:
1.036.381 Bytes
Tasa de Compresión:
90,0
Origen:
ffmpeg -i 2L-056_03_mch_DSD64.dsf -vn -ar 44100 -ac 2 -ab 128k -f mp3 2L-056_03_mch_DSD64-128kbps.mp3
Son mantenidas varias de las informaciones de metadatos y el tamaño del fichero es muy reducido. No son perceptibles diferencias relevantes en la calidad del sonido.
MP3 CON 128KBPS
Fichero:
2L-056_03_mch_DSD64-128kbps.mp3
Tasa de Bits (aproximada):
124
Tamaño:
691.355 Bytes
Tasa de Compresión:
134,8
Origen:
ffmpeg -i 2L-056_03_mch_DSD64.dsf -vn -ar 44100 -ac 2 -ab 128k -f flac 2L-056_03_mch_DSD64-128kbps.FLAC
Son mantenidas varias de las informaciones de metadatos y el tamaño del fichero es es muy reducido. Son perceptibles perdidas en tonos graves.
MP3 CON 32KBPS
Fichero:
2L-056_03_mch_DSD64-32kbps.mp3
Tasa de Bits (aproximada):
31
Tamaño:
173.922 Bytes
Tasa de Compresión:
536,0
Origen:
ffmpeg -i 2L-056_03_mch_DSD64.dsf -vn -ar 44100 -ac 2 -ab 32k -f mp3 2L-056_03_mch_DSD64-32kbps.mp3
Son mantenidas varias de las informaciones de metadatos y el tamaño del fichero es muy reducido. Calidad de audio es significativamente afectada se notando pedidas de tonos graves y agudos, así como efecto de metalización.
M4A con 32kbps
Fichero:
2L-056_03_mch_DSD64-32kbps.m4a
Tasa de Bits (aproximada):
32
Tamaño:
180.343 Bytes
Tasa de Compresión:
516,9
Origen:
ffmpeg -i 2L-056_03_mch_DSD64.dsf -vn -ar 44100 -ac 2 -ab 32k 2L-056_03_mch_DSD64-32kbps.m4a
Son mantenidas varias de las informaciones de metadatos y el tamaño del fichero es mucho disminuido. Calidad de audio es significativamente afectada se notando pedidas de tonos graves y agudos aún que el resultado sea mejor que aquél observado en ficheros MP3 de misma tasa de bits
Conclusiones
Para producción o sistemas de alta fidelidad, cuando el tema de almacenamiento no es relevante, la utilización de FLAC o OGG (OGA) es recomendable, aún que, para consumo por usuarios finales, la utilización de ficheros MP3 o M4A es más interesante, incluso porque los dispositivos de reproducción domésticos, en general, no disponen de calidad para que las diferencias de calidad sean perceptibles.
Las diferencias de compresión se comparamos ficheros MP3 con tasas de 198kbps y 128kbps no es muy grande, así que se podría optar por el formato de más alta calidad para aplicaciones domesticas y para generar copias de seguridad de músicas.
Para aplicaciones web o donde compresión muy grande sea necesaria, el M4A mostró resultados más interesantes.
Actividad 3
PROPOSICIÓN
A partir del fichero mono bluesIntro.wav (disponible, en el subdirectorio media del recurso compartido indicado al principio de esta memoria de práctica): genere una versión estéreo del mismo donde se pueda apreciar claramente el posicionamiento del audio en los dos canales (izquierdo y derecho).
PROPOSICIÓN 1
Seleccione toda la información correspondiente al fichero y genere una copia de la misma mediante la opción Editar|Duplicar.
PROPOSICIÓN 2
Seleccione el menú desplegable situado en la cabecera de cada pista y asigne los valores canal izquierdo y canal derecho, respectivamente.
PROPOSICIÓN 3
Inserte silencios alternativamente en uno y otro canal, de modo que se aprecie mejor el efecto estéreo. Para ello, lo más sencillo es marcar una zona de la pista y seleccionar Generar|Silences2.
Actividad 4
PROPOSICIÓN
A partir de una señal de audio mono (o estéreo, según los casos), aplique efectos y vaya anotando una breve descripción. Todos ellos están disponibles en el menú Efecto. Puede investigar, si lo desea, otros efectos disponibles.
Amplify (amplificar)
Para el efecto amplificar escogimos un género de salsa, y nos percatamos que tiene una restricción para aumentar el nivel de reproducción, es decir el volumen del audio, debido a que tiene una herramienta que detecta el máximo de decibeles del audio original, sin embargo, cuando seleccionamos la opción “permite corte” (No es recomendable), podemos aumentar el sonido del audio (visualiza la onda extendida), pero al exportar el audio se encuentra completamente distorsionada en sonido.
En el caso inverso al disminuir el nivel de reproducción, es decir el volumen, el sonido no se distorsiona y solamente el volumen del sonido disminuye y la onda se visualiza muy delgada.
Amplificar_original.mp3
Amplificar_original (Volumen alto).wav
Amplificar_original (Volumen bajo).wav
Bassboost (realzar graves)
Al Incrementa los decibeles en los sonidos graves, el de bajo de las canciones aumenta en sonido, el audio escogido es una música boricua con mezcla de mucha percusión e instrumentos de cuerdas, por lo cual se percibe claramente el cambio de los sonidos y los agudos disminuyen incluso la onda de frecuencia sufre cambios en sus dimensiones y tiempos.
Bassboost_original.mp3
Bassboost_graves_altos.wav
Echo (eco)
Con respecto al efecto Eco hemos utilizado el audio de prueba, al generar y probar el efecto este no era fácil de percibir por ello buscando en el material de ayuda nos brindó la opción de colocarle un silencio al final y volver a dar el efecto para lograr tener un mayor efecto.
Con este efecto lo que genera son pequeñas repeticiones de sonido, el tiempo de repetición es fijo y sin pausas en cada repetición, los parámetros a configurar para el efecto son el tiempo de retraso (cantidad de retraso entre los ecos) y el factor de decaimiento. Además, el tiempo de retraso deberá ser menor al original del audio en selección.
Eco_Original.mp3
Eco_Modificado.wav
Reverse (revertir)
Con respecto al efecto se ha utilizado un audio de balada, y lo que genera es colocar el sonido al revés, la letra de la canción también sufre el cambio de escucharse al revés.
Visualmente se observa que las ondas de frecuencia del sonido se invierten en posición.
Efecto_Revertir(Original).mp3
Efecto_Revertir(Modificado).wav
Fade in (aparecer) Y Fade out (desvanecer)
Con respecto a estos dos efectos los hemos realizado con el mismo audio de género balada, seleccionamos el segmento que deseamos agregar el efecto “Aparecer” (de acuerdo con la ayuda es preferible efectuarlo más de una vez para que se perciba mejor el efecto). El resultado es que el volumen baja notoriamente en la parte seleccionada del audio y luego va retornando de acuerdo con el avance del tiempo.
Con el efecto “Desaparecer”, es similar el volumen disminuye, pero de manera gradual en la parte seleccionada. Al igual que el anterior efecto debe aplicarse más de una vez para que se pueda percibir.
En ambos efectos las ondas se reducen y como su nombre los menciona el volumen del sonido se desvanece.
Audio Original.mp3
Audio Original_modificado.wav
Cambiar pitch (tono)
El audio utilizado es de género clásico, y hemos seleccionado la mitad de la pista (la que contiene la voz de los interpretes) y hemos realizado la conversión bajando tres semitonos (-3), en la opción semitonos (pasos intermedios), la cual es más directa en caso no se conozca las notas musicales de la canción, al realizar este cambio la frecuencia del audio disminuye, por lo cual se pierde un poco la calidad del audio, sin embargo revisando la ayuda del material para utilizar las opción directa “Tono” se debe tener conocimiento de música para ver el tema de las notas que uno desea modificar.
Tono_Original.mp3
Tono_Modificado.wav
Cambiar tempo (Cambiar ritmo) SIN AFECTAR EL tono
El audio utilizado para el ejemplo es de género balada, por lo consiguiente su ritmo es lento, al realizar el efecto “Cambiar ritmo” podemos aumentar o disminuir el porcentaje del ritmo, por lo cual la primera prueba aumentamos el porcentaje lo cual acelera el sonido de la música, ocasionando la distorsión en partes de la voz de la interprete y reduciendo el tiempo de la canción.
Se realizó una segunda prueba, pero esta vez se disminuye el porcentaje aumentando la lentitud en el sonido y el tiempo de la canción.
Cambiar Tempo(Cambiar Ritmo)-Lenta.wav
Cambiar Tempo(Cambiar Ritmo)-Rápido.wav
Actividad 5
PROPOSICIÓN
Escoja dos temas musicales, con representación en forma de onda, del directorio del recurso compartido. A partir de los mismos, se propone generar un único archivo en el que, a modo de “pinchadiscos” con una mesa de mezclas, se vaya silenciando el primero para dar progresivamente paso al segundo.
Guárdese una captura de pantalla del proceso (mezcla.png) para poder explicar cómo se trabajó esta actividad, junto con el archivo de proyecto que genera Audacity (mezcla.aup), los ficheros de audio de partida y el resultante de la actividad (mezcla.wav).
El archivo de audio final (mezcla.wav) debe tener las siguientes características:
- Una duración de unos 60 segundos, de forma que los dos temas ocupen intervalos semejantes.
- Calidad idéntica a la de los archivos fuente.
Pistas Originais
Audio2_Riahana.wav
Audio2_SIA.wav
Pista Mezclada
Mezcla1.wav
Proyecto
1 - Uniòn de las Pistas
2 - Cross-fade y Guardar Proyecto
3 - Exportar Mezcla
4 - Probando Mezcla
Actividad 6
PROPOSICIÓN
Cree una banda sonora en la que se le escuche dar una pequeña charla de medio minuto a un auditorio (puede obtener el contenido de cualquier artículo de prensa digital, por ejemplo). Se sugiere que siga los siguientes pasos:
- Grabe su locución y procésela hasta obtener un nivel de volumen y calidad aceptables. Si el resultado de su grabación fuera ruidoso, elimine el ruido con ayuda de opciones como “Reducción de ruido”.
- Introduzca un efecto de reverberación para simular que da su charla en una sala de gran tamaño, a un amplio auditorio.
- Añada nuevas pista con sonido ambiental. Por ejemplo un murmullo constante de fondo, alguien que tose esporádicamente, etc. Tome estos efectos del repositorio.
- Introduzca sonido de aplausos cuando finalice su locución.
Guárdese una captura de pantalla del proceso (bso.png) para poder explicar cómo se trabajó esta actividad, junto con el archivo de proyecto que genera Audacity (bso,aup), los ficheros de audio de partida y el resultante de la actividad (bso.wav).
Para la realización de la banda sonora se ha descargado el sonido de la página:
http://www.sonidosmp3gratis.com/ - Sonido escogido ambiente 1.
Con respecto a la charla hemos escogido una de youtube de la siguiente dirección: https://www.youtube.com/watch?v=hmQQZtKAR6c , para descargar el video he utilizado el software aTube Catcher vers. 3.8.93 y posterior convertir a audio .mp3 el software de VLC Media Player.
Inclusión de efectos
Inclusión del ruido
Inclusión de aplausos
Resultado Final
BSO_Final.mp3
Proyecto
Actividad 7
PROPOSICIÓN
Genere una senoidal de distintas frecuencias mediante la opción Generar|Tono. Le sugerimos que pruebe con una frecuencia de 440Hz, la asociada a la nota LA del diapasón usado para afinación. Observe las diferencias tanto en su representación en el dominio del tiempo
(puede necesitar hacer uso del zoom) como en la reproducción.
Seleccione un fragmento de la onda y calcule su espectro de frecuencias mediante la opción Analizar | Análisis de Espectro. Compruebe que el pico del espectro coincide aproximadamente con la frecuencia de la senoide.
1 - Generando una senoidal de 440Hz
2 - Análisis del Espectro
Actividad 8
PROPOSICIÓN
El archivo dtmf.wav contiene el sonido resultante de la marcación de un número corto de teléfono mediante el sistema de tonos (DTMF). Recuerde que cada número se codifica mediante la mezcla de dos tonos según la tabla anterior. Averigüe de qué número se trata.
dtmf.wav
Para profundizar en este concepto vamos a analizar las señales generadas por el teclado de un teléfono doméstico que funcione por tonos. Estos dispositivos siguen el estándar conocido por DTMF (Dual-Tone Multi-Frequency). En realidad, cada número que marcamos en nuestro teclado genera una señal audible compuesta por dos tonos, de ahí su nombre, según la matriz que se muestra en la figura
Con el software Audacity se puede seleccionar partes del audio y realizar el análisis del espectro para determinar las componentes de frecuencia como presentado en las figuras
La función de análisis nos permite identificar facilmente los picos como indicado en la figura
Conclusión
Repitiendo el procedimiento para cada parte del audio, podemos averiguar que el número pulsado es 093. Como indicado a seguir:
- Primera parte: 942 Hz ( Linea 4) y 1.336 Hz (Columna 2), que corresponde al número 0
- Segunda parte: 851 Hz (Linea 3) y 1.476 Hz (Columna 3), que corresponde al número 9
- Tercera parte: 696 Hz (Linea 1) y 1.476 Hz (Columna 3), que corresponde al número 3