Audio

Audio

PRACTICAS DE Audio

En esta practica se ha utilizado el software GINP 2.8.22, Inkscape 0.92 y WinSCP 5.11.2

Actividad 1

Sistema de Sonido

PROPOSICIÓN

Compruebe el sistema de sonido del que dispone su equipo y realice la captura de pantalla que lo muestra.

La pantalla de administración de dispositivos del Windows informa muy poco sobre el dispositivo.

Se puede comprobar que es un equipo de audio de alta definición manufacturado por Realtek.

La documentación del equipo indica que se trata de un controlador de audio Realtek ALC3246.
Este controlador dispone de hasta 8 canales de salida con 24 bits y tasa de muestreo de até 192.000 Hz, aún que sean disponibles apenas 2 canales por limitaciones del altavoz conectado al dispositivo. Los demás están disponibles apenas por conexiones HDMI para dispositivos con surround.
Para entrada, dispone de 2 canales con una cuantización de 24-bit por canal y tasa de muestreo de 48.000 Hz.

Actividad 2

Calidad de Reproducción

PROPOSICIÓN

compare la calidad de la reproducción con el espacio requerido en cada una de las representaciones. Mantenga en todos los casos la frecuencia de muestreo y número de canales del CD-A original (44.100Hz / 2 canales). ¿Cuál cree que representa un mejor compromiso entre ambos factores?

Discusión Preliminar

Se realizo la descarga de una muestra de alta calidad (HiFi), en teoría de mejor calidad que de un CD de audio convencional en formato CD-A con la intención de permitir un más grande rango de comparación.

El sitio http://www.2l.no/hires/ disponibilidad muchos ejemplos de grabaciones originales provenientes de discos del tipo DXD. Son grabaciones originales en formato digital en alta calidad y que están disponibles en formato DSF y FLAC. Como muestras, están disponibles para pruebas y ensayos, respectadas las referencias a el sitio de http://www.2l.no/ . Informaciones adicionales en el sitio y por email en lyd@lindberg.no

La obra elegida para pruebas fue un techo de la “Cantata Rv 679: Che Giova Il Sospirar, Povero Core - Recitativo II”, de Antonio Vivaldi, del álbum “Bellezza Crudel – VIVALDI” en interpretación de Tone Wik y Barokkanerne, de 2008

Los ficheros DSF disponen de metadata que puede ser importado para formato FLAC pero es perdido en otros formatos. Este contenido incluye informaciones de la música, del álbum y de la grabación.

La grabación tiene duración de 44,04 segundos, con una tasa de muestreo 352.800 por canal, en 5.1 canales con 24 bits por amuestra. El fichero disponible en formato DSF ocupa 93.227.317 Bytes. En formato FLAC ocupa 214.690.190 Bytes.

Para conversión de los diferentes formatos se utilizó el aplicativo FFMPEG versión N-88193 en linea de comando. Importante destacar dos aspectos:

  1. El conversión en formatos sin perdidas no utiliza directamente la referencia de tasa de bits para definición de la calidad y compresión pero si niveles de calidad, por lo cual se experimentaran algunas posibilidades.
  2. El formato OGA es la extensión de formato OGG para audio y esta fue utilizada por el tema de compatibilidad con en aplicativo de conversión.

Para comparación, ofertamos una amuestra y abajo un comparativo de los diferentes formatos testados:

Fichero WaV Más Alta Calidad


Fichero MP3 192kbps


Fichero MP3 128kbps


Fichero MP3 32kbps


Fichero M4A 32kbps


Original DSF

Fichero:
2L-056_03_mch_DSD64.dsf

Tasa de Bits (aproximada):
16.667 kbps

Tamaño:
93.227.317 Bytes

Tasa de Compresión:
1,0

Origen:
Descarga de http://www.2l.no/

Fichero original em formato nativo de distribuición

Original FLAC

Fichero:
2L-056_03_mch_DSD64-original.FLAC

Tasa de Bits (aproximada):
38.381 kbps

Tamaño:
214.690.190 Bytes

Tasa de Compresión:
0,4

Origen:
Descarga de http://www.2l.no/

Fichero em formato FLAC distribuido

OGA CONVERTIDO DEL DSF

Fichero:
2L-056_03_mch_DSD64.oga

Tasa de Bits (aproximada):
3.211 kbps

Tamaño:
17.961.256 Bytes

Tasa de Compresión:
5,2

Origen:
ffmpeg -i 2L-056_03_mch_DSD64.dsf -vn -ar 44100 -ac 2 -ab -f oga 2L-056_03_mch_DSD64.oga

En el encoder FFMPEG, el container OGG (extensión OGA para OGG Audio), utiliza FLAC, por eso el tamaño es próximo. No son perceptibles diferencias para el original

OGA con 128kbps

Fichero:
2L-056_03_mch_DSD64-128kbps.oga

Tasa de Bits (aproximada):
1.146 kbps

Tamaño:
6.412.894 Bytes

Tasa de Compresión:
14,5

Origen:
ffmpeg -i 2L-056_03_mch_DSD64.dsf -vn -ar 44100 -ac 2 -ab 128k -f oga 2L-056_03_mch_DSD64-128kbps.oga

Pequeña perdida de calidad que se nota por una menor profundidad de sonidos. Mas grave las perdidas que el verificado en ficheros MP3

FlaC CON 192kbps

Fichero:
2L-056_03_mch_DSD64.FLAC

Tasa de Bits (aproximada):
3.198 kbps

Tamaño:
17.888.381 Bytes

Tasa de Compresión:
5,2

Origen:
ffmpeg -i 2L-056_03_mch_DSD64.dsf -vn -ar 44100 -ac 6 -ab 192k -f flac 2L-056_03_mch_DSD64.FLAC

No son perceptibles diferencias significativas para el original.

FLAC con 128kbps

Fichero:
2L-056_03_mch_DSD64-128kbps.FLAC

Tasa de Bits (aproximada):
1.143

Tamaño:
6.392.642 Bytes

Tasa de Compresión:
14,6 

Origen:
ffmpeg -i 2L-056_03_mch_DSD64.dsf -vn -ar 44100 -ac 6 -ab 128k -f flac 2L-056_03_mch_DSD64-128kbps.FLAC

Mismo que el OGA de mesma tasa de bits.

WAV CON 192kbps

Fichero:
2L-056_03_mch_DSD64-192kbps.wav

Tasa de Bits (aproximada):
4.075 kbps

Tamaño:
22.795.306 Bytes

Tasa de Compresión:
4,1

Origen:
ffmpeg -i 2L-056_03_mch_DSD64.dsf -vn -ar 44100 -ac 6 -ab 192k -f wav 2L-056_03_mch_DSD64.wav

Son perdidas informaciones de metadatos y el tamaño del fichero es aún un poco más largo que el equivalente FLAC y OGA. No son perceptibles diferencias en la calidad del audio para el original

WAV CON 128KBPS

Fichero:
2L-056_03_mch_DSD64-128kbps.wav

Tasa de Bits (aproximada):
1.359

Tamaño:
7.599.122 Bytes

Tasa de Compresión:
12,3

Origen:
ffmpeg -i 2L-056_03_mch_DSD64.dsf -vn -ar 44100 -ac 6 -ab 128k -f wav 2L-056_03_mch_DSD64-128kbps.wav

Son perdidos metadatos pero no son muy relevantes las diferencias para el original en la calidad de audio, aun que sea significativa la reducción del tamaño del fichero.

MP3 con 192kbps

Fichero:
2L-056_03_mch_DSD64-192kbps.mp3

Tasa de Bits (aproximada):
185 

Tamaño:
1.036.381 Bytes

Tasa de Compresión:
90,0

Origen:
ffmpeg -i 2L-056_03_mch_DSD64.dsf -vn -ar 44100 -ac 2 -ab 128k -f mp3 2L-056_03_mch_DSD64-128kbps.mp3

Son mantenidas varias de las informaciones de metadatos y el tamaño del fichero es muy reducido. No son perceptibles diferencias relevantes en la calidad del sonido.

MP3 CON 128KBPS

Fichero:
2L-056_03_mch_DSD64-128kbps.mp3

Tasa de Bits (aproximada):
124 

Tamaño:
691.355 Bytes

Tasa de Compresión:
134,8 

Origen:
ffmpeg -i 2L-056_03_mch_DSD64.dsf -vn -ar 44100 -ac 2 -ab 128k -f flac 2L-056_03_mch_DSD64-128kbps.FLAC

Son mantenidas varias de las informaciones de metadatos y el tamaño del fichero es es muy reducido. Son perceptibles perdidas en tonos graves.

MP3 CON 32KBPS

Fichero:
2L-056_03_mch_DSD64-32kbps.mp3

Tasa de Bits (aproximada):
31

Tamaño:
173.922 Bytes

Tasa de Compresión:
536,0

Origen:
ffmpeg -i 2L-056_03_mch_DSD64.dsf -vn -ar 44100 -ac 2 -ab 32k -f mp3 2L-056_03_mch_DSD64-32kbps.mp3

Son mantenidas varias de las informaciones de metadatos y el tamaño del fichero es muy reducido. Calidad de audio es significativamente afectada se notando pedidas de tonos graves y agudos, así como efecto de metalización.

M4A con 32kbps

Fichero:
2L-056_03_mch_DSD64-32kbps.m4a

Tasa de Bits (aproximada):
32 

Tamaño:
180.343 Bytes

Tasa de Compresión:
516,9 

Origen:
ffmpeg -i 2L-056_03_mch_DSD64.dsf -vn -ar 44100 -ac 2 -ab 32k 2L-056_03_mch_DSD64-32kbps.m4a

Son mantenidas varias de las informaciones de metadatos y el tamaño del fichero es mucho disminuido. Calidad de audio es significativamente afectada se notando pedidas de tonos graves y agudos aún que el resultado sea mejor que aquél observado en ficheros MP3 de misma tasa de bits

Conclusiones

Para producción o sistemas de alta fidelidad, cuando el tema de almacenamiento no es relevante, la utilización de FLAC o OGG (OGA) es recomendable, aún que, para consumo por usuarios finales, la utilización de ficheros MP3 o M4A es más interesante, incluso porque los dispositivos de reproducción domésticos, en general, no disponen de calidad para que las diferencias de calidad sean perceptibles.

Las diferencias de compresión se comparamos ficheros MP3 con tasas de 198kbps y 128kbps no es muy grande, así que se podría optar por el formato de más alta calidad para aplicaciones domesticas y para generar copias de seguridad de músicas.

Para aplicaciones web o donde compresión muy grande sea necesaria, el M4A mostró resultados más interesantes.

Actividad 3

Sistema Estéreo

PROPOSICIÓN

A partir del fichero mono bluesIntro.wav (disponible, en el subdirectorio media del recurso compartido indicado al principio de esta memoria de práctica): genere una versión estéreo del mismo donde se pueda apreciar claramente el posicionamiento del audio en los dos canales (izquierdo y derecho).

PROPOSICIÓN 1

Seleccione toda la información correspondiente al fichero y genere una copia de la misma mediante la opción Editar|Duplicar.

PROPOSICIÓN 2

Seleccione el menú desplegable situado en la cabecera de cada pista y asigne los valores canal izquierdo y canal derecho, respectivamente.

PROPOSICIÓN 3

Inserte silencios alternativamente en uno y otro canal, de modo que se aprecie mejor el efecto estéreo. Para ello, lo más sencillo es marcar una zona de la pista y seleccionar Generar|Silences2.

Actividad 4

Efectos

PROPOSICIÓN

A partir de una señal de audio mono (o estéreo, según los casos), aplique efectos y vaya anotando una breve descripción. Todos ellos están disponibles en el menú Efecto. Puede investigar, si lo desea, otros efectos disponibles.

Amplify (amplificar)

Para el efecto amplificar escogimos un género de salsa, y nos  percatamos que tiene una restricción para aumentar el nivel de reproducción,  es decir el volumen del audio, debido a que tiene una herramienta que detecta  el máximo de decibeles del audio original, sin embargo, cuando seleccionamos  la opción “permite corte” (No es recomendable), podemos aumentar el  sonido del audio (visualiza la onda extendida), pero al exportar el audio se  encuentra completamente distorsionada en sonido.  

En el caso inverso al disminuir el nivel de reproducción, es  decir el volumen, el sonido no se distorsiona y solamente el volumen del  sonido disminuye y la onda se visualiza muy delgada.

Amplificar_original.mp3


Amplificar_original (Volumen alto).wav


Amplificar_original (Volumen bajo).wav


Bassboost (realzar graves)

Al Incrementa los decibeles en los sonidos graves, el de bajo de las canciones aumenta en sonido, el audio escogido es una música boricua con mezcla de mucha percusión e instrumentos de cuerdas, por lo cual se percibe claramente el cambio de los sonidos y los agudos disminuyen incluso la onda de frecuencia sufre cambios en sus dimensiones y tiempos.

Bassboost_original.mp3


Bassboost_graves_altos.wav


Echo (eco)

Con respecto al efecto Eco hemos utilizado el audio de prueba, al generar y probar el efecto este no era fácil de percibir por ello buscando en el material de ayuda nos brindó la opción de colocarle un silencio al final y volver a dar el efecto para lograr tener un mayor efecto.

Con este efecto lo que genera son pequeñas repeticiones de sonido, el tiempo de repetición es fijo y sin pausas en cada repetición, los parámetros a configurar para el efecto son el tiempo de retraso (cantidad de retraso entre los ecos) y el factor de decaimiento. Además, el tiempo de retraso deberá ser menor al original del audio en selección.

Eco_Original.mp3


Eco_Modificado.wav


Reverse (revertir)

Con respecto al efecto se ha utilizado un audio de balada, y lo que genera es colocar el sonido al revés, la letra de la canción también sufre el cambio de escucharse al revés.

Visualmente se observa que las ondas de frecuencia del sonido se invierten en posición.

Efecto_Revertir(Original).mp3


Efecto_Revertir(Modificado).wav


Fade in (aparecer) Y Fade out (desvanecer)

Con respecto a estos dos efectos los hemos realizado con el mismo audio de género balada, seleccionamos el segmento que deseamos agregar el efecto “Aparecer” (de acuerdo con la ayuda es preferible efectuarlo más de una vez para que se perciba mejor el efecto). El resultado es que el volumen baja notoriamente en la parte seleccionada del audio y luego va retornando de acuerdo con el avance del tiempo.

Con el efecto “Desaparecer”, es similar el volumen disminuye, pero de manera gradual en la parte seleccionada. Al igual que el anterior efecto debe aplicarse más de una vez para que se pueda percibir.

En ambos efectos las ondas se reducen y como su nombre los menciona el volumen del sonido se desvanece.

Audio Original.mp3


Audio Original_modificado.wav


Cambiar pitch (tono)

El audio utilizado es de género clásico, y hemos seleccionado la mitad de la pista (la que contiene la voz de los interpretes) y hemos realizado la conversión bajando tres semitonos (-3), en la opción semitonos (pasos intermedios), la cual es más directa en caso no se conozca las notas musicales de la canción, al realizar este cambio la frecuencia del audio  disminuye, por lo cual se pierde un poco la calidad del audio, sin embargo revisando la ayuda del material para utilizar las opción directa “Tono” se debe tener conocimiento de música para ver el tema de las notas que uno desea modificar.

Tono_Original.mp3


Tono_Modificado.wav


Cambiar tempo (Cambiar ritmo) SIN AFECTAR EL tono

El audio utilizado para el ejemplo es de género balada, por lo consiguiente su ritmo es lento, al realizar el efecto “Cambiar ritmo” podemos aumentar o disminuir el porcentaje del ritmo, por lo cual la primera prueba aumentamos el porcentaje lo cual acelera el sonido de la música, ocasionando la distorsión en partes de la voz de la interprete y reduciendo el tiempo de la canción.

Se realizó una segunda prueba, pero esta vez se disminuye el porcentaje aumentando la lentitud en el sonido y el tiempo de la canción.

Cambiar Tempo(Cambiar Ritmo)-Lenta.wav


Cambiar Tempo(Cambiar Ritmo)-Rápido.wav


Actividad 5

Mixing

PROPOSICIÓN

Escoja dos temas musicales, con representación en forma de onda, del directorio del recurso compartido. A partir de los mismos, se propone generar un único archivo en el que, a modo de “pinchadiscos” con una mesa de mezclas, se vaya silenciando el primero para dar progresivamente paso al segundo.

Guárdese una captura de pantalla del proceso (mezcla.png) para poder explicar cómo se trabajó esta actividad, junto con el archivo de proyecto que genera Audacity (mezcla.aup), los ficheros de audio de partida y el resultante de la actividad (mezcla.wav).

El archivo de audio final (mezcla.wav) debe tener las siguientes características:

  1. Una duración de unos 60 segundos, de forma que los dos temas ocupen intervalos semejantes.
  2. Calidad idéntica a la de los archivos fuente.
Pistas Originais

Audio2_Riahana.wav


Audio2_SIA.wav


Pista Mezclada

Mezcla1.wav


Proyecto
1 - Uniòn de las Pistas
2 - Cross-fade y Guardar Proyecto
3 - Exportar Mezcla
4 - Probando Mezcla

Actividad 6

Charla Virtual

PROPOSICIÓN

Cree una banda sonora en la que se le escuche dar una pequeña charla de medio minuto a un auditorio (puede obtener el contenido de cualquier artículo de prensa digital, por ejemplo). Se sugiere que siga los siguientes pasos:

  1. Grabe su locución y procésela hasta obtener un nivel de volumen y calidad aceptables. Si el resultado de su grabación fuera ruidoso, elimine el ruido con ayuda de opciones como “Reducción de ruido”.
  2. Introduzca un efecto de reverberación para simular que da su charla en una sala de gran tamaño, a un amplio auditorio.
  3. Añada nuevas pista con sonido ambiental. Por ejemplo un murmullo constante de fondo, alguien que tose esporádicamente, etc. Tome estos efectos del repositorio.
  4. Introduzca sonido de aplausos cuando finalice su locución.

Guárdese una captura de pantalla del proceso (bso.png) para poder explicar cómo se trabajó esta actividad, junto con el archivo de proyecto que genera Audacity (bso,aup), los ficheros de audio de partida y el resultante de la actividad (bso.wav).

Para la realización de la banda sonora se ha descargado el sonido de la página:

http://www.sonidosmp3gratis.com/ - Sonido escogido ambiente 1.

Con respecto a la charla hemos escogido una de youtube de la siguiente dirección: https://www.youtube.com/watch?v=hmQQZtKAR6c , para descargar el video he utilizado el software aTube Catcher vers. 3.8.93 y posterior convertir a audio .mp3 el software de VLC Media Player.
Inclusión de efectos
Inclusión del ruido
Inclusión de aplausos
Resultado Final

BSO_Final.mp3


Actividad 7

Afinación

PROPOSICIÓN

Genere una senoidal de distintas frecuencias mediante la opción Generar|Tono. Le sugerimos que pruebe con una frecuencia de 440Hz, la asociada a la nota LA del diapasón usado para afinación. Observe las diferencias tanto en su representación en el dominio del tiempo

(puede necesitar hacer uso del zoom) como en la reproducción.

Seleccione un fragmento de la onda y calcule su espectro de frecuencias mediante la opción Analizar | Análisis de Espectro. Compruebe que el pico del espectro coincide aproximadamente con la frecuencia de la senoide.

1 - Generando una senoidal de 440Hz
2 - Análisis del Espectro

Actividad 8

Telefono

PROPOSICIÓN

El archivo dtmf.wav contiene el sonido resultante de la marcación de un número corto de teléfono mediante el sistema de tonos (DTMF). Recuerde que cada número se codifica mediante la mezcla de dos tonos según la tabla anterior. Averigüe de qué número se trata.

dtmf.wav


Para profundizar en este concepto vamos a analizar las señales generadas por el teclado de un teléfono doméstico que funcione por tonos. Estos dispositivos siguen el estándar conocido por DTMF (Dual-Tone Multi-Frequency). En realidad, cada número que marcamos en nuestro teclado genera una señal audible compuesta por dos tonos, de ahí su nombre, según la matriz que se muestra en la figura
Con el software Audacity se puede seleccionar partes del audio y realizar el análisis del espectro para determinar las componentes de frecuencia como presentado en las figuras
La función de análisis nos permite identificar facilmente los picos como indicado en la figura

Conclusión

Repitiendo el procedimiento para cada parte del audio, podemos averiguar que el número pulsado es 093. Como indicado a seguir:
  • Primera parte: 942 Hz ( Linea 4) y 1.336 Hz (Columna 2), que corresponde al número 0
  • Segunda parte: 851 Hz (Linea  3) y 1.476 Hz (Columna 3), que corresponde al número 9
  • Tercera parte: 696 Hz (Linea  1) y 1.476 Hz (Columna 3), que corresponde al número 3

nosotros

Alumnos de MUGI Curso 2017/18

Eliana Patricia Guaman Barbecho

Fabio Santos Lobao

Liliana Bayona Castaneda