Volver a inicio

Volver al índice de contenidos


Esta sección es una presentación preliminar de los conceptos básicos de acústica tal como se usan en la investigación fonética.

1. Ondas
1.0 Definición
1.1. Tipos de Ondas
1.1.1. Ondas simples
1.1.2. Compuesta o compleja periódica
1.1.3. Compuesta aperiódica
1.2. Características de las ondas
1.2.1. Período
1.2.2. Frecuencia
1.2.3. Amplitud

2. Gráficos para la representación del sonido
2.1. Oscilograma
2.2. Espectro
2.3. Espectrograma
2.4. Gráficos de f0
2.5. Gráficos de intensidad
2.6. Gráfico de trayectoria de formantes
2.7. Gráfico de carta de formantes


=========================================


1. Ondas

Este es el tema central en fonética acústica. Es imprescindible una buena comprensión de las nociones básicas relacionadas con el concepto físico de onda.

1.0. Definición
Puedes revisar los siguientes enlaces (de Wikipedia) referidos a onda y, específicamente, a onda sonora. Recomiendo leer detenidamente, en cada caso, el párrafo inicial, que corresponde propiamente a la definición.

Onda

Onda sonora


1.1. Tipos de ondas

Existen ondas de variados tipos. Aquí se presentan las ondas simples o sinusoidales, las ondas compuestas periódicas y las aperiódicas.


1.1.1 Ondas simples

En primer lugar, recomiendo ver este interesante enlace.

En este enlace de Zona Land, aparece un gráfico con una onda a la que le puedes modificar la amplitud, la longitud de la onda [wavelength] y la fase (dado que la fase de una onda no es demasiado relevante para la percepción del habla, puedes no considerar este aspecto). El efecto es puramente gráfico, y sirve para ver cómo cambia la forma de la onda en la medida en que modificas alguna de sus propiedades.

El gráfico que muestra la forma de la onda se llama oscilograma y equivale a lo que en inglés se denomina waveform.

    Ejercicio: Practica cambiar la amplitud y la longitud hasta que te resulte previsible el gráfico resultante.

A partir de este ejercicio, debes ser capaz de responder preguntas como las siguientes:

Dada una onda,
    a. ¿cómo se modificará su oscilograma si aumenta al doble su amplitud?
    b. ¿cómo se modificará el oscilograma si la frecuencia disminuye a la mitad?

Para profundizar en esta materia, puedes revisar este enlace

En este enlace (creado por Walter Fendt y traducido por J. Muñoz) puedes ver una simulación de un resorte que oscila. Tienes la posibilidad de manipular muchas variables que afectan la forma de la onda resultante.

Selecciona Elongación para observar el movimiento del resorte. Lo importante de la observación de esta página es que veas la relación causal entre el movimiento vertical del peso sostenido por el resorte y el dibujo de la forma de la onda.

    Términos que debes manejar: onda, Hz, ciclo, período, amplitud, frecuencia, oscilograma.

Las ondas simples son ondas sinusoidales, como las que has revisado y escuchado en los puntos anteriores y el oscilograma que las representa tiene la forma típica como esta:

Oscilograma que muestra un ciclo de una onda simple
Figura: onda simple o sinusoidal (un ciclo)



Onda simple (cinco ciclos)
Figura: onda simple o sinusoidal (cinco ciclos)


Ud. Puede crear un tono como los aquí representados de manera muy sencilla usando los programas Praat o Audacity: Ir.


Para profundizar: un video.


 
1.1.2. Onda compuesta periódica

Una onda compuesta es periódica si el resultado de la suma de sus componentes produce un ciclo que se repite o si los componentes (ondas simples que la componen) tienen una relación matemática entre sí constante. Estas dos condiciones son dos maneras diferentes de referirse al mismo fenómeno.

Puedes escuchar una onda periódica compuesta cuyos componentes tienen todos diferente amplitud y sus frecuencias son:
    250 Hz
    500 Hz
    750 Hz
    1000 Hz
    Escuchar los cuatro componentes en forma sucesiva
    Escuchar la onda compuesta (los componentes en forma simultánea)

En la animación siguiente se muestra un ciclo de la onda resultante y los componentes:

Animación gif de onda compuesta a partir de ondas simples
Ciclo de la onda resultante (En negro e intermitente, la onda resultante y, en colores, los componentes sinusoidales).


¿Cómo se suman las ondas simples?

Se toma un punto temporal común a todas las ondas simples que vas a sumar y simplemente sumas los valores de amplitud que en ese punto tiene cada una. En ese punto, algunas ondas tendrán valores positivos, otras tendrán valores negativos. El resultado de la suma es el valor de amplitud de la onda resultante.

Los componentes de una onda periódica compuesta se denominan "armónicos".

La relación en Hz que hay entre los armónicos de una onda periódica compuesta se denomina frecuencia fundamental o f0. Muchas veces coincide con el primer componente.

    Términos que debes manejar: onda periódica, onda compleja o compuesta, armónicos, frecuencia fundamental.


1.1.3. Onda aperiódica
        
Una onda aperiódica es una onda compuesta cuyos componentes no tienen relación matemática entre sí. Por lo mismo, no presenta ciclos regulares en su forma.

Este es un ejemplo de oscilograma de una onda aperiódica.


Oscilograma de onda aperiódica
Figura de oscilograma de una señal aperiódica

En este momento:
Debes ser capaz de diferenciar a simple vista los oscilogramas de ruidos y sonidos

Ejercicio: señala qué partes del oscilograma corresponden a ruidos y qué partes se pueden describir como con periodicidad.


Oscilograma con partes periódicas y partes aperiódicas (muestra de habla sintética).

Ver solución.

Debes ser capaz de identificar al oído ruidos y sonidos.

 
1.2. Características de las ondas


1.2.1. Período

Entre el inicio y el fin de un ciclo en una onda hay una porción de tiempo que se denomina período.

El período se mide en unidades de tiempo y su símbolo es T.   

Observa la definición que se da en Wikipedia (en el primer párrafo) y estudia la animación con que se ejemplifica este concepto.
Fíjate en un ciclo y en la medición del T.


1.2.2. Frecuencia
   
La frecuencia es el número de ciclos que se producen en un segundo. El símbolo Hz (Hercio) significa justamente eso, ciclos en un segundo.

¿Cómo se obtiene la frecuencia a partir del período?
 
Se aplica la fórmula frecuencia = 1/T; en otras palabras, si sabes la duración de T siempre puedes calcular la frecuencia. En otras palabras, la reflexión es esta: si un ciclo dura x segundos ¿cuántos ciclos como este habría en un segundo?

     
Ejercicio. Determina la frecuencia para los siguientes períodos:

0,025 s
0,015 s
0,005 s

Ver solución


1.2.3. Amplitud (y elongación)

Es el valor de máxima elongación que tiene la oscilación de una onda respecto de su punto cero. En el oscilograma, se muestra en el eje vertical.        

Observa el siguiente gráfico de una onda sinusoidal en el que la flecha roja señala el valor de amplitud.

         Sinusoide con indicación de la amplitud
 
Veamos ahora un acercamiento a la señal y, en eje y, las marcas con los valores posibles de elongación. El valor de 0.5 es la amplitud pues es el valor máximo que esta señal alcanza.

 Sinusoide con valores de amplitud eje y


En la siguiente animación se observan algunos puntos del tiempo y el valor de elongación correspondiente.

Animación amplitud
En cada punto se muestra el valor en Pa.

El paso siguiente es entender que toda la línea azul de este gráfico es un conjunto de valores de Pa dispuestos a través del tiempo.






2. Gráficos de representación del sonido

2.1. Oscilograma

Es una representación de la variación de la elongación de la señal a través del tiempo. Es un buen ejercicio entender el oscilograma como un gráfico lineal de los valores de elongación de una señal a través del eje temporal.

La elongación se muestra en unidades pascales (Pa) y los valores oscilan entre -1 y 1.

Un error bastante corriente consiste en señalar que el oscilograma muestra tiempo e intensidad. En realidad, la intensidad es un cálculo que se hace a partir de los valores de amplitud, que son los que muestra el oscilograma.

El oscilograma es el gráfico de más importancia para los estudios fonéticos. Prácticamente toda la información que se usa en las investigaciones fonéticas se desprenden o se extraen del oscilograma.

Las siguientes son dos imágenes de oscilogramas con diferentes niveles de acercamiento.
ejemplo de oscilogramaoscilograma


2.2. Espectro

El análisis espectral se realiza en una ventana temporal (una porción de tiempo). Consiste en un análisis que da cuenta de las frecuencias (en el eje x) que están presentes en ese tiempo.

El siguiente es el gráfico de un espectro que muestra kas frecuencias presentes en la ventana temporal aplicada en el momento elegido.

espectro
Se puede observar que este espectro muestra desde 0 hasta 5500 Hz. Se ve también que las cinco frecuencias que tienen mayor relieve se encuentran hasta los 1000 Hz.
Este espectro es de banda estrecha; por esta razón se observan con nitidez los componentes (por ejemplo, los cinco primeros ya mencionados). Se puede inferir también que si el quinto compoonente está en los 1000 Hz, más o menos los otros están a 200 Hz, 400 Hz, 600 Hz y 800 Hz pues se aprecia una distancia regular entre ellos.

Este espectro está realizado de tal manera que muestra las frecuencias componentes con detalle. Es un espectro de banda estrecha. El siguiente en cambio, es un espectro de banda ancha.

espectro banda ancha

Se observa el mismo rango de frecuencia pero en este espectro no es posible distinguir las frecuencias de cada componente. Solo se puede saber en torno a cuáles frecuencias hay componentes con relevancia. Se observa así, por ejemplo, que hay relieve significativo "en torno a" los 500 Hz y a una frecuencia un poco más baja de los 1000 Hz.

Ofrecemos ahora una imagen con los dos gráficos superpuestos. El de banda estrecha se dibuja en verde y el de banda acha en azul.

espectro dos bandas



2.3. Espectrograma

De la misma manera como hay dos tipos de espectros (de banda ancha y de banda estrecha) hay también dos tipos de espectrogramas según el el ancho de banda. De hecho. eñ espectrograma está construido en función de espectros. El espectrograma puede mostrar información frecuencial más detallada o bien menos detallada, según el tipo de espectro que está en la base de su construcción. El espectrograma de la izquierda, es de banda estrecha y el de la derecha, el de banda ancha.

espectrograma de banda estrechaespectrograma de banda ancha
Dado que estos gráficos deben entenderse como un desarrollo temporal de sucesivos espectros, las zonas más oscuras coincidirán con las frecuencias de más relieve en el espectro.

2.4. Gráficos de f0

Los gráficos de f0 (o de frecuencia fundamental, o de pitch) muestran la información a través del tiempo de la variación de la frecuencia obtenida a partir de la duración del ciclo de aquellas partes periódicas de la señal. El procedimiento mediante el cual se hacen estos gráficos se llama método de autocorrelación. Las zonas de ruidos no debiesen presentar valores de f0 en estos gráficos; por lo mismo, generalmente se observa una línea entrecortada; puede ser una línea continua si todos los sonidos de la cadena son sonoros (frases como "la madera en la bodega", por ejemplo) y, por lo tanto, toda la señal será periódica.

Las dos imágenes siguientes muestran la misma pista de f0 dibujada con dos métodos diferentes.

gráfico de f0gráfico de f0

Estos gráficos de pitch son un buen reflejo de la melodía de la voz. Se observa que esta emisión comienza en una altura cercana a los 250 Hz y tiene una variación tonal ascendente hasta un poco antes del centro del enunciado, donde alcanza un poco más de los 400 Hz.  A partir de ese momento, el tono baja hasta encontrar su punto más bajo, en los aproximadamente 200 Hz y luego comenzar a subir para terminar en ascenso por sobre los 300 Hz.

Los valores se expresan en Hz aunque muchas veces se conviertan a semitonos (st) para realizar comparaciones y normalizar datos.


2.5. Gráficos de intensidad

Las curvas de intensidad son gráficos que muestran la variación en decibeles (dB) (eje y) a lo largo del eje temporal (x). Los dB se obtienen a partir de una conversión de los valores de elongación del oscilograma.

curva de intensidad
En esta curva se observa que la intensidad es mayor en la parte inicial del enunciado.

Si se compara con el oscilograma, de observa una relación entre esta curva en dB y el pefil superior del oscilograma.

oscilograma

También en la parte inicial del enunciado, la elongación de la señal es mayor que en todas las demás partes.

Dada la naturaleza de la medición en dB, lo conveniente no es tanto mirar los valores absolutos sino la relación entre ellos. En otras palabras, si un punto analizado tiene un valor de 70 dB según el programa de análisis y otro punto muestra un valor de 75 dB, lo que es relevante es que entre esos dos puntos hay una diferencia de 5 dB. Por ejemplo, en la imagen anterior se observa que los primeros momentos del enunciado están un poco más bajo de los 80 dB, luego se observa un descenso que llega un poco más bajo que los 50 dB y luego se tiene un valor alto un poco más abajo de los 70 Hz. Más informativo que estas cifras absolutas, resulta decir que la diferencia entre esos dos puntos es de 11,9 dB (78,04 dB - 66,15 dB).



2.6. Gráfico de trayectoria de formantes

Un análisis especialmente útil en los estudios de las vocales es el estudio de los formantes. Este tipo de análisis se realiza en función de una técnica llamada LPC (abreviatura de linear predictive coding) que produce un tipo de análisis espectral con un número determinado de componentes y con una forma muy aguzada en los picos frecuenciales. Cada uno de esos picos frecuenciales

A partir de ese análisis LPC se construye un gráfico en el que es muy fácil identificar el centro frecuencial de las resonancias

pista de formantes
Se observa en esta pista de formantes que la primera frecuencia destacada (los formantes se cuentas "de abajo hacia arriba", F1, F2, F3, etc.) tiene un inicio bajo y sube hasta los 1000 Hz; mientras que el formante 2 presenta al inicio una trayectoria en descenso.
En este gráfico, la atención debe ponerse en las trayectorias más continuas y evitar considerar los puntos espurios que suelen aparecer.

Los primeros dos formantes (F1 y F2) tienen especial relevancia por su correlato con las dimensiones articulatorias apertura-cierre y palatal-velar, respectivamente.

Compárese la presentada trayectoria de los formantes con los espectrogramas de arriba (que corresponden a la misma emisión).

EspectrogramaTrayectoria de formantes
Resulta más o menos evidente que en el espectrograma de banda ancha se pueden visualizar también los formantes aunque sea imposible en la práctica determinar el centro frecuencial.

Por esta razón, muchas veces se presentan los dos gráficos superpuestos.

espectrograma y trayectoria de formantes superpuesta
Espectrograma de banda ancha y trayectoria de formantes superpuesta.


2.7. Carta de formantes

Cada punto temporal tiene (o no tiene) valores para varios formantes. e observa en esta pista de formantes que la primera frecuencia destacada (los formantes se cuentas "de abajo hacia arriba", F1, F2, F3, etc.). Las frecuencias de F1 y F2 se pueden disponer en un espacio bidimensional.
Por ejemplo, estos son datos obtenidos por mis alumnos hombres del año 2017 para la vocal [o].

carta de formantes [o] masculina
(*) Observación: este gráficos está presentado como ejemplo de uso de carta de formantes; no como valores de referencia para el castellano.


Cada punto con una "o" en azul corresponde a una ocurrencia de [o] y se debe leer como la intersección de dos valores: F1 y F2. El óvalo es una manera de aproximarse a lo que sería el campo de dispersión para este conjunto de emisiones.

En el gráfico siguiente se observa, a partir de datos proporcionados por alumnas mujeres del año 2017, cada vocal escrita en el promedio de F1 y de F2 y el campo de dispersión correspondiente.


carta de formantes 5 vocales español femeninas
(*) Observación: este gráficos está presentado como ejemplo de uso de carta de formantes; no como valores de referencia para el castellano.

En las cartas de formantes se suele disponer los valores de x e y en orden inverso. En el x está representado el F2 y a la derecha el valor más alto y a la izquierda el valor más bajo. En el eje y se representa el F1 y el valor más bajo está en la parte superior.

De esta manera, los resultados se pueden asociar mejor con las cualidades articulatorias.



Respuesta
Solución: s = sonido; r = ruido.


Respuesta cálculo frecuencias a partir de la duración del ciclo
respectivamente, 40 Hz; 66,6 Hz y 200 Hz