El objetivo de este estudio es presentar una caracterización acústica de las consonantes róticas prepausales realizadas con un único componente fricativo en español peninsular. Para ello, se analizaron cuatro variables acústicas que dan cuenta de su estructura espectral (esto es, centro de gravedad, desviación estándar, asimetría y apuntamiento) y la duración. Los resultados del análisis se compararon estadísticamente con las características espectrales de las consonantes fricativas /s/ (con las que comparten punto de articulación) en la misma posición. Se han hallado diferencias estadísticamente significativas en las cinco variables, siendo el centro de gravedad en las fricativas superior en unos 2600 Hz al centro de gravedad de las róticas. Las fricativas alveolares también muestran un resultado superior en la desviación estándar y en la duración. Por el contrario, con respecto al apuntamiento y a la asimetría, los sonidos fricativos muestran valores inferiores. Finalmente, mediante el análisis lineal discriminante, se ha logrado un porcentaje de clasificaciones correctas superior al 94 % teniendo en cuenta únicamente como variables discriminantes el centro de gravedad y la asimetría.
Las consonantes róticas del español, a pesar de su gran variabilidad acústica y articulatoria, se agrupan tradicionalmente en dos categorías fonológicas: la rótica percusiva /ɾ/ y la vibrante /r/, que solo se oponen en posición intervocálica (por ejemplo en el par mínimo
En posición implosiva, tanto ante consonante como ante pausa, la rótica no es contrastiva y pueden aparecer realizaciones de la percusiva y de la vibrante, con toda la variación que esto supone. En algunos casos, se atribuye la aparición de una u otra variante al énfasis con que se produce —«según un mayor o menor énfasis puede resultar simple, múltiple o fricativa» (
Desde el punto de vista fonético, la rótica percusiva se caracteriza como una breve fase de cierre situada entre dos elementos con mayor abertura (cf.
Los estudios que se ocupan de las róticas destacan la “posición intervocálica” de la percusiva. Cuando este sonido no se encuentra en contexto intervocálico, se observa un breve segmento con características vocálicas entre la consonante adyacente y la fase de cierre de la rótica. Este elemento aparecería tanto en posición posconsonántica (cɾv) como preconsonántica (vɾc) o prepausal, contexto que nos ocupa en el presente estudio, y se conoce por términos como “elemento esvarabático” (
En posición implosiva, por tanto, una de las realizaciones esperadas y que de hecho se considera como la más habitual (
De hecho, en este contexto resultan también posibles las realizaciones sin elemento vocálico, es decir, formadas por un solo segmento que correspondería a la fase de cierre, y que puede ser una oclusión sonora, una aproximante o una fricción, así como casos de elisión. Todas estas manifestaciones se encuentran preferentemente en habla continua y, sobre todo, en conversación espontánea. Asimismo, se pueden encontrar róticas implosivas con más de una fase de cierre, que corresponderían a una realización vibrante. Aunque la articulación de la vibrante es distinta a la de la percusiva, tanto en el mecanismo de vibración como en el lugar de constricción (cf.
De todas las realizaciones posibles de la rótica, la fricativa es muy esporádica en español peninsular.
La
No se trata, por tanto, de alófonos aproximantes, como la realización [ɹ] o su variante con alargamiento [ɹː], fruto del debilitamiento de [ɾ] y [r], sino de realizaciones fricativas y tensas. El proceso de asibilación modifica el modo de articulación, que deja de ser rótico (percusivo o vibrante) para convertirse en fricativo. (p. 258)
En el espectrograma de una realización asibilada aparece fricción o turbulencia en la parte alta del espectro, lo que indica que se trata de una realización fricativa, y «si se compara […] con el de una consonante fricativa, puede apreciarse que la fricción o turbulencia posee características semejantes en ambos tipos de sonidos» (
En las variantes del español de América es más frecuente la realización denominada fricativa o asibilada de la rótica, que puede aparecer en diferentes contextos según el dialecto (cf.
Sin embargo, en posición implosiva la variante fricativa está más limitada, especialmente ante consonante. En posición prepausal parece que está más extendida: «en muchas regiones de América Latina, la /r/ final de palabra se pronuncia como fricativa, pudiéndose ensordecer parcial o completamente» (
Para comprobar estos datos, que no estaban demostrados acústicamente,
A pesar de que hasta el momento apenas se habían documentado róticas fricativas en coda silábica en español peninsular, en el estudio ya citado de
Asimismo, se observó que cuando la rótica prepausal constaba de un único componente, este era mayoritariamente fricativo (65 % de los casos analizados), algo que no se había obtenido en los estudios descriptivos anteriores basados en corpus de lectura, en que la incidencia de este tipo de realización era mínima. En cambio, el porcentaje de realizaciones con un primer componente fricativo (el que corresponde a la fase de cierre) era muy bajo en las realizaciones con dos o más componentes (
Pero lo más significativo del estudio es que se hallaron realizaciones fricativas en posiciones que no habían sido explicadas. Se trata de los casos de dos componentes en los que el segundo presenta fricción en lugar de una estructura formántica definida, característica del elemento vocálico, y que suponen el 57 % de los casos (
Estos casos resultan muy interesantes precisamente porque presentan fricción en el componente que correspondería al elemento esvarabático. Las diferentes explicaciones sobre la aparición de este segmento se basan siempre en sus características vocálicas, con una estructura muy similar a la de la vocal núcleo de sílaba. Si lo que aparece en la fase de abertura es una fricción, resulta difícil referirse a ella como elemento vocálico o vocal intrusiva. Tampoco tiene fácil explicación para la propuestas que, siguiendo el marco de la Fonología Articulatoria, consideran el elemento esvarabático como resultado de una falta de solapamiento articulatorio entre los gestos correspondientes a la /ɾ/ y la consonante siguiente, lo que hace que emerja (y se perciba) una porción de la vocal adyacente (cf.
Los resultados también muestran que el porcentaje de realizaciones fricativas en el segundo componente (que correspondería a la fase de abertura) era mayoritario cuando la rótica tenía únicamente dos componentes, mientras que descendía hasta el 25 % cuando tenía tres componentes (véase la
Además, se encontraron algunos ejemplos esporádicos de róticas de dos componentes cuyo primer componente era fricativo y, el segundo, un elemento vocálico (
Sin embargo, los elementos que centran la atención del presente estudio son los sonidos róticos realizados mediante un único componente fricativo, cuyas características espectrales no se han descrito detalladamente hasta ahora para el español peninsular en este contexto.
Este estudio se centra en el análisis de las características acústicas de las consonantes róticas en posición prepausal realizadas con un único componente fricativo en habla espontánea, con los siguientes dos objetivos:
Caracterizar acústicamente las róticas prepausales realizadas como fricativas en español peninsular.
Comparar las características espectrales de estas róticas con las fricativas alveolares también en posición prepausal con el fin de establecer si son segmentos similares o, por el contrario, difieren significativamente.
Para lograr el primer objetivo, se tendrán en cuenta las variables más ampliamente utilizadas en la descripción de la estructura espectral de los sonidos fricativos —como por ejemplo en
En relación con este segundo objetivo, se plantean las siguientes hipótesis:
La estructura espectral de las róticas prepausales realizadas como fricativas diferirá significativamente de la de las realizaciones de /s/, puesto que el control articulatorio en las róticas presenta más dificultades que el de las fricativas, y por la variación en la combinación de componentes que se da en posición prepausal (
En el caso de que la primera hipótesis sea validada, es consecuente plantear la siguiente:
Será posible identificar el vector de variables que mejor discrimina las róticas fricativas de las realizaciones del fonema /s/ en posición prepausal. En este sentido, se debería lograr un porcentaje alto de clasificaciones correctas de nuevos casos.
El corpus está constituido por 10 grabaciones con una media de 29 minutos y medio de duración (y desviación estándar de 3 minutos y 4 segundos) correspondientes a habla espontánea masculina. Los locutores eran todos hombres con una edad comprendida entre los 25 y los 35 años, con formación universitaria y originarios de la zona centro de España (Madrid y Salamanca) sin ningún acento dialectal especialmente marcado. En ninguno de ellos se detectó ninguna patología ni rasgo fonético particular.
Los locutores mantuvieron una conversación sobre temas cotidianos con un técnico del Laboratorio de Fonética del CSIC. Las grabaciones se realizaron utilizando canales separados para la voz del locutor (en una cabina insonorizada) y del técnico, de modo que no aparece ninguna interferencia o solapamiento entre las voces. Se utilizó un micrófono E6i Omnidireccional Earset. El formato de la grabación fue wav con una frecuencia de muestreo de 44100 Hz y resolución de 16 bits.
El número global de róticas prepausales con alguno de sus componentes fricativo es relativamente alto. En el corpus se encontraron 56 casos con el primer componente fricativo (que se corresponde con el 29,2 % del total de róticas en posición prepausal del corpus) y 50 ejemplos con fricción en el segundo componente (que en este caso se corresponde con el 43,5 % del total de róticas ante pausa con dos o más componentes). Sin embargo, las róticas con un único componente fricativo suman solo un total de 48 realizaciones (25 % del total de róticas en posición prepausal) con una distribución entre los locutores muy irregular (
Locutor | Total | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | ||
0 | 10 | 19 | 5 | 4 | 1 | 2 | 4 | 2 | 1 | 48 | |
37 | 30 | 90 | 19 | 33 | 33 | 62 | 66 | 32 | 50 | 414 |
Se delimitaron las róticas prepausales realizadas con un único componente fricativo, así como las fricativas alveolares prepausales, mediante la observación combinada de la onda sonora y del espectrograma. Para garantizar la fiabilidad del análisis, los dos autores segmentaron y categorizaron las róticas según sus características acústicas independientemente, alcanzando un porcentaje de coincidencia del 100 %. Los límites se marcaron en un TextGrid del programa de análisis acústico Praat (versión 5.3.45). La selección de las róticas se realizó después de haber analizado el número de componentes y la descripción de las características acústicas de todos los segmentos róticos prepausales. Se contemplaron cuatro clases de componentes distintos: elemento vocálico, oclusivo (con o sin barra de explosión), fricativo y aproximante. Los criterios que se siguieron para la determinación de las características de cada componente fueron los siguientes: presencia/ausencia de formantes; presencia/ausencia de ruido en altas frecuencias; presencia/ausencia de período de oclusión (y ocasionalmente de barra de explosión), y número de
Sin embargo, la definición de cada componente no siempre es evidente, y la clasificación como fricción puede confundirse en algunos casos con la aproximante y, en otros, con la barra de explosión que en ocasiones aparece tras un periodo de oclusión. Así, se establecieron criterios objetivos para etiquetar correctamente los segmentos. En los ejemplos en los que aparecía energía dispersa en las frecuencias altas del espectrograma, la distinción entre aproximante y fricción se basó en la presencia observable de formantes, aunque fueran muy difusos (en cuyo caso el componente se etiquetaba como aproximante); en caso contrario, el componente se consideró fricativo. Para distinguir entre barras de explosión más largas de lo esperado y componentes fricativos se tuvieron en cuenta el número de
Para el análisis de su estructura espectral, se optó por calcular los momentos espectrales. Este tipo de análisis considera el espectro como una distribución de energía cuya forma puede ser caracterizada por su media, desviación estándar, asimetría y apuntamiento o curtosis. Siguiendo la metodología propuesta en
Positive kurtosis values indicate a relatively high peakedness (the higher the value, the more peaked the distribution), while negative values indicate a relatively flat distribution. Positive kurtosis thus suggests a clearly defined spectrum with well-resolved peaks, while negative kurtosis indicates a flat spectrum without clearly defined peaks. (
Finalmente, la asimetría se relaciona con la distribución de energía a lado y lado del centro de gravedad, es decir, a la inclinación de la forma del espectro, de modo que «positive skewness suggests a negative tilt with a concentration of energy in the lower frequencies. Negative skewness is associated with a positive tilt and a predominance of energy in the higher frequencies» (
En relación con el primer objetivo (caracterizar acústicamente las róticas prepausales realizadas como fricativas), se utilizó una combinación de datos descriptivos (media y desviación estándar de las cinco variables incluidas en el análisis) y pruebas estadísticas (mediante SPSS, versión 19) con el fin de medir el posible efecto de la vocal precedente y del locutor. Para ello, se llevaron a cabo dos análisis de efectos mixtos lineales (utilizando el contexto vocálico anterior como variable fija y el locutor como variable aleatoria, para estimar el efecto de la vocal precedente, y a la inversa para estimar el efecto del locutor), que se prefirieron a las pruebas ANOVA al poder incluir en el análisis el efecto de la variación entre locutores.
En relación con el segundo objetivo (comparar las características espectrales de estas róticas con las fricativas alveolares también en posición prepausal), se partió de las dos hipótesis planteadas. La primera hipótesis predice que la estructura espectral las róticas fricativas diferirá significativamente de la de las fricativas alveolares. Para contrastar esta hipótesis se realizaron también análisis de efectos mixtos lineales con el fin de comparar las características espectrales de las róticas fricativas con los sonidos fricativos prepausales, que en esta posición son siempre alveolares y sordos. En estos test se utilizaron los cuatro primeros momentos espectrales y la duración de los segmentos analizados como variables dependientes, el segmento (rótico
Para contrastar la segunda hipótesis, se realizó un análisis lineal discriminante mediante el método de inclusión por pasos (utilizando el estadístico lambda de Wilks con criterios de entrada de 3,84 y de salida de 2,71 para el valor
La presentación de los resultados se organiza en dos apartados. En primer lugar, se describen las características acústicas de las róticas fricativas prepausales analizadas, y a continuación se comparan con las realizaciones de la consonante fricativa alveolar /s/ en la misma posición.
Las
La
Centro de gravedad (Hz) | Desviación estándar (Hz) | Apuntamiento (Hz) | Asimetría (Hz) | Duración (s) |
---|---|---|---|---|
1127,7 |
1193,9 |
18,54 |
2,63 |
0,08 |
Un aspecto destacable es la duración de las róticas realizadas como fricativas, con una media de 80 ms. Si se compara con los valores medios de la fase de cierre de una percusiva, 20–22 ms (véase la Sección 1), prácticamente cuadruplica su duración, e incluso si se tiene en cuenta también el elemento vocálico (es decir, sumando la fase de cierre y la fase de abertura), las róticas fricativas superan ampliamente la duración total de las realizaciones de dos componentes (cf.
Volviendo a la
|
|
|
---|---|---|
0,354 | ,839 | |
0,127 | ,972 | |
0,667 | ,619 | |
0,768 | ,553 | |
2,848 | ,036 |
Sin embargo, tomando en consideración el locutor como efecto fijo (y la vocal anterior como efecto aleatorio), observamos que el análisis de efectos mixtos lineales evidencia diferencias significativas para todas las variables consideradas (
|
|
|
---|---|---|
4,536 | ,001 | |
2,808 | ,015 | |
9,632 | < ,001 | |
4,679 | < ,001 | |
3,736 | ,003 |
De hecho, al comparar los espectrogramas y espectros de diferentes locutores, como los presentados en las
El segundo de los objetivos planteados persigue determinar si las características espectrales de la róticas prepausales analizadas son similares a las fricativas alveolares “canónicas” también en posición prepausal. La
Para ello, en primer lugar obtuvimos los datos descriptivos (
Centro de gravedad (Hz) | Desviación estándar (Hz) | Apuntamiento (Hz) | Asimetría (Hz) | Duración (s) |
---|---|---|---|---|
3847,4 |
1798,6 |
2,71 |
0,5 |
0,12 |
Las
Para contrastar la segunda hipótesis, que prevé que se podrá diferenciar eficazmente entre róticas fricativas y fricativas “canónicas” mediante un vector de variables, se realizó un Análisis Lineal Discriminante (ALD).
Las variables relevantes para la discriminación entre los grupos han sido el centro de gravedad y la asimetría. Por el contrario, el apuntamiento, la desviación estándar y la duración no se han empleado en el ALD. La
Función | |
---|---|
1 | |
,866 | |
-,786 | |
-,541 | |
,408 | |
,241 |
a. Esta variable no se emplea en el análisis.
Segmento | Función |
---|---|
1 | |
-2,589 | |
,300 |
Por otro lado, el ALD logra clasificar correctamente el 94,8 % de los casos en la clasificación de los casos originales y el 94,6 % en la validación cruzada.
El estudio, centrado en el habla espontánea, ha descrito desde el punto de vista acústico cómo son las róticas fricativas prepausales de un único componente, que suponen un porcentaje nada desestimable del total de róticas prepausales. A grandes rasgos, la fricción se caracteriza por un centro de gravedad bajo (1127,7 Hz de media) y un alto apuntamiento (18,54 Hz), así como por una duración considerable (80 ms de media). Sin embargo, hay que destacar también que, para todos los parámetros, la variación encontrada ha sido elevada, y se ha atribuido al efecto de los locutores, puesto que el contexto previo (el timbre de la vocal anterior) no se descubrió relevante.
En segundo lugar, el estudio ha puesto de manifiesto que las róticas fricativas prepausales, aun presentando todos los rasgos característicos de los sonidos correspondientes a fonemas fricativos, es decir, un aumento rápido de
En este aspecto, los resultados coinciden con los reportados por
En tercer lugar, y en relación con lo expuesto en el punto anterior, ha sido posible discriminar por sus características acústicas entre las róticas fricativas prepausales y las fricativas alveolares sordas, obteniendo una tasa de clasificaciones correctas superior al 94 %, tanto en la clasificación de los casos originales como en la validación cruzada. Esta alta tasa permite afirmar que, salvo en un porcentaje relativamente pequeño, los sonidos róticos realizados con una fricción son claramente distintos de las realizaciones del fonema fricativo /s/. Aun así, en un 6 % de los casos el vector de las variables no ha sido adecuado para discriminar correctamente los sonidos, por lo que en ocasiones los locutores pueden pronunciar róticas en posición prepausal de un modo muy similar a la fricativa /s/. Podría comprobarse mediante una prueba de percepción si los hablantes confunden las róticas fricativas con la /s/ o, por el contrario, las discriminan de forma clara.
Las realizaciones analizadas corresponden a un contexto muy concreto (prepausal) de una variedad específica (español centropeninsular). En la introducción se han incluido referencias a otras variedades dialectales que presentan róticas fricativas o asibiladas, que podrían ser similares a las descritas aquí o diferir en gran medida. La intuición de los autores es que, al menos en el caso de las realizaciones que corresponden a la vibrante /r/, se trata de sonidos distintos. Es, sin embargo, una apreciación subjetiva, basada en la percepción. Sería necesario comparar acústicamente nuestros datos con los obtenidos en otros estudios en que se analizan róticas fricativas, para así determinar si existen similitudes entre ellas.
Finalmente, ya se ha comentado que estos sonidos presentan una alta variación inter-locutor, por lo que los valores presentados en este estudio deben considerarse como orientativos. La constatación de esta variación inter-locutor tiene implicaciones en distintos ámbitos aplicados. Por ejemplo, constituye una variable interesante a tener en cuenta para la identificación forense de locutores. Otro ejemplo tiene que ver con el reconocimiento y síntesis del habla, especialmente si se tiene interés en producir róticas prepausales acordes al uso real por parte de los locutores.
Este trabajo ha sido parcialmente financiado por los proyectos de investigación FFI2012-34601, FFI2014-59848-C2-1-P y FFI2012-31415 del Ministerio de Economía y Competitividad (España).
En la bibliografía más tradicional, como
Para simplificar y no entrar en disquisiciones sobre la transcripción fonética más adecuada para cada realización, lo cual no es el objetivo de este trabajo, se han utilizado los símbolos fonéticos [ɹ̞] y [ɹ̞̊] para la rótica fricativa sonora y la ensordecida respectivamente, siguiendo la notación que se utiliza en