1. INTRODUCCIÓN
⌅Las diferencias fonéticas entre hombres y mujeres se reflejan claramente en las propiedades acústicas de los sonidos vocálicos. Esta variación se relaciona principalmente con las características orgánicas de los hablantes, como la longitud de la faringe, el tamaño y masa de los pliegues vocales, y las dimensiones del espacio articulatorio (Laver y Trudgill, 1979). De acuerdo con Fant (1966, pp. 22-25), el valor de las frecuencias de los formantes es inversamente proporcional a la longitud del tracto vocal. Por este motivo, los formantes femeninos son, en promedio, 20 % más altos que los masculinos. Estas diferencias no son uniformes, es decir, varían en función del timbre. En general, las vocales cerradas tienen características acústicas semejantes en ambos sexos. Sin embargo, las vocales abiertas presentan diferencias acústicas significativas entre hombres y mujeres en diferentes lenguas del mundo (Podesva y Adisasmito-Smith, 1999; DiCanio et al., 2015). Los estudios sobre lenguas germánicas muestran que el habla masculina favorece la reducción espectral y temporal de las vocales, mientras que las mujeres producen formantes que ocupan un espacio acústico amplio y una posición periférica (Traunmüller, 1988; Byrd, 1994; Whiteside, 1996; Ericsdotter y Ericsson, 2001; Simpson y Ericsdotter, 2007; Weirich y Simpson, 2013; Weirich y Simpson, 2015).
Además de la explicación propuesta por Fant (1966), se han planteado al menos tres hipótesis que dan cuenta de las diferencias fonéticas entre hombres y mujeres en la producción de las vocales (Simpson, 2009, pp. 627-636). La primera sostiene que el dorso lingual masculino debe recorrer un mayor espacio articulatorio para alcanzar la postura característica de una vocal (Simpson, 2001, p. 2162). Esto quiere decir que, en condiciones controladas, las mujeres alcanzan posiciones articulatorias más extremas en menor tiempo, mientras que los hombres asimilan las vocales con las consonantes adyacentes o compensan esta diferencia aumentando la velocidad articulatoria (Simpson, 2001, p. 2155; 2002, p. 418).
La segunda hipótesis sostiene que los hablantes con un tono de voz agudo producen vocales con mayor distancia acústica para evitar la confusión a nivel perceptivo. Esta hipótesis está inspirada en el trabajo de Ryalls y Lieberman (1982), quienes encontraron que la inteligibilidad de las vocales desciende cuando se incrementa el valor de la f0 . Posteriormente, Diehl et al. (1996) realizaron dos experimentos de identificación de estímulos de /ɪ/ y /ʊ/ con variaciones de la f0 entre 90 Hz y 390 Hz. Como predice la hipótesis, al incrementar la f0 se redujo la inteligibilidad, pero la mayoría de los errores de identificación fueron respuestas a los estímulos correspondientes a /ʊ/. Por el contrario, en el caso de /ɪ/, el incremento de la f0 mejoró la identificación de la vocal. Diehl et al. (1996, pp. 203-206) consideran que este resultado no invalida su hipótesis, sino que muestra que la influencia de la f 0 no modifica de manera uniforme a todos los timbres vocálicos.
Los resultados de las investigaciones sobre el alemán no apoyan completamente esta hipótesis. En el trabajo de Simpson y Ericsdotter (2007), el área vocálica femenina resultó más amplia que la masculina, pero solamente se encontraron correlaciones significativas cuando se eliminaron los datos extremos. Más adelante, Simpson (2011) analizó el área acústica en un grupo de 61 mujeres. Para estimar la abertura vocálica midió la diferencia entre el primer formante (f1) y los valores de la f0 , y para determinar la anterioridad/posterioridad lingual calculó la diferencia entre los valores del primer y segundo formante. Los resultados estadísticos obtenidos no fueron concluyentes, pues las correlaciones entre estos parámetros y los valores de la f0 fueron positivas, pero moderadamente significativas.
En un estudio posterior, Weirich y Simpson (2013) analizaron los dos primeros formantes y los valores de la f0 en un corpus obtenido del habla de 56 mujeres. El análisis de los datos acústicos mostró que los formantes y el área vocálica no tienen una correlación con los valores de la f0. Esto sugiere, según los autores, que estas diferencias fonéticas están determinadas por factores anatómicos y sociolingüísticos, pero no por factores de tipo perceptivo (Weirich y Simpson 2013, p. 2972).
Goldstein (1980, pp. 232-236) sostiene que las diferencias anatómicas entre sexos se pueden compensar articulatoriamente y, por tanto, no explican completamente por qué las mujeres tienen un espacio acústico más amplio que los hombres. Por esta razón, afirma, puede tratarse de una variación condicionada, por ejemplo, por la tendencia de las mujeres a pronunciar de una manera hiperarticulada y, en general, a usar las variantes de mayor prestigio (Labov, 1990. p. 213; Silva-Corvalán, 1989, p. 70). Los resultados sobre la reducción vocálica del inglés apoyan esta interpretación, pues, de acuerdo con el patrón predominante, las mujeres usan vocales menos centralizadas, eliden con menor frecuencia que los hombres y, como hemos dicho, tienen un espacio acústico más amplio (Byrd, 1994; Whiteside, 1996; Herrmann et al., 2014; Simpson, 2009).
Esta última hipótesis permite al menos dos objeciones. Primero, se basa principalmente en datos de lenguas germánicas y, por tanto, puede reflejar una característica del habla femenina en zonas urbanas de países desarrollados, mas no una tendencia universal asociada con las diferencias anatómicas del tracto vocal (Goldstein, 1980 p. 235). Segundo, la categoría “sexo”, que se basa exclusivamente en las características biológicas de los hablantes, se superpone con la categoría “género”, una construcción social que no refleja de manera homogénea la identidad social de los individuos (Foulkes y Docherty, 2006, p. 412; Kendall y Fridland, 2021, p. 109).
El estudio de las diferencias fonéticas entre las vocales producidas por mujeres y hombres es fundamental para comprender los mecanismos generales de la producción y la percepción del habla y, como sugerimos anteriormente, es necesario para entender cómo interactúan los correlatos acústicos de los sonidos de una lengua con categorías sociales como el género de los hablantes. Por otra parte, este tipo de trabajos son importantes para saber si: 1) las motivaciones sociales tienen las mismas manifestaciones fonéticas en comunidades con diferentes características socioeconómicas y culturales, y 2) determinar si las características orgánicas se pueden diferenciar de aquellas que reflejan un comportamiento estrictamente sociofonético.
2. OBJETIVO
⌅Si bien el español no es una lengua con reducción fonológica (Hualde y Colina, 2014), el timbre y la duración se reducen fonéticamente en habla espontánea (Harmegnies y Poch-Olivé, 1992) o según la tonicidad, el entorno consonántico y la velocidad de elocución (Nadeu, 2014; Correa, 2017, 2021; Romanelli y Menegotto, 2018). En ese sentido, se trata de un escenario diferente al que se considera en los estudios sobre lenguas germánicas, pero con las condiciones necesarias -la reducción espectral y temporal- para evaluar las hipótesis que explican las diferencias fonéticas entre hombres y mujeres en la producción de las vocales:
-
El área del espacio vocálico (AEV) femenino es mayor que el masculino. Esto quiere decir que las vocales producidas por las mujeres son periféricas y, por tanto, tienen mayor área acústica.
-
La centralización, esto es, el desplazamiento de los valores de f1 y de f2 hacia el centro del espacio acústico, es mayor entre los hombres que entre las mujeres.
-
Los hablantes con una f0 alta tienen un AEV mayor que los hablantes con una f0 baja (Ryalls y Lieberman, 1982; Diehl et al., 1996).
3. MÉTODO
⌅3.1. Participantes y materiales
⌅En este estudio participaron 11 mujeres y 11 hombres nacidos en la ciudad de Bogotá (Colombia), con edad media de 28 años y con estudios universitarios. Durante la sesión de grabación cada hablante leyó 4 textos con una velocidad de elocución normal, rápida y lenta. En esta investigación analizamos únicamente el habla leída a velocidad normal. En Correa (2021) se presenta un análisis acústico detallado de las vocales producidas en las tres velocidades.
El análisis de la centralización y el AEV se realizó con vocales no nasalizadas en sílabas abiertas, precedidas de consonantes labiales, dentoalveolares y velares, y seguidas de una consonante dentoalveolar perteneciente al ataque de la sílaba siguiente. Se analizó un total de 2509 vocales distribuidas como se muestra en la Tabla 1. El número de casos es diferente debido a la baja frecuencia de aparición que presentan las vocales cerradas en español /i, u/.
C1 | i | e | a | o | u |
---|---|---|---|---|---|
Labial | 65 | 251 | 282 | 141 | 79 |
Dentoalveolar | 172 | 294 | 206 | 475 | 132 |
Velar | 0 | 62 | 165 | 88 | 97 |
Total | 237 | 607 | 653 | 704 | 308 |
3.2. Mediciones acústicas
⌅Los valores de los formantes y de la frecuencia fundamental se tomaron en el pulso glotal intermedio de cada vocal. Los formantes se analizaron con el algoritmo Burg de Praat (Boersma y Weenink, 2021) y luego se transformaron a la escala Bark para relacionar perceptivamente el AEV con la f0 (Weirich y Simpson, 2013, p. 2969). La conversión se realizó con la fórmula de Traunmüller (1997):
El área del espacio vocálico (AEV) se calculó teniendo en cuenta el triángulo formado por las frecuencias de los dos primeros formantes de las vocales /i, a, u/ siguiendo el método propuesto por Blomgren, Robb y Chen (1998, p. 1045).
En esta investigación, el grado de centralización se entiende como la distancia entre las frecuencias de los formantes y el centro del espacio acústico. Para calcularlo usamos, en primer lugar, la distancia euclídea, que es la suma de las diferencias entre cada formante y su valor medio al cuadrado (Koopmans-van Beinum, 1983). En segundo lugar, usamos la tasa de centralización de los formantes (TCF) (Sapir, Raming y Spielman, 2010, p. 116), una medición que ha sido usada para estudiar habla normal y habla patológica. Esta tasa es independiente del sexo del hablante y, por tanto, aporta resultados que no dependen de las diferencias anatómicas.
El análisis cuantitativo se realizó mediante el entorno de programación R (R Core Team, 2021). En particular, usamos el paquete PhonR (McCloy, 2012) para hacer las conversiones de las frecuencias de los formantes, y el paquete ggplot2 (Wickham, 2016) para visualizar los datos acústicos.
4. RESULTADOS
⌅4.1. Área del espacio vocálico (AEV)
⌅Los resultados muestran que el AEV de las mujeres (M=7.90 Bark2, DE=1.9) es más amplia que el AEV de los hombres (M=4.64 Bark2, DE=1.8). De acuerdo con los resultados de una prueba t direccional, esta diferencia resultó estadísticamente significativa (t (19,8) = -4.02, p < .001). Sin embargo, es importante tener en cuenta que en nuestro corpus algunos hombres tienen un AEV por encima del promedio (BOG03, BOG05, BOG13, BOG15, BOG19) y algunas mujeres tienen un AEV por debajo de lo esperado (BOG16, BOG18, BOG20). Esto indica que algunos hablantes usan un AEV que se aleja del patrón predominante en ambos sexos. La Figura 2 presenta el AEV en orden ascendente. Como se observa, estas variaciones individuales se ubican en una zona entre los 4.4 Bark2 y los 7.6 Bark2, por fuera de la cual los valores del AEV corresponden a uno u otro sexo.
4.2. Tasa de centralización de los formantes (TCF)
⌅La Figura 3 ilustra la TCF: los valores más altos indican mayor centralización y los más bajos corresponden a espacios acústicos amplios o hiperarticulados. Los resultados del análisis muestran que tanto los hombres como las mujeres centralizan el espacio acústico. Esto significa que en nuestro corpus la TCF de las vocales masculinas (M=1.21, DE=0.1) y femeninas (M=1.16, DE=0.6) no presentan diferencias estadísticamente significativas (t (19.9) = 1.47, p = .07).
4.3. Dispersión vocálica
⌅La Figura 4 muestra la distancia euclídea de las cinco vocales españolas. El centro acústico es el valor de frecuencia medio del f1 y f2 de cada hablante. Como se ve, la centralización sigue el mismo patrón en ambos sexos: las vocales cerradas /i, u/ están más alejadas del centro del espacio acústico que las medias /e, o/, y la vocal abierta /a/ es la más centralizada en el habla de todos los informantes. Tomados los datos en conjunto, la dispersión no presenta diferencias estadísticamente significativas (t (104.5) = 1.30, p = .097) entre los hombres y las mujeres analizados en este estudio.
Al comparar los datos por timbre (Figura 4), encontramos que la dispersión no varía de manera uniforme. Las vocales posteriores son más centralizadas entre los hombres que entre las mujeres (/o/: t (19.5) = 4.28, p = .00; /u/: t (19.9) = 4.16, p = .00). Las vocales anteriores no presentan diferencias significativas entre sexos (/i/: t (19.9) = 0.94, p = .17; /e/: t (19.8) = -2.3, p = .98), aunque se aprecian variaciones individuales importantes. Como se dijo anteriormente, /a/ es el timbre más centralizado [a̝] en todos los hablantes, aunque, de acuerdo con los resultados de una prueba t direccional, esta tendencia es mayor entre las mujeres (t (19.8) = 2.32, p = .01).
4.4. Correlación entre el AEV y la f0
⌅En el corpus analizado, los hombres tienen una f0 media de 116.7 Hz (0.9 Bark) y las mujeres tienen un valor promedio de 210 Hz (2.0 Bark). Como se ve en la Figura 5, mientras que el AEV de los hablantes se ordena en una escala gradual, la frecuencia fundamental tiene una distribución bimodal, pues los hombres siempre tienen valores de frecuencia fundamental más bajos que las mujeres. En consecuencia, no obtuvimos valores medios de f0 ubicados entre los 141 Hz (1.28 Bark) y los 191 Hz (1.86 Bark).
Para determinar si el espacio acústico tiene una correlación con la frecuencia fundamental, se calculó el coeficiente de correlación de Pearson entre el AEV y la media de f0 de cada hablante. Los resultados indican que, en efecto, hay una correlación positiva, moderada y estadísticamente significativa (r = 0.67, df = 20, p < .001) entre la AEV y la f0 de los hablantes (Figura 5). La correlación es moderada debido a la ausencia de valores de frecuencia fundamental en la parte intermedia de la línea de regresión, así que no podemos decir que exista una relación completamente monotónica entre ambas variables.
La Tabla 2 presenta un resumen de los datos correspondientes al AEV, la TCF y la f0. Como se observa, el área vocálica femenina es, en promedio, casi dos veces más amplia que la masculina. También se caracteriza por presentar un amplio rango de valores que dependen de la actuación fonética de cada hablante. La TCF se ubica entre los 1.04 y 1.46 Bark y sus valores dependen de la variación individual. En la Tabla 2 se aprecia que, si bien hay una correlación entre el AEV y la f0, estos parámetros parecen ajustarse de manera independiente. Es decir, los hablantes pueden usar una AEV amplia pero una frecuencia fundamental baja y, viceversa, una AEV estrecha con una f0 alta.
Hablante | AEV (Bark2) | TCF (Bark) | F0 (Bark) |
---|---|---|---|
2 | 9.65 | 1.09 | 2.32 |
4 | 8.77 | 1.15 | 2.27 |
6 | 11.03 | 1.10 | 2.13 |
8 | 7.63 | 1.18 | 2.01 |
10 | 8.84 | 1.04 | 1.86 |
12 | 7.73 | 1.16 | 2.21 |
14 | 9.39 | 1.14 | 1.88 |
16 | 6.10 | 1.17 | 1.91 |
18 | 4.95 | 1.27 | 2.11 |
20 | 4.70 | 1.22 | 1.87 |
22 | 8.20 | 1.25 | 2.21 |
Media | 7.90 | 1.16 | 2.07 |
1 | 3.33 | 1.23 | 0.62 |
3 | 5.85 | 1.12 | 0.88 |
5 | 6.92 | 1.10 | 0.88 |
7 | 2.54 | 1.31 | 0.82 |
9 | 3.90 | 1.12 | 0.92 |
11 | 3.77 | 1.31 | 1.02 |
13 | 6.66 | 1.18 | 1.04 |
15 | 5.24 | 1.17 | 1.06 |
17 | 1.54 | 1.46 | 1.28 |
19 | 6.87 | 1.15 | 1.11 |
21 | 4.45 | 1.25 | 1.10 |
Media | 4.64 | 1.21 | 0.97 |
5. CONCLUSIONES
⌅En este estudio analizamos las diferencias fonéticas entre hombres y mujeres en la producción de las vocales del español de Bogotá (Colombia). Evaluamos la hipótesis según la cual las mujeres producen vocales que tienen un espacio acústico periférico y los hombres un espacio vocálico centralizado. Nuestros resultados muestran, en primer lugar, que, como supone la hipótesis, las mujeres tienen un AEV más amplia que los hombres. El AEV parece estar bajo el control del hablante, pues identificamos participantes que pronuncian las vocales con el patrón contrario. De acuerdo con la teoría acústica de la producción del habla (Fant, 1966), estas diferencias en el AEV están determinadas por las características orgánicas como la longitud de la faringe y las dimensiones del espacio articulatorio. Sin embargo, como ha sugerido Goldstein (1980, p. 232-235), el efecto de las características anatómicas sobre los valores de frecuencia de los formantes se puede contrarrestar. Por esta razón, el AEV presenta una zona entre 4.4 y 7.6 Bark2 en la cual los sexos se solapan y, según nuestra interpretación, permite a los hablantes alejarse de las tendencias asociadas a uno u otro sexo.
En segundo lugar, encontramos que, en el español de Bogotá, tanto los hombres como las mujeres centralizan las vocales. Este resultado lo obtuvimos al analizar la TCF y la dispersión de los formantes vocálicos de los participantes en conjunto. No obstante, al analizar la dispersión por timbre, encontramos que la vocal abierta /a/ es centralizada [a̝] en la mayoría de los hablantes, principalmente entre las mujeres. Las vocales anteriores /i, e/ no presentan diferencias significativas entre los dos sexos, y las posteriores /o, u/ son más centralizadas en el habla masculina. Concluimos que la centralización del espacio vocálico es una característica fonética individual, mientras que la dispersión, determinada por medio de la distancia euclídea, varía en función de factores lingüísticos como el timbre.
Tercero, evaluamos, motivados por experimentos previos sobre la percepción de las vocales, si hay una relación entre la frecuencia fundamental y el AEV. Los resultados estadísticos sugieren que hay una correlación positiva, pero moderadamente significativa, entre los dos parámetros acústicos. La correlación es moderada debido a que ningún hablante tuvo una frecuencia fundamental media entre los 141 Hz (1.28 Bark) y los 191 Hz (1.86 Bark). Este patrón concuerda con lo reportado por Simpson (2011) para el alemán. Esto indica que la frecuencia fundamental de los hablantes se correlaciona con el AEV, pero se agrupa de manera categórica en ambos estudios. Esta diferenciación binaria de la f0 no excluye, de ninguna manera, la posibilidad de que existan hablantes bogotanos que se alejen de los estereotipos, como ocurre en el caso del AEV.
En futuros estudios es necesario investigar en mayor detalle cuáles son los efectos perceptivos de las variaciones en el AEV, el grado de centralización y la f0. En especial, es importante conocer la relación entre estas propiedades acústicas y la percepción del sexo y la identidad de género. Consideramos que los estudios sociofonéticos, como los que proponemos aquí, permiten entender mejor cuáles son las diferencias fonéticas entre hombres y mujeres, cómo se construye la identidad fonética individual y categorías más complejas como el género.