Percepción del contraste bilabial-labiodental en las consonantes aproximantes del castellano de Chile[1]

Mauricio A. Figueroa Candia1, Bronwen G. Evans2

1Universidad de Concepción (Chile)

2University College London (Reino Unido)

maufigueroa@udec.cl ORCID: https://orcid.org/0000-0001-9977-3510

bronwen.evans@ucl.ac.uk ORCID: https://orcid.org/0000-0002-8495-2687

 

RESUMEN

Hasta hace poco, el consenso en los precedentes investigativos era que las realizaciones labiodentales de /b/ no existían en el español, y que la variación de su punto de articulación podía ignorarse sin problemas. Sin embargo, evidencia reciente ha demostrado que variantes labiodentales existen y que son frecuentes, al menos en algunas variantes del castellano, como en el caso del castellano chileno. Este estudio se propone determinar si los oyentes del castellano chileno son capaces de percibir las diferencias entre realizaciones aproximantes bilabiales y labiodentales de /b/ (i.e., [β̞] versus [ʋ]). Para evaluar lo anterior, estímulos naturales y sintéticos de [β̞] y [ʋ] fueron preparados y presentados a 31 oyentes nativos en tareas de identificación y discriminación. Los resultados muestran que, mientras en la tarea de identificación con estímulos naturales la evidencia no es concluyente respecto de la existencia de sensibilidad ante el contraste, en las tareas de identificación y discriminación con estímulos sintéticos no existe evidencia que sugiera que los oyentes estén percibiendo el contraste auditivo categóricamente. En suma, los oyentes no parecen ser capaces de percibir las diferencias acústicas entre estos segmentos, y por lo tanto es improbable que el contraste esté siendo utilizado para codificar información sociolingüística.

 

ABSTRACT

Perception of the bilabial-labiodental contrast in the approximant consonants of the Chilean Spanish.– Until recently, the consensus was that labiodental realizations of Spanish /b/ did not exist, and that consequently this variation in place of articulation could be safely disregarded. However, new evidence emerged showing that labiodental variants of /b/ do exist in relatively high numbers, at least in some dialects such as in Chilean Spanish. This study set out to determine whether Chilean Spanish listeners are able to perceive the differences between bilabial and labiodental approximant variants of Spanish /b/ (i.e., [β̞] versus [ʋ]). In order to test this, natural and synthetic stimuli were presented to 31 native listeners in identification and discrimination tasks. Results showed that, while the identification task with natural stimuli provided mixed evidence of sensitivity to the contrast, the identification and discrimination tasks with synthetic stimuli provided no evidence of listeners perceiving the phonetic contrast categorically. In sum, listeners do no seem able to perceive the acoustic differences between the two segments, and thus it is unlikely that this phonetic contrast could be employed to encode sociolinguistic information.

 

Enviado: 01/10/2019 Aceptado: 06/08/2020 Publicado en línea: 14/05/2021

Citation / Cómo citar este artículo: Mauricio A. Figueroa Candia y Bronwen G. Evans (2020). Percepción del contraste bilabial-labiodental en las consonantes aproximantes del castellano de Chile. Loquens, 7(1), e067. https://doi.org/10.3989/loquens.2020.067

Palabras clave: consonantes aproximantes, bilabiales, labiodentales, percepción, español chileno.

Keywords: spirant approximants, bilabials, labiodentals, perception, Chilean Spanish.

Copyright: © 2020 CSIC. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia de uso y distribución Creative Commons Reconocimiento 4.0 Internacional (CC BY 4.0)


 

CONTENTS

1. INTRODUCCIÓN

2. MÉTODOS

3. RESULTADOS

4. DISCUSIÓN Y CONCLUSIONES

NOTES

AGRADECIMIENTOS

REFERENCIAS

1. INTRODUCCIÓNTOP

La variación del fonema /b/ del castellano ha recibido considerable atención dado su rol en varios debates que involucran a la serie natural /b d g/, como el relacionado con el debilitamiento versus fortalecimiento de las variantes de estas unidades fonológicas (Harris, 1969; Lozano, 1978; Goldsmith, 1981; Danesi, 1982; Mascaró, 1984; Hualde, 1989; Baković, 1994; Piñeros, 2002; Barlow, 2003), o discusiones relacionadas con la adecuación de llamar a las variantes no oclusivas de /b d g/ como “fricativas” o no (Martínez-Celdrán, 2004). Los desarrollos más contemporáneos del tema se han centrado en la alta variabilidad de la serie oclusiva sonora entre y dentro de los dialectos del castellano (e.g., Carrasco, Hualde y Simonet, 2012; Figueroa Candia, 2016) y en intentos de encontrar correlatos acústicos que permitan determinar algunas de las características articulatorias de este tipo de segmentos (e.g., Hualde, Simonet, Shosted y Nadeu, 2010; Hualde, Shosted y Scarpace, 2011).

A estas alturas, ya son hechos aceptados que existe un continuo de realizaciones desde aquellas oclusivas sonoras hacia las realizaciones aproximantes y elididas de /b d g/ (e.g., Almeida y Pérez Vidal, 1991; Cole, Hualde y Iskarous, 1999; Simonet, Hualde y Nadeu, 2012), que la mayoría de las realizaciones no oclusivas son consonantes aproximantes de algún tipo (Martínez-Celdrán, 2004; Martínez-Celdrán y Regueira, 2008), y que variables como el contexto fonético, la frecuencia léxica y la tarea de elicitación contribuyen a explicar el modo de articulación que emergerá en actividades de producción (e.g., Eddington, 2011; Ortega-Llebaria, 2003; Colantoni y Marinescu, 2010; Bybee, 2000, 2003; Brown, 2013; Carrasco et al., 2012; Figueroa Candia, 2016).

A diferencia de la investigación que se concentra en el modo articulatorio, aún no existe un consenso en todas las variedades del castellano respecto de cuál es el punto de articulación más típico para la consonante /b/. En efecto, hasta hace relativamente poco, la visión que predominaba en los precedentes de investigación era que todas sus realizaciones, sino su mayoría, eran bilabiales, y que las realizaciones labiodentales eran suficientemente infrecuentes como para descartarse de manera segura (véase Sadowsky, 2010 para una síntesis sobre el debate). Nuevos hallazgos, sin embargo, han mostrado que las variantes labiodentales efectivamente existen (Stevens, 2000; Cepeda, 2001; Borland Delorme, 2004; Romero, Guerreiro y Alviárez, 2008; Trovato, 2017), y que en algunos dialectos son de hecho más frecuentes que las realizaciones bilabiales, con las que coexisten, aparentemente, en variación libre (Sadowsky, 2010; Vergara Fernández, 2011, 2013; Vergara y Pérez, 2013; cf. Trovato, 2017).

Aunque ha habido avances respecto de la discusión sobre el punto de articulación de /b/, hasta la fecha no existen estudios que hayan investigado si los oyentes del castellano son capaces de percibir de manera confiable el punto de articulación de variantes aproximantes de /b/. Mientras parece seguro asumir que los oyentes son capaces de distinguir auditivamente entre variantes que se diferencian en su modo articulatorio (Harper, 2014), es más difícil predecir si los oyentes son sensibles al punto de articulación de variantes aproximantes de /b/. Determinar este asunto es de importancia dado que, si los oyentes son capaces de identificar y discriminar [β̞] de [ʋ], esta variación podría servir para codificar información sociolingüística (Labov, 1972; Eckert y Labov, 2017), y en ese caso debería ser tomada en cuenta en estudios de producción, y en la preparación de estímulos para estudios de percepción que involucren al fonema en cuestión. Además, si el contraste es efectivamente audible, también se refuerza la importancia de continuar avanzando hacia la determinación del punto de articulación de las diversas variantes alofónicas de /b/.

1.1. El fonema /b/ en castellano y en el castellano chilenoTOP

La tradición de investigación sobre el fonema /b/ del castellano señala que esta consonante se articula como la bilabial y oclusiva sonora [b] luego de pausas silentes y de consonantes nasales, y que en los demás contextos fonéticos se la articula como la aproximante bilabial sonora [β̞] (e.g., Harris, 1969). Mientras esta descripción general sigue siendo pertinente para la mayoría de las variantes dialectales del castellano, existe evidencia que sugiere que es más preciso caracterizar la variación de /b/ como perteneciente a un continuo de realizaciones a lo largo de un eje de constricción articulatoria, cuyas realizaciones se encuentran determinadas, primariamente, por el contexto fonético (e.g., Ortega-Llebaria, 2003; Colantoni y Marinescu, 2010; Eddington, 2011; Simonet et al., 2012). En particular, mientras contextos fonéticos en interior de palabra e intervocálicos favorecen variantes debilitadas de /b/ (e.g., Martínez Celdrán, 1984; Carrasco et al., 2012), variantes con mayor constricción aparecen luego de pausas silentes, consonantes nasales, fricativas y laterales (e.g., Eddington, 2011). También, variantes más debilitadas pueden ser encontradas después de sílabas o vocales acentuadas (Ortega-Llebaria, 2003; Hualde, 2005; Eddington, 2011; Carrasco et al., 2012; Harper, 2014). En el caso del castellano chileno, la variante dialectal en la que se centra este estudio, las realizaciones oclusivas sonoras son normalmente articuladas después de pausas silentes y consonantes nasales homorgánicas (Lenz, 1940; Oroz, 1966; Salas, 1996-1997; Cepeda, 2001; Borland Delorme, 2004; Sadowsky, 2010), mientras que las realizaciones aproximantes y la elisión completa son más frecuentes después de vocales acentuadas, en contextos intervocálicos, en posición inicial de sílaba en grupos consonánticos, en la coda silábica, y cuando la consonante se encuentra dentro de un morfema flexivo de alta frecuencia (Silva-Fuenzalida, 1952-1953; Véliz, Araya y Rodríguez, 1977; Cepeda, 1991, 1994; Cepeda y Poblete, 1993; Salas, 1996-1997; Borland Delorme, 2004; Cid Uribe y Céspedes Morales, 2008).

Como se mencionó anteriormente, las realizaciones labiodentales de /b/ solían considerarse como no existentes en el castellano, o, cuando sí, como una manifestación de un habla poco auténtica o afectada, proveniente de hablantes que intentaban correlacionar sus realizaciones articulatorias de /b/ con la diferencia ortográfica entre palabras escritas con <b> y <v>, sobre todo en contextos de habla pública (e.g., Oroz, 1966; Haulica, 1970; Blanch, 1988; Salas, 1996-1997)[2]. Aunque los primeros reportes sobre realizaciones labiodentales de /b/ en el castellano chileno se remontan a la década de los 90 (e.g., Cepeda, 1991), no fue hasta hace poco que las realizaciones labiodentales de /b/ fueron estudiadas en más detalle (Sadowsky, 2010; Sadowsky y Salamanca, 2011; Soto-Barba, Díaz y Pereira, 2015). Estos estudios sugieren que las realizaciones labiodentales de /b/ son frecuentes, y que se encuentran presentes en una amplia gama de contextos fonéticos, incluyendo el ataque silábico y codas, luego de consonantes líquidas y vocales no redondeadas (Sadowsky, 2010; Vergara Fernández, 2011, 2013; Vergara y Pérez, 2013; Soto-Barba et al., 2015).

Por el contrario, se sabe muy poco sobre las características acústicas de las variantes aproximantes de /b/ en el castellano, y en el castellano chileno. En otras variedades del español, se ha mostrado que las consonantes aproximantes de /b/ tienen una duración promedio entre los 30 y 60 ms (Almeida y Pérez Vidal, 1991; Martínez Celdrán, 1984, 2013), y que su intensidad relativa se encuentra inversamente correlacionada con su grado de constricción articulatoria (Ortega-Llebaria, 2003; Colantoni y Marinescu, 2010; Eddington, 2011; Hualde, Simonet y Nadeu, 2011; Carrasco et al., 2012; Figueroa Candia, 2016). En el caso de los formantes orales, se han reportado valores promedio de f1 de 405 Hz y de f2 de 1080 Hz (Almeida y Pérez Vidal, 1991). Para el castellano chileno, las variantes aproximantes de /b/ han mostrado duraciones promedio entre los 48 y 65 ms, valores de f1 que van desde los 346 a 473 Hz, dependiendo del tipo de consonante aproximante realizada, y valores promedio de f2 de 1463 Hz (Figueroa Candia, 2016). Hasta la fecha, no existe información respecto de potenciales diferencias acústicas entre las variantes [β̞] y [ʋ] en castellano, porque los estudios que reportan valores acústicos de las realizaciones aproximantes no han considerado la variable punto de articulación en sus análisis. Dado que hasta el momento no existen antecedentes de distribuciones bimodales en alguna de las variables acústicas asociadas a las realizaciones aproximantes de /b/, no es posible asegurar que las diferencias de punto de articulación se encuentran codificadas acústicamente (Figueroa Candia, 2016), aunque tampoco se puede descartar que exista un efecto de punto de articulación en el dominio acústico. En el mismo sentido, se sabe muy poco sobre cómo los oyentes perciben las diferencias entre las variantes alofónicas de /b/. Hasta donde tenemos noticia, solamente dos estudios han abordado este asunto, y ambos en el contexto de investigaciones que buscaban determinar factores que influencian la percepción de variantes de /b d g/ dependiendo de su grado de constricción, pero en ninguno de los dos casos se tuvo en cuenta la variable punto de articulación de /b/ (Harper, 2014; Figueroa Candia, 2016).

Este estudio se propone determinar si los oyentes del castellano chileno son capaces de identificar y discriminar [β̞] y [ʋ]. Para abordar este objetivo, oyentes nativos del castellano chileno realizaron tareas de identificación de [β̞] y [ʋ] con estímulos naturales, y completaron tareas de identificación y discriminación con continuos sintéticos desde [β̞] a [ʋ]. Si los alófonos [β̞] y [ʋ] son percibidos auditivamente de manera categórica en contextos naturales, entonces sería esperable que los oyentes presenten evidencia en esta dirección en todas las tareas de este estudio, esto es: baja superposición de las distribuciones de respuestas correctas en la tarea con estímulos naturales, resultados alejados del nivel de azar[3] en las dos tareas de identificación, y un claro pico de sensibilidad discriminativa en la tarea de discriminación. Sin embargo, si solo existe evidencia débil de percepción categórica en la tarea de identificación con estímulos naturales, en ese caso, las tareas con estímulos sintéticos contribuirán a evaluar de mejor manera esta evidencia, con la finalidad de confirmar o rechazar una hipótesis de contraste. Si no se encuentra evidencia de percepción categórica en la primera tarea con estímulos naturales, en ese caso los resultados de las tareas con los estímulos sintéticos deberían encontrarse cerca del nivel de azar. Finalmente, si se encuentra evidencia de percepción categórica en las dos tareas de identificación (con estímulos naturales y sintéticos), pero no en la tarea de discriminación, puede significar que los oyentes son capaces de reconocer las dos categorías como distintas, pero que la distancia entre los estímulos en la tarea de discriminación es muy pequeña como para proveer juicios de sensibilidad discriminativa.

2. MÉTODOSTOP

2.1. ParticipantesTOP

Treinta y un adultos, hablantes monolingües del castellano chileno, participaron en el experimento (25 mujeres y 6 hombres; edad promedio 20.6 años). Los participantes eran estudiantes de pregrado residentes en Santiago de Chile. Ninguno de los participantes reportó algún tipo de impedimento de habla, audición, lenguaje u otro. Antes de la realización de las tareas experimentales, los participantes leyeron un reporte con información sobre el estudio, llenaron un breve cuestionario sociolingüístico, y firmaron consentimientos informados. Los sujetos fueron compensados económicamente por su participación.

2.2. EstímulosTOP

Ochenta instancias de los pares mínimos constituidos por las pseudopalabras [ˈsa.β̞a] vs. [ˈsa.ʋa] y [ˈga.β̞a] vs. [ˈga.ʋa] fueron grabadas por el primer autor, un hablante monolingüe del castellano chileno. Las grabaciones se llevaron a cabo en una cabina insonorizada, utilizando un micrófono de condensador Rode NT1A, conectado a un computador de escritorio ejecutando el programa RME TotalMix mixer, a través de una interfaz RME Fireface UC. Las grabaciones se realizaron con una frecuencia de muestreo de 44.1 kHz y una resolución de 16 bit. De manera simultánea, se realizaron grabaciones de video mediante una grabadora Canon LEGRIA HF G30, ubicada al frente de la boca del hablante, a una distancia aproximada de 30 cm. Análisis auditivos y la inspección de las formas de onda y espectrogramas en Praat (Boersma y Weenink, 2015) confirmaron que las realizaciones aproximantes de las consonantes fueron todas en efecto realizaciones aproximantes prototípicas, esto es, aproximantes espirantes abiertas (Martínez-Celdrán y Regueira, 2008), además de buenas realizaciones del segmento objetivo. Inspecciones cuadro a cuadro de las grabaciones de video confirmaron también que el punto articulatorio de cada realización era el deseado. Los estímulos fueron luego extraídos y guardados en archivos WAV individuales, y su intensidad promedio se escaló a 70 dB.

De este conjunto de estímulos iniciales, ocho fueron elegidos para cada pseudopalabra para ser utilizados en una tarea de identificación con estímulos naturales. Los valores acústicos promedio para las consonantes aproximantes de cada tipo de pseudopalabra se encuentran provistos en la Tabla 1. Las variables acústicas elegidas para la caracterización de las consonantes aproximantes son las que tradicionalmente se han utilizado en la descripción de estos sonidos (e.g., Martínez Celdrán, 1984, 2013) y las que se han utilizado de manera exitosa para procesos de modelamiento acústico y síntesis (Figueroa Candia, 2016).

Tabla 1: Características acústicas promedio de las consonantes aproximantes utilizadas en la tarea de identificación con estímulos naturales, separadas por categoría de pseudopalabra. La intensidad corresponde al mínimo de intensidad dentro de la consonante. La frecuencia fundamental, los formantes orales desde f1 a f3, y los anchos de banda para los formantes orales desde el f1 al f3 fueron calculados como un promedio de los valores obtenidos en el 50% interior de cada realización.

  Bilabial Labiodental
[ˈsa.β̞a] [ˈga.β̞a] [ˈsa.ʋa] [ˈga.ʋa]
Duración (ms) 64.0 61.0 62.1 59.9
Intensidad (dB) 67.3 68.6 66.4 65.3
f0 (Hz) 136 137 131 132
f1 (Hz) 438 450 453 447
f2 (Hz) 1161 1172 1161 1191
f3 (Hz) 2524 2524 2531 2507
f1bw (Hz) 198 192 243 234
f2bw (Hz) 94 88 100 123
f3bw (Hz) 222 152 298 388

Como se observa en la Tabla 1, en general, las características acústicas de [β̞] y [ʋ] fueron consistentes con aquellas reportadas en estudios previos (Almeida y Pérez Vidal, 1991; Martínez Celdrán, 1984, 2013; Figueroa Candia, 2016), aunque los valores de f2 son más bajos que en reportes anteriores para el castellano chileno, y más cercanos a los encontrados para otras variantes dialectales. Estas discrepancias pueden deberse a diferencias en el trazado de formantes vocálicos, dada la corta duración de la porción estable de las consonantes aproximantes medidas aquí (Gendrot y Adda-Decker, 2005). En este estudio, solo se midió el 50% de duración interior de cada consonante aproximante, el que normalmente presentaba una duración de alrededor de 30 ms; eso se hizo así para evitar la influencia de las transiciones formánticas y de otras variables acústicas desde y hacia las vocales que rodean a las consonantes objetivo. Cuando las consonantes son medidas de esta manera, [β̞] y [ʋ] resultan ser acústicamente muy similares –quizás con la excepción de los valores de los anchos de banda– y, crucialmente, las diferencias observadas para cada variable acústica se encuentran debajo de los umbrales de audición que han sido reportados para estímulos auditivos lingüísticos y no lingüísticos (Henry, 1948; Flanagan, 1955; Getty, 1975; Klatt, 1976; Hawkins, 1977; Mermelstein, 1978; Nooteboom y Doodeman, 1980; Rammsayer y Lima, 1991). Los valores promedio de la Tabla 1 se proveen aquí como valores de referencia, aunque otros tipos de modelos pueden ser considerados también, en particular aquellos que den cuenta de la naturaleza transicional de estos sonidos (para un ejemplo de esto último, véase la discusión en torno a la Figura 4).

De estos 32 estímulos, uno de cada categoría fue seleccionado como un mejor ejemplo para servir de referencia para el extremo de continuos sintéticos a utilizarse en las tareas de identificación y discriminación con estímulos no naturales (continuo experimental: desde una versión sintética de [ˈsa.β̞a] hasta una versión sintética de [ˈsa.ʋa]; continuo de práctica: desde una versión sintética de [ˈga.β̞a] hasta una versión sintética de [ˈga.ʋa]). Se tuvo particular cuidado en que el contraste entre las realizaciones bilabiales y labiodentales estuviese maximizado en estos pares, a juzgar por análisis auditivos llevados a cabo por el primer autor. Formas de onda y espectrogramas para estos estímulos seleccionados como mejores ejemplos pueden ser inspeccionados en la Figura 1. Fotoramas de los puntos de constricción máxima de cada realización aproximante de estos estímulos son provistos en la Figura 2.

Figura 1: Espectrogramas y formas de onda de cuatro realizaciones naturales de las pseudopalabras de este estudio, seleccionadas como los mejores ejemplos para ser utilizados como modelos para síntesis. Panel superior izquierdo: “saba” [ˈsa.β̞a]; panel superior derecho: “sava” [ˈsa.ʋa]; panel inferior izquierdo: “gaba” [ˈga.β̞a]; y panel inferior derecho: “gava” [ˈga.ʋa].

Figura 2: Fotoramas de los puntos de constricción máxima de cuatro consonantes aproximantes de las pseudopalabras de este estudio seleccionadas como mejores ejemplos para ser utilizados como modelos para síntesis. Panel superior izquierdo: “saba” [ˈsa.β̞a]; panel superior derecho: “sava” [ˈsa.ʋa]; panel inferior izquierdo: “gaba” [ˈga.β̞a]; y panel inferior derecho: “gava” [ˈga.ʋa]. En los paneles del lado izquierdo, se aprecia un punto de articulación bilabial, mientras que en los paneles del lado derecho se aprecia un punto de articulación labiodental.

Para crear los continuos sintéticos, las grabaciones seleccionadas se abrieron en Praat (Boersma y Weenink, 2015). Las realizaciones aproximantes y las vocales que las rodeaban fueron segmentadas y etiquetadas luego de inspecciones de las formas de onda, espectrogramas y de análisis auditivos de las señales (véase la Figura 1). Modelos acústicos de las consonantes aproximantes y de las vocales que las rodeaban fueron construidos luego de extraer 200 muestras de los valores acústicos de frecuencia fundamental, intensidad, formantes orales del f1 al f5, y anchos de banda para los formantes orales desde el f1 al f5, distribuidas (las muestras) de manera equitativa a lo largo de la duración de las señales. La duración de cada par mínimo se homogenizó a la duración de la consonante más corta de cada par (siempre [ʋ]), bajo la asunción de que el punto de articulación de las consonantes aproximantes espirantes se encuentra primariamente codificado en su estructura armónica (e.g., Eddington, 2011; Carrasco et al., 2012; Figueroa Candia, 2016), y no en su duración. Objetos KlattGrid fueron preparados en Praat y llenados con la información acústica de los estímulos extremos VCV de las consonantes bilabiales y labiodentales. Además, se crearon 7 pasos intermedios para cada continuo, distanciados entre sí de manera equidistante. Todos estos objetos KlattGrid fueron luego sintetizados hacia sonido mediante síntesis Klatt (Klatt y Klatt, 1990; Weenink, 2009), y vueltos a empalmar luego a la consonante inicial de los estímulos naturales con una superposición de 10 ms. El promedio de intensidad de cada estímulo fue escalado a 70 dB. Representaciones visuales de los estímulos sintéticos resultantes pueden ser vistos en la Figura 3. En total, cada continuo (el experimental y el de práctica) consta de 9 pasos equidistantes desde una realización sintética aproximante bilabial hasta una labiodental.

Figura 3: Espectrogramas, formas de onda y trayectorias formánticas de los cuatro estímulos que corresponden a los extremos de los dos continuos sintéticos. Panel superior izquierdo: “saba” [ˈsa.β̞a]; panel superior derecho: “sava” [ˈsa.ʋa]; panel inferior izquierdo: “gaba” [ˈga.β̞a]; panel inferior derecho: “gava” [ˈga.ʋa].

Las características acústicas promedio de las consonantes naturales [β̞] y [ʋ], utilizadas como referencia para construir los estímulos sintéticos experimentales desde [ˈsa.β̞a] a [ˈsa.ʋa], además de las características acústicas promedio de todas las consonantes sintéticas, medidas una vez construidos los estímulos, se encuentran resumidas en la Tabla 2. En el caso de los ejemplos seleccionados como buenos ejemplos naturales de [β̞] y [ʋ], éstos muestran valores acústicos bastante similares, y sus diferencias se encuentran por debajo de umbrales de percepción auditiva. En el caso de los estímulos sintéticos, los rangos de variación entre [β̞] y [ʋ] fueron conservados razonablemente bien cuando se los compara con los estímulos naturales, aunque es importante consignar que, como ya se ha mencionado previamente aquí, las mediciones fueron tomadas para segmentos de duraciones sumamente breves. Dado que el contraste entre [β̞] y [ʋ] fue maximizado en los pares naturales seleccionados como base para modelos acústicos de los extremos de los continuos, su duración fue mayor que la típica para las consonantes aproximantes de /b/.

Tabla 2: Resumen de las características acústicas de los estímulos naturales utilizados como referencia para los extremos de los continuos acústicos, y características acústicas de todos los pasos del continuo sintético experimental (desde [ˈsa.β̞a] a [ˈsa.ʋa]) creado a partir de ellos (el paso 1 está basado en [β̞] y el paso 9 en [ʋ]). La intensidad corresponde al mínimo de intensidad dentro de la consonante; la frecuencia fundamental, los formantes orales desde f1 a f3, y los anchos de banda para los formantes orales desde el f1 al f3 fueron calculados como un promedio de los valores obtenidos en el 50% interior de cada realización.

  Naturales Estímulos sintéticos
[β̞] [ʋ] 1 2 3 4 5 6 7 8 9
Duración (ms) 96.0 91.3 91.0 91.0 91.0 91.0 91.0 91.0 91.0 91.0 91.0
Intensidad (dB) 59.0 57.3 66.5 66.3 66.1 65.9 65.7 65.5 65.3 65.2 65.0
f0 (Hz) 140 137 139 139 139 137 137 137 137 137 136
f1 (Hz) 553 550 560 563 565 562 560 563 564 564 564
f2 (Hz) 1226 1217 1217 1218 1215 1212 1212 1208 1207 1206 1204
f3 (Hz) 2554 2490 2066 2068 2068 2069 2069 2072 2072 2070 2070
f1bw (Hz) 123 136 97 98 101 103 102 102 103 105 106
f2bw (Hz) 105 103 104 104 109 107 110 112 114 116 116
f3bw (Hz) 427 525 717 715 714 712 710 708 707 704 702

Una representación visual alternativa para las características acústicas del continuo sintético experimental puede ser vista en la Figura 4, en la que se grafican las trayectorias de los formantes orales de f1 a f3 para las consonantes aproximantes (sin incluir a las vocales vecinas), para los 9 pasos de ese continuo en particular. Como puede observarse, en este tipo de representación que captura las propiedades transicionales de los sonidos en estudio, se aprecian diferencias acústicas evidentes entre los extremos que representan las propiedades de [β̞] y [ʋ]. De hecho, varias de estas diferencias se encuentran por sobre los umbrales mínimos de percepción auditiva mencionados anteriormente.

Figura 4: Trayectorias de los formantes orales de los 9 pasos del continuo sintético experimental de las consonantes aproximantes (no se incluyen las trayectorias de las vocales vecinas), desde [β̞] hasta [ʋ]. El panel superior presenta los valores de f3, el intermedio los valores de f2, y el inferior los valores de f1.

2.3. ProcedimientosTOP

Las sesiones experimentales se llevaron a cabo en el Laboratorio de Fonética de la Pontificia Universidad Católica de Chile, en Santiago, Chile, por una fonetista con entrenamiento para este tipo de tareas experimentales. Los participantes debían encontrarse sentados en una sala silenciosa, en frente de un computador que presentaba la interfaz experimental y los estímulos, a través de audífonos circumaurales Sennheiser HD 201. Las respuestas se presentaron y recolectaron mediante el programa OpenSesame (Mathôt, Schreij y Theeuwes, 2012). Cada sesión experimental tomó alrededor de 50 minutos, e incluía pausas de descanso luego de cada una de las tres tareas del experimento.

Antes de cada sesión experimental, los participantes completaron un breve procedimiento de calibración de volumen, en el que se les presentaba una secuencia de 6 palabras del español, de duración variable y separadas por 300 ms de silencio. Estas palabras habían sido grabadas por el primer autor de este trabajo, y su intensidad promedio era la misma que la de los estímulos de las tareas de percepción. Luego de escuchar cada secuencia, los participantes debían indicar verbalmente si podían escuchar los estímulos de manera clara y cómoda. Si este no era el caso, el volumen de reproducción se ajustaba iterativamente hasta que el participante declarara que se los oía adecuadamente.

2.3.1. Tarea de identificación de estímulos naturalesTOP

La tarea de identificación se realizó mediante el paradigma de dos alternativas y elección forzada. Al comienzo de la sesión experimental, se les mostró a los participantes transcripciones ortográficas de las cuatro pseudopalabras posibles, y se les dijo que asumieran que estas pseudopalabras eran sustantivos comunes del castellano. Luego, se les presentaban los estímulos experimentales uno por uno y se les pedía identificar cuál pseudopalabra habían oído presionando uno de dos botones de la interfaz gráfica mediante un mouse, los que contenían una transcripción ortográfica del par mínimo siendo presentado (“saba” versus “sava”, o “gaba” versus “gava”). El orden de los botones de respuesta fue contrabalanceado a lo largo del grupo de participantes. Como se indicó anteriormente, cada pseudopalabra tenía 8 realizaciones diferentes. Una instancia de cada tipo de pseudopalabra se usó dos veces y al azar en una sesión de práctica. Para la tarea experimental, los 7 estímulos restantes de cada categoría de pseudopalabra fueron presentados 10 veces cada uno, de manera aleatoria, lo que resultó en un total de 280 juicios perceptivos por participante, para esta tarea.

2.3.2. Tarea de identificación de estímulos sintéticosTOP

Los procedimientos iniciales y preparación fueron los mismos que para la tarea de identificación con estímulos naturales. La tarea también utilizó el paradigma de dos alternativas y elección forzada. Los participantes completaron una sesión de práctica breve con el continuo de nueve 9 pasos equidistantes desde [ˈga.β̞a] a [ˈga.ʋa], presentados al azar. En el caso de la tarea experimental, los participantes fueron expuestos a los 9 pasos del continuo desde [ˈsa.β̞a] a [ˈsa.ʋa], el que se repitió un total de 30 veces, al azar, lo que resultó en un total de 270 juicios perceptivos por participante.

2.3.3. Tarea de discriminaciónTOP

La tarea de discriminación utilizó el paradigma ABX, con 6 pares de estímulos separados por una distancia inter-estímulo de 2 pasos (pares: 1-4, 2-5, 3-6, 4-7, 5-8, 6-9). Un silencio de 300 ms de duración fue insertado entre los elementos “A” y “B”, y un silencio de 500 ms entre “B” y “X”. Todas las posibles permutaciones para el diseño ABX fueron incluidas en la tarea, para todas las parejas de estímulos (“ABA”, “ABB”, “BAA” y “BAB”). Los participantes entregaron sus respuestas eligiendo uno de dos botones disponibles en su interfaz gráfica. Los botones tenían escritas las palabras “Primero (A)” y “Segundo (B)”. Los sujetos completaron dos breves sesiones de práctica antes de iniciar la tarea experimental. La primera práctica tenía como objetivo entrenar el formato de la prueba ABX, utilizando estímulos naturales que maximizaban el contraste entre [ˈsa.β̞a] y [ˈsa.ʋa], y entre [ˈga.β̞a] y [ˈga.ʋa]. Los participantes completaron 8 juicios perceptivos en esta etapa, los que incluyeron varias permutaciones del formato ABX. En la segunda sesión de práctica, se le presentó a los oyentes pares del continuo sintético de práctica desde [ˈga.β̞a] a [ˈga.ʋa]. Nuevamente, los participantes completaron 8 juicios perceptivos al azar, los que nuevamente incluyeron diferentes permutaciones del formato ABX. Esta sesión de práctica era comparable en dificultad a la tarea experimental. Para la sección experimental, los 6 pares de estímulos creados a partir del continuo desde [ˈsa.β̞a] a [ˈsa.ʋa] fueron presentados al azar 10 veces en sus 4 permutaciones (“ABA”, “ABB”, “BAA”, “BAB”), lo que resultó en 240 juicios perceptivos por participante para esta tarea.

3. RESULTADOSTOP

3.1. Identificación de estímulos naturalesTOP

Los resultados de la tarea de identificación con estímulos naturales mostraron una pequeña tendencia a que los oyentes identificaran [β̞] efectivamente como [β̞] en mayor proporción a que lo hicieran como [ʋ] (véase el panel izquierdo de la Figura 5), lo que sugiere que, al menos hasta cierto punto, los oyentes pueden identificar [β̞] y [ʋ] como categorías fonéticas separadas. Sin embargo, la mayoría de los resultados se agrupó alrededor del nivel de azar y hubo un considerable nivel de superposición entre las dos categorías. Asimismo, la inspección de la variabilidad individual (véase el panel derecho de la Figura 5) mostró que la mayoría de los oyentes no fue capaz de identificar [β̞] y [ʋ] de manera consistente, dado que la mayoría de las líneas se encuentran en una posición parecida a la horizontal, y a que varios participantes identificaron las categorías en la dirección opuesta a la que la evidencia acústica sugería.

Figura 5: Gráficos de caja y gráfico de panal de abejas (bee-swarm plot) para los resultados de identificación de los estímulos naturales para [β̞] y [ʋ] (n = 8400), promediados por sujeto (n = 30). En los gráficos de panal de abejas, los participantes se han codificado con colores y cada participante ha sido unido a sí mismo para las dos categorías fonéticas mediante líneas punteadas.

Un análisis de Modelo Lineal Generalizado Mixto se llevó a cabo con los resultados de identificación de estímulos naturales para explorar un posible efecto de la variable punto de articulación (bilabial o labiodental). Este tipo de prueba estadística permite evaluar el efecto de variables categóricas independientes en una variable continua independiente; una de sus ventajas más importantes respecto de otras pruebas como la ANOVA es que permite la inclusión de factores al azar, y que no requiere que la variable dependiente se ajuste a las asunciones de la estadística paramétrica. El análisis se llevó a cabo en R (R Core Team, 2013) mediante la función glmer del paquete lme4 (Bates, Maechler, Bolker y Walker, 2014), configurada para una familia binomial y utilizando una función de enlace de tipo logit. Para la selección del modelo, se construyó un modelo nulo, el que incluyó los resultados de identificación de los estímulos naturales como variable dependiente, y las variables participante y estímulo como factores al azar. Un modelo alternativo más complejo se creó luego al agregar el factor fijo y pendientes al azar (“random slopes”), el que fue comparado al modelo nulo mediante la función anova con la finalidad de encontrar el modelo con mejor ajuste a juzgar por valores más bajos del criterio de información de Akaike (AIC; Akaike, 1998), por valores más bajos del criterio de información bayesiano (BIC; Schwarz, 1978), y por la significatividad estadística de las diferencias observadas entre el ajuste de los modelos siendo comparados, provista por un análisis de chi-cuadrado de sus residuos (para todas las evaluaciones y pruebas estadísticas reportadas aquí, se asume un umbral de significatividad convencional de p < 0.05). El mejor modelo para estos análisis incluyó la variable resultados de identificación como variable dependiente, punto de articulación como efecto principal, y sujeto y estímulo como factores al azar. Un test de chi-cuadrado de Walt (de Tipo II) se calculó mediante la función Anova proveniente del paquete car (Fox y Weisberg, 2011) con la finalidad de obtener intervalos de confianza para el efecto principal del modelo seleccionado. Los resultados muestran que existe un efecto principal estadísticamente significativo de punto de articulación en los resultados de identificación natural, χ2(1) = 4.8147, p < 0.05, lo que sugiere que los oyentes tal vez fueron capaces de identificar las dos categorías fonéticas sobre la base de las señales auditivas provistas.

3.2. Identificación de estímulos sintéticosTOP

Una inspección visual de los resultados de la tarea de identificación con estímulos sintéticos para el continuo de [β̞] a [ʋ] muestra de manera clara que no parece existir un efecto del punto de articulación en la identificación (véase la Figura 6). Esto, dado que los resultados para todos los niveles del continuo se centraron alrededor del nivel de azar. Con la finalidad de evaluar estadísticamente esta tendencia, se procedió a crear modelos para análisis de Modelos Lineales Generalizados Mixtos, sin embargo, incluir la variable nivel del estímulo al modelo nulo (que solo contiene la variable dependiente y los factores al azar) no mejoró el ajuste de manera estadísticamente significativa, a juzgar por el aumento en los valores de AIC, BIC y por la ausencia de diferencias estadísticamente significativas entre los modelos en la prueba de chi-cuadrado sobre los residuos. En síntesis, el nivel del estímulo no fue capaz de explicar parte de la variabilidad observada en los resultados de identificación, lo que permite hipotetizar que no existe un efecto principal de la variable nivel del estímulo en los resultados de identificación.

Figura 6: Proporción promedio de percepción bilabial como función del nivel del estímulo para un continuo de 9 pasos desde [ˈsa.β̞a] a [ˈsa.ʋa] (n = 8100). Se incluyen también intervalos de confianza de un 95%.

3.3. DiscriminaciónTOP

La inspección visual de los resultados de discriminación de las parejas de estímulos sintéticos tomados del continuo desde [β̞] a [ʋ] tampoco sugiere la existencia de picos de sensibilidad discriminativa (véase la Figura 7). Al igual que en los resultados de la prueba de identificación con estímulos sintéticos, las respuestas se centraron alrededor del nivel de azar, sin desviaciones evidentes de este patrón general. Un análisis de modelo generalizado mixto, llevado a cabo mediante los mismos procedimientos que los análisis anteriores, no mostró evidencia de un efecto principal de la variable pareja de estímulos en los resultados de discriminación.

Figura 7: Proporción promedio de discriminación como una función de las parejas de estímulos (distancia inter-estímulo: 2), tomadas de un continuo sintético de 9 pasos desde [ˈsa.β̞a] a [ˈsa.ʋa] (n = 7200). Se incluyen intervalos de confianza de un 95%.

4. DISCUSIÓN Y CONCLUSIONESTOP

Hasta hace poco, los precedentes de investigación descartaban la existencia de realizaciones labiodentales de /b/ tanto en el dominio castellano general como en el castellano chileno en particular. Fuera de algunos esfuerzos por caracterizar la variación de /b/, la distribución de sus alófonos, y su relación con la ortografía (e.g., Sadowsky, 2010; Vergara Fernández, 2013), no ha existido investigación sobre las diferencias acústicas entre [β̞] y [ʋ], ni sobre si los oyentes son capaces de identificar y discriminar estas variantes fonéticas de manera sistemática. Este estudio se propuso explorar si los oyentes nativos del castellano chileno son capaces de identificar y discriminar realizaciones aproximantes bilabiales y labiodentales de /b/, y, en particular, si las diferencias acústicas entre los fonos [β̞] y [ʋ] son percibidas de manera categórica.

En el caso del primer experimento de identificación con estímulos naturales, se detectó un efecto estadísticamente significativo del punto de articulación en la proporción de respuestas de tipo [β̞], lo que puede ser interpretado como que los oyentes mostraron una pequeña tendencia a identificar cada segmento como proveniente del punto de articulación correspondiente al estímulo. Sin embargo, la mayoría de las respuestas se concentran cerca del nivel de azar, y las distribuciones de las respuestas para ambos puntos articulatorios presentan un considerable grado de superposición. Además, una inspección visual de la variación individual reveló que solo una minoría de los oyentes fue capaz de identificar [β̞] y [ʋ] en la dirección congruente con un contraste fonético. Estos resultados parecen indicar que los oyentes tal vez son sensibles a diferencias acústicas pequeñas entre estímulos naturales de [β̞] y [ʋ]. Sin embargo, dado que estas diferencias son sumamente pequeñas (véase la Tabla 1), es posible que los oyentes hayan estado poniendo atención a claves fonéticas codificadas, por ejemplo, en el contexto fonético inmediato (e.g., en las vocales vecinas), o que información prosódica haya conducido a este tipo de respuestas. Aún considerando lo anterior, los resultados de esta tarea parecen indicar, más probablemente, que [β̞] y [ʋ] no son percibidos como dos categorías fonéticas diferentes, en cuyo caso sería esperable encontrar un bajo grado de superposición de las distribuciones de los dos niveles. Reforzando la interpretación anterior, los resultados de la tarea de identificación con estímulos sintéticos mostraron niveles de azar a lo largo de todo el continuo, y no se detectó un efecto principal de estímulo en los resultados de identificación. En suma, no se encontró evidencia concluyente de que los oyentes fueran capaces de identificar versiones sintéticas de [β̞] y [ʋ]. En el caso de la tarea de discriminación, no se observaron picos de sensibilidad discriminativa en ninguna pareja de estímulos.

Una posible explicación para las diferencias entre los resultados observados para los estímulos naturales y los sintéticos es que los estímulos sintéticos pueden no haber reflejado de manera fidedigna los estímulos naturales, esto es, que las diferencias existentes entre [β̞] y [ʋ] fueran mayores en los estímulos naturales, y que esto haya redundado en diferentes resultados para las tareas. Sin embargo, como se muestra en la Tabla 3, las diferencias promedio entre las variables acústicas de [β̞] y [ʋ] para todos los estímulos (para los naturales, para los naturales usados como referencia para el continuo sintético, y para los sintéticos) se encuentran todas dentro del mismo orden de magnitud, con la posible excepción de algunos anchos de banda para los formantes. Aunque podría argumentarse que las diferencias acústicas relevantes para la distinción entre [β̞] y [ʋ] pueden encontrarse en formantes superiores, no incluidos aquí, y en sus anchos de banda, y que los estímulos sintéticos simplemente no modelaron bien las diferencias entre las dos categorías fonéticas, una explicación que creemos más probable es que los oyentes tuvieron a su disposición varias claves acústicas adicionales en el caso de los estímulos naturales, y que quizás algunas de ellos (por ejemplo, la duración de las vocales contiguas, o la duración de [β̞] y [ʋ]) fue responsable del efecto principal para la identificación de los estímulos naturales. Esta interpretación encuentra algo de soporte en el hecho que las consonantes aproximantes espirantes suelen carecer de una estructura formántica bien definida sobre el f2 (Martínez-Celdrán, 2004, 2013; Martínez-Celdrán y Regueira, 2008). En este sentido parece improbable que los estímulos sintéticos fallaron en capturar las diferencias acústicas clave que se encontraban presentes en los estímulos naturales, y que podrían codificar una diferencia fonética categórica entre instancias bilabiales y labiodentales.

Tabla 3: Diferencias acústicas promedio entre [β̞] y [ʋ], en: (a) los estímulos utilizados en la tarea de identificación con estímulos naturales; (b) los estímulos naturales utilizados como referencia para construir los estímulos sintéticos; y (c) los extremos del continuo sintético entre [β̞] y [ʋ].

  Diferencias acústicas promedio
Estímulos naturales Referencia estímulos sintéticos Estímulos sintéticos
Duración (ms) 1.5 4.7 0.0
Intensidad (dB) 2.1 1.7 1.5
f0 (Hz) 5.0 3.0 3.0
f1 (Hz) 6.0 3.0 4.0
f2 (Hz) 9.5 9.0 13.0
f3 (Hz) 5.0 64.0 4.0
f1bw (Hz) 43.5 13.0 9.0
f2bw (Hz) 20.5 2.0 12.0
f3bw (Hz) 156.0 98.0 15.0

En su lugar, una explicación alternativa es que, a pesar de que los oyentes pueden ser capaces de percibir diferencias detalladas entre estímulos, no perciben [β̞] y [ʋ] de manera consistente y sistemática como pertenecientes a diferentes categorías fonéticas. Como se lo discutió anteriormente, a pesar de que se detectó un efecto principal del punto de articulación en la tarea de identificación con estímulos naturales, se observó una superposición casi completa entre las distribuciones de las dos categorías y los resultados se agruparon alrededor del nivel de azar. Si se consideran también los resultados de las tareas con estímulos sintéticos (ausencia de efectos principales para los niveles del estímulo o de las parejas de estímulos), se refuerza la interpretación que sugiere que los oyentes no son capaces de identificar ni discriminar [β̞] y [ʋ], y que, consecuentemente, es improbable que los hablantes-oyentes del castellano puedan codificar alguna información lingüística o extralingüística mediante este contraste, a menos que esa información se encuentre contenida en otro tipo de claves no evaluadas en este estudio (e.g., claves visuales, o en variables acústicas como la duración, o incluso en otras fonético-lingüísticas, como el contexto fonético inmediato).


NOTESTop

[1]

El presente artículo está basado en el “Capítulo 5” de la tesis doctoral inédita del primer autor, titulada Lenition in the production and perception of Chilean Spanish approximant consonants: Implications for lexical access models (Figueroa Candia, 2016).

[2]

Un contraste fonológico entre /b/ y /v/ existió en el castellano antiguo hasta cerca del Siglo XVI, y era representado ortográficamente como “b” y “v/u”, respectivamente (Alonso, 1969; Lapesa, 1981). Todavía es típico en Chile, de hecho, que se les indique a los niños y niñas que aprenden a leer y a escribir que las palabras que se escriben con “b” ortográfica deben ser articuladas con realizaciones bilabiales y que aquellas que contienen “v” deben ser articuladas como labiodentales. Estudios recientes han descartado que la distinción ortográfica entre <b> y <v>, aprendida durante la alfabetización, condicione el punto de articulación de las realizaciones de /b/ en el castellano chileno de niños en proceso de alfabetización (Vergara Fernández, 2011, 2013; Vergara y Pérez, 2013).

[3]

El nivel de azar corresponde a la respuesta promedio que sería esperable si los participantes respondieran a estímulos de manera completamente aleatoria, esto es, de manera no sistemática. El nivel de azar se calcula dividiendo el rango de la escala de las respuestas por el total de respuestas posibles. En el caso de este estudio, en el que solo hay respuestas de tipo binario, el nivel de azar siempre corresponde al 50% de las escalas de porcentajes de respuestas correctas.

AGRADECIMIENTOSTOP

Agradecemos a Rosa Catalán por su ayuda en los procesos de recolección de datos en Chile. Este trabajo recibió apoyo de Becas Chile (del primer autor), del Ministerio de Educación, a través de CONICYT; y también del Global Engagement Funds, de University College London (UCL), para la segunda autora (proyecto número 156780).

REFERENCIASTOP

Akaike, H. (1998). Information theory and an extension of the maximum likelihood principle. En E. Parzen, K. Tanabe, y G. Kitagawa (Eds.), Selected Papers of Hirotugu Akaike (pp. 199-213). Springer: New York. http://dx.doi.org/10.1007/978-1-4612-1694-0_15

Almeida, M., y Pérez Vidal, C. (1991). Datos acústicos de las consonantes fricativas canarias. Revista de Filología de la Universidad de La Laguna, 10, 7–14.

Alonso, A. (1969). De la pronunciación medieval a la moderna en español. Madrid: Gredos.

Baković, E. J. (1994). Strong onsets and Spanish fortition. MIT Working Papers in Linguistics, 23, 21–39.

Barlow, J. A. (2003). The stop-spirant alternation in Spanish: Converging evidence for a fortition account. Southwest Journal of Linguistics, 22(1), 51–86.

Bates, D., Maechler, M., Bolker, B. y Walker, S. (2014). lme4: Linear mixed-effects models using Eigen and S4. Paquete de R versión 1.1–7, http://CRAN.R-project.org/package=lme4

Blanch, J. M. L. (1988). La labiodental sonora en el español de México. Nueva Revista de Filología Hispánica, 36(1), 153–170.

Boersma, P. y Weenink, D. (2015). Praat: Doing Phonetics by Computer [Programa computacional]. Versión 5.4.17, descargada el 20 de agosto de 2015 de http://www.praat.org/

Borland Delorme, K. E. (2004). La variación y distribución alofónica en el habla culta de Santiago de Chile. Onomázein, 2(10), 103–115.

Brown, E. (2013). Word classes in studies of phonological variation: Conditioning factors or epiphenomena? En Ch. Howe, S. E. Blackwell y M. Lubbers Quesada (Eds.), Selected Proceedings of the 15th Hispanic Linguistics Symposium (pp. 179–186) Somerville, MA: Cascadilla Press.

Bybee, J. (2000). The phonology of the lexicon: Evidence from lexical diffusion. En M. Barlow y S. Kemmer (Eds.), Usage-based Models of Language (pp. 65–85). Stanford: CSLI.

Bybee, J. (2003). Phonology and Language Use. Cambridge: Cambridge University Press.

Carrasco, P., Hualde, J. I., y Simonet, M. (2012). Dialectal differences in Spanish voiced obstruent allophony: Costa Rican versus Iberian Spanish. Phonetica, 69(3), 149–179. http://dx.doi.org/10.1159/000345199

Cepeda, G. (1991). Las consonantes de Valdivia. Valdivia: Universidad Austral de Chile.

Cepeda, G. (1994). Las consonantes del español de Valdivia (Chile). Los procesos de reforzamiento y debilitamiento fonológicos. Estudios Filológicos, 29, 39–61.

Cepeda, G. (2001). Estudio descriptivo del español de Valdivia, Chile. Estudios Filológicos, 36, 81–97. http://dx.doi.org/10.4067/S0071-17132001003600006

Cepeda, G., y Poblete, M. T. (1993). Retención y elisión de /β/ y /ð/ en sufijos y morfemas radicales. Estudios Filológicos, 28, 87–96.

Cid Uribe, M., y Céspedes Morales, M. (2008). Rasgos de simplificación en el habla rural de dos localidades de Chile: descripción fonotáctica y discursiva. Literatura y Lingüística, 19, 197–210. http://dx.doi.org/10.4067/S0716-58112008000100011

Colantoni, L., y Marinescu, I. (2010). The scope of stop weakening in Argentine Spanish. En M. Ortega-Llebería (Ed.) Selected Proceedings of the 4th Conference on Laboratory Approaches to Spanish Phonology (pp. 100–114). Somerville, MA: Cascadilla.

Cole, J., Hualde, J. I., e Iskarous, K. (1999). Effects of prosodic and segmental context on /g/-lenition in Spanish. En O. Fujimura, B. D. Joseph y B. Palek (eds.), Proceedings of the Fourth International Linguistics and Phonetics Conference (pp. 575–589). Praga: The Karolinum Press.

Danesi, M. (1982). The description of Spanish /b, d, g/ revisited. Hispania, 65(2), 252–258. http://dx.doi.org/10.2307/341540

Eckert, P., y Labov, W. (2017). Phonetics, phonology and social meaning. Journal of Sociolinguistics, 21(4), 467–496. http://dx.doi.org/10.1111/josl.12244

Eddington, D. (2011). What are the contextual phonetic variants of in colloquial Spanish? Probus, 23(1), 1–19. http://dx.doi.org/10.1515/prbs.2011.001

Figueroa Candia, M. A. (2016). Lenition in the Production and Perception of Chilean Spanish Approximant Consonants: Implications for Lexical Access Models (Tesis doctoral inédita). University College London, Londres, Reino Unido.

Flanagan, J. L. (1955). A difference limen for vowel formant frequency. The Journal of the Acoustical Society of America, 27(3), 613–617. http://dx.doi.org/10.1121/1.1907979

Fox, J. y Weisberg, S. (2011). An {R} Companion to Applied Regression. Thousand Oaks CA: Sage.

Gendrot, C., y Adda-Decker, M. (2005). Impact of duration on F1/F2 formant values of oral vowels: an automatic analysis of large broadcast news corpora in French and German. En Proceedings of the 6th Interspeech 2005 and 9th European Conference on Speech Communication and Technology (EUROSPEECH), Lisboa (pp. 2453–2456). International Speech Communication Association (ISCA).

Getty, D. J. (1975). Discrimination of short temporal intervals: A comparison of two models. Attention, Perception, & Psychophysics, 18(1), 1–8. http://dx.doi.org/10.3758/BF03199358

Goldsmith, J. (1981). Subsegmentals in Spanish phonology: An autosegmental approach. En W. W. Cressey y D. J. Napoli (Eds.), Linguistic Symposium on Romance Languages (vol. 9, pp. 1–16). Washington DC: Georgetown University Press.

Harper, D. (2014). An Analysis of Perceptual Factors in the Evolution of Spanish Approximants (Tesis doctoral inédita). University of Colorado Boulder, Colorado, EE.UU.

Harris, J. W. (1969). Spanish Phonology. Cambridge, MA: Massachusetts Institute of Technology.

Haulica, C. I. (1970). Sobre la existencia de una fricativa labiodental sonora [v] en el español cubano. En Actas del Tercer Congreso Internacional de Hispanistas (pp. 473–478). México: El Colegio de México.

Hawkins, S. (1977). Consonant duration in speech production and perception of adults and children. The Journal of the Acoustical Society of America, 61(S1), S64-S64. http://dx.doi.org/10.1121/1.2015827

Henry, F. M. (1948). Discrimination of the duration of a sound. Journal of Experimental Psychology, 38(6), 734. http://dx.doi.org/10.1037/h0058552

Hualde, J. I. (1989). Procesos consonánticos y estructuras geométricas en español. Lingüística, 1, 7–44.

Hualde, J. I. (2005). The Sounds of Spanish. Cambridge: Cambridge University Press.

Hualde, J. I., Shosted, R., y Scarpace, D. (2011). Acoustics and articulation of Spanish /d/ spirantization. En W. S. Lee y E. Zee (Eds.), Proceedings of the XVII International Congress of Phonetic Sciences (pp. 906–909). Hong-Kong: City University of Hong-Kong.

Hualde, J. I., Simonet, M., y Nadeu, M. (2011). Consonant lenition and phonological recategorization. Laboratory Phonology, 2(2), 301–329. http://dx.doi.org/10.1515/labphon.2011.011

Hualde, J. I., Simonet, M., Shosted, R., y Nadeu, M. (2010). Quantifying Iberian spirantization: Acoustics and articulation. En J. Herschensohn (Ed.), Romance Linguistics 2010. 40th Linguistic Symposium on Romance Languages, Seattle, WA (pp. 26–28).

Klatt, D. H. (1976). Linguistic uses of segmental duration in English: Acoustic and perceptual evidence. The Journal of the Acoustical Society of America, 59(5), 1208–1221. http://dx.doi.org/10.1121/1.380986

Klatt, D. H., y Klatt, L. C. (1990). Analysis, synthesis, and perception of voice quality variations among female and male talkers. Journal of the Acoustical Society of America, 87(2), 820–857. http://dx.doi.org/10.1121/1.398894

Labov, W. (1972). Sociolinguistic patterns. Philadelphia, PA: University of Pennsylvania Press.

Lapesa, R. (1981). Historia de la lengua española (9ª edic.). Madrid: Gredos.

Lenz, R. (1940 [1893]). Para el conocimiento del español de América (Beiträge zur Kenntnis des Amerikanospanisch). En A. Alonso y R. Lida (Eds.), El español en Chile. Trabajos de Rodolfo Lenz, Andrés Bello y Rodolfo Oroz (pp. 209–258). Buenos Aires: Facultad de Filosofía y Letras de la Universidad de Buenos Aires.

Lozano, M. D. (1978). Stop and Spirant Alternations: Fortition and Spirantization Processes in Phonology (Tesis doctoral inédita). Indiana University, Indiana, EE.UU.

Martínez Celdrán, E. (1984). Cantidad e intensidad en los sonidos obstruyentes del castellano: hacia una caracterización acústica de los sonidos aproximantes. Estudios de Fonética Experimental, 1, 71–129.

Martínez Celdrán, E. (2013). Caracterización acústica de las aproximantes espirantes en español. Estudios de Fonética Experimental, 22, 11–36.

Martínez-Celdrán, E. (2004). Problems in the classification of approximants. Journal of the International Phonetic Association, 34(02), 201–210. http://dx.doi.org/10.1017/S0025100304001732

Martínez-Celdrán, E., y Regueira, X. L. (2008). Spirant approximants in Galician. Journal of the International Phonetic Association, 38(01), 51–68. http://dx.doi.org/10.1017/S0025100308003265

Mascaró, J. (1984). Continuant spreading in Basque, Catalan and Spanish. En M. Aronoff y R. Oehrle (Eds.), Language Sound Structure: Studies Presented to Morris Halle by His Teacher and Students (pp. 287–298). Cambridge, MA: MIT Press.

Mathôt, S., Schreij, D., y Theeuwes, J. (2012). OpenSesame: An open-source, graphical experiment builder for the social sciences. Behavior Research Methods, 44(2), 314–324. http://dx.doi.org/10.3758/s13428-011-0168-7

Mermelstein, P. (1978). Difference limens for formant frequencies of steady-state and consonant-bound vowels. The Journal of the Acoustical Society of America, 63(2), 572–580. http://dx.doi.org/10.1121/1.381756

Nooteboom, S. G., y Doodeman, G. J. N. (1980). Production and perception of vowel length in spoken sentences. The Journal of the Acoustical Society of America, 67(1), 276–287. http://dx.doi.org/10.1121/1.383737

Oroz, R. (1966). La lengua castellana en Chile. Santiago de Chile: Editorial Universitaria.

Ortega-Llebaria, M. (2003). Effects of phonetic and inventory constraints in the spirantization of intervocalic voiced stops: Comparing two different measurements of energy change. Stress, 7(6), 5.

Piñeros, C. E. (2002). Markedness and laziness in Spanish obstruents. Lingua, 112(5), 379–413. http://dx.doi.org/10.1016/S0024-3841(01)00048-1

R Core Team (2013). R: A Language and Environment for Statistical Computing. R Foundation for Statistical Computing, Vienna, Austria. URL: http://www.R-project.org/

Rammsayer, T. H., y Lima, S. D. (1991). Duration discrimination of filled and empty auditory intervals: Cognitive and perceptual factors. Attention, Perception, & Psychophysics, 50(6), 565–574. http://dx.doi.org/10.3758/BF03207541

Romero, L., Guerreiro, Y., y Alviárez, L. (2008). Fricativas y aproximantes: labiodentalización y refuerzo en el español de Maracaibo. Opción: Revista de Ciencias Humanas y Sociales, 57, 58–73.

Sadowsky, S. (2010). El alófono labiodental sonoro [v] del fonema /b/ en el castellano de Concepción (Chile): una investigación exploratoria. Estudios de Fonética Experimental, 19, 231–261.

Sadowsky, S., y Salamanca, G. (2011). The phonetic inventory of Chilean Spanish: guiding principles, provisional inventory of consonants and system of representation (IPA-CL). Onomázein, 24, 61–84.

Salas, A. (1996–1997). La lectura de noticias en la televisión chilena: modelo y norma en el fonetismo del castellano en Chile. Anuario de Lingüística Hispánica, 12/13, 819–826.

Schwarz, G. E. (1978). Estimating the dimension of a model. Annals of Statistics, 6, 461–464. http://dx.doi.org/10.1214/aos/1176344136

Silva-Fuenzalida, I. (1952–1953). Estudio fonológico del español de Chile. Boletín de Filología, 7, 153–176.

Simonet, M., Hualde, J. I., y Nadeu, M. (2012). Lenition of /d/ in spontaneous Spanish and Catalan. En 13th Annual Conference of the International Speech Communication Association 2012, INTERSPEECH 2012 (pp. 1416–1419).

Soto-Barba, J., Díaz, E., y Pereira, D. I. (2015). Variación alofónica y diatópica del fonema /b/ en el español de profesionales chilenos en situación de lectura en voz alta. Literatura y lingüística, 32, 201–216. http://dx.doi.org/10.4067/S0716-58112015000200011

Stevens, J. J. (2000). On the labiodental pronunciation of Spanish /b/ among teachers of Spanish as a second language. Hispania, 83(1), 139–149. http://dx.doi.org/10.2307/346152

Trovato, A. M. (2017). A Sociophonetic Analysis of Contact Spanish in the United States: Labiodentalization and Labial Consonant Variation (Tesis doctoral inédita). The University of Texas at Austin, Texas, EE.UU.

Véliz, M. O., Araya, A., y Rodríguez, G. (1977). Muestra del español hablado en las oficinas salitreras. Estudios Filológicos, 1, 131–162.

Vergara Fernández, V. (2011). Producción de /v/ como alófono de /b/ en niños prealfabetizados de la provincia de Concepción (Chile). Boletín de Lingüística, 23(35–36), 123–142.

Vergara Fernández, V. (2013). Relación entre alfabetización y producción de los alófonos de /b/: estudio del habla cuidada de hablantes prealfabetizados y alfabetizados. Onomázein, 27, 158–170.

Vergara, V., y Pérez, H. E. (2013). Estudio de la incidencia de la representación gráfica (escritura) en la producción del alófono labiodental [v] del fonema /b/. Boletín de Filología, 48(2), 119–128.

Weenink, D. (2009). The klattgrid speech synthesizer. En Speech and intelligence: proceedings of Interspeech 2009: 10th Annual Conference of the International Speech Communication Association pp. 2059–2062). International Speech Communication Association (ISCA).