1. INTRODUCCIÓNTop

El objetivo de este trabajo ha sido doble:

Por un lado, crear un transcriptor que calcule automáticamente la transcripción fonética estrecha de un corpus de español actual (en su forma ortográfica normativa).
Por otro, y como objetivo final, realizar un recuento estadístico de las apariciones de los distintos fonemas y alófonos, así como de las estructuras silábicas más frecuentes, del español, en su variante dialectal castellana, del centro-norte peninsular.

El transcriptor fonético que se ha implementado tiene en cuenta los cambios fonéticos y alofónicos que se dan en la cadena hablada, principalmente debidos al resilabeo. Un transcriptor de este tipo puede ser útil, no solo para la tarea que se expone en este trabajo, sino como primera etapa de un conversor de texto en habla, o como parte de un transcriptor de habla automático.

Los estudios llevados a cabo en relación con la frecuencia de aparición de fonemas (y de ciertas estructuras silábicas) normalmente no contemplan el plano alofónico, lo que no permite hacer recuentos de alófonos ni comprobar cuáles son las realizaciones más frecuentes de los diversos fonemas.

El análisis de las frecuencias silábicas se ha abordado en menor medida, según se desprende de la bibliografía, y sus resultados pueden resultar también relevantes para el campo de la adquisición de la lengua materna o del aprendizaje de L2. Aunque queda fuera del ámbito de este trabajo, sería interesante estudiar si existe alguna correlación entre las sílabas o los alófonos que aparecen más a menudo en la cadena hablada y la facilidad o la velocidad con la que se adquieren o se aprenden.

2. ANTECEDENTESTop

Los trabajos previos que han realizado algún tipo de recuento de frecuencias de aparición de fonemas aparecen recopilados en la Tabla 1.

Tabla 1. Trabajos previos sobre la frecuencia de los fonemas del español, precisando el tipo y tamaño del corpus, y la variedad dialectal utilizada en la transcripción.

Autores	Tipo de corpus	Tamaño del corpus	Variedad dialectal
Zipf y Rogers (1939)	escrito	5 000 fonemas	castellana
Navarro Tomás (1966)	escrito	20 000 fonemas	castellana
Alarcos Llorach (1965)	escrito	25 cartas	castellana
Delattre (1965)	oral	(sin datos)	castellana
Lloyd y Schnitzer (1967)	escrito (listado)	252 404 sílabas	castellana
Guirao y Borzone (1972)	escrito y oral	62 980 fonemas	rioplatense
Quilis y Esgueva (1980)	oral	160 000 fonemas	castellana
Mosterín (1981)	escrito	58 620 fonemas	castellana
Rojo Sánchez (1991)	escrito	3 641 915 fonemas	castellana/hispanoam.
Guirao y García (1993)	oral	74 460 sílabas	rioplatense
Llisterri y Mariño (1993)	oral	> 100 000 fonemas	castellana
Pérez (2003)	oral	75 269 fonemas	chilena
Pineda et al. (2004)	oral	6 000 oraciones	mexicana
Moreno Sandoval et al. (2006)	escrito y oral	1 244 411 fonemas	castellana
González Rátiva y Mejía Escobar (2011)	escrito	5 682 417 fonemas	colombiana

De estas obras, solo la de Moreno Sandoval, Torre Toledano, Curto y de la Torre (2006) estudia la estructura de la sílaba en español y su frecuencia de aparición. Otros autores han tratado este aspecto, como Guerra (1983). No obstante, su trabajo tiene una perspectiva diacrónica, con un corpus formado por 125 000 palabras pertenecientes a fragmentos de obras literarias de los siglos xiii al xx. También trataron el tema Álvarez, Carreiras y de Vega (1992), en un estudio que utilizó 25 000 palabras. En este caso, la transcripción utilizada en el análisis fue ortográfica y no fonética.

En un artículo posterior a los últimos citados, Alameda y Cuetos (1995) utilizaron un corpus de 2 000 000 de palabras para calcular su frecuencia de aparición, además de la de sus sílabas, bigramas y letras. Se consideraron las palabras de forma aislada y, de nuevo, se utilizó únicamente la transcripción ortográfica, como se hace también en la base de datos LEXESP (Sebastián-Gallés, Martí, Carreiras y Cuetos, 2000), que analiza 5 000 000 de palabras en términos de sílabas y de vecindad ortográfica.

En cualquier caso, el tamaño del corpus utilizado en estudios previos es relativamente pequeño. Otra característica importante de dichos trabajos es que todos ellos tratan las palabras aisladamente, sin tener en cuenta los efectos que produce su inserción en la cadena hablada.

Apenas se ha abordado en la bibliografía el asunto de la realización alofónica de cada fonema. Habitualmente, las transcripciones utilizadas solo se ciñen al nivel del fonema —salvo los trabajos de Llisterri y Mariño (1993) y Pineda, Villaseñor, Cuétara, Castellanos y López (2004), que llevan a cabo un estudio alofónico parcial—. Además, la práctica totalidad de los trabajos previos agrupa las vocales cerradas junto con sus respectivas variantes semiconsonantes y semivocales (esto es, las conocidas actualmente como ‘paravocales’). Sus resultados se muestran en la Tabla A1 y en la Tabla A2.

En los trabajos de este tipo realizados a partir de los años 90 del pasado siglo se ha utilizado siempre algún tipo de herramienta informática para producir automáticamente la transcripción fonológica de un texto a partir de su transcripción ortográfica. La creación de transcriptores fonéticos/fonológicos en español se ha tratado en la bibliografía de forma independiente, y se han identificado multitud de problemas de difícil solución. El artículo de Ríos (1993) muestra que no es posible obtener una transcripción fonética exacta partiendo únicamente de la representación ortográfica, sino que se necesita información lingüística acerca de cada palabra en cuestión para poder desambiguar si existen ciertos diptongos o hiatos, o para asignar los acentos secundarios.

En otro artículo de Bonaventura, Giuliani, Garrido y Ortín (1998) se presenta un sistema basado en reglas que realiza una transcripción fonética automática, si bien las limitaciones informáticas del momento en que se publicó dificultaban el procesado correcto de las vocales con tilde. También es destacable un trabajo de Castro, España, Salvador y Marzalz (2001) que utiliza el lenguaje de programación Python,[1] aunque solo realiza una transcripción fonológica y no utiliza los símbolos del Alfabeto Fonético Internacional (AFI).

Posiblemente el transcriptor fonético para el español más completo creado hasta el momento sea TexAFon (Garrido, Laplaza, Marquina, Schoenfelder y Rustullet, 2012). Esta herramienta funciona tanto para el español como para el catalán, y además de hacer una transcripción fonética, analiza la modalidad de la oración y otros elementos de carácter entonativo. También implementado en Python, transcribe los efectos fonéticos que se producen como resultado de los contactos entre palabras, pero sin realizar el resilabeo.

En cualquier caso, un transcriptor fonético basado únicamente en reglas nunca puede ser perfecto, puesto que existen vocablos cuya pronunciación no se atiene a dichas reglas (especialmente los préstamos de otras lenguas). Para remediar estas carencias, se puede crear un diccionario de excepciones, que, no obstante, nunca abarcará todas, puesto que, para ello, debería estar en permanente actualización.

Con todo, conviene valorar el hecho de que las transcripciones realizadas de forma automática tienen la ventaja de que no presentan los inevitables errores humanos. Además, un transcriptor automático sigue siempre el mismo criterio de transcripción, con lo que sus transcripciones pueden llegar a ser incluso más correctas que las realizadas manualmente, especialmente si el corpus es grande y el trabajo se divide entre varias personas.

3. METODOLOGÍA DE TRABAJOTop

Para poder llevar a cabo este trabajo se necesitan los siguientes tres elementos:

Un corpus de texto en español que sea adecuado para su transcripción y análisis.
Un transcriptor fonético/fonológico automático que transcriba a partir de la representación ortográfica del corpus.
Un sistema que elabore recuentos y calcule estadísticas a partir de la transcripción fonética.

Para diseñar el transcriptor fonético, se ha utilizado una arquitectura en capas que calcula la transcripción final pasando por una sucesión de etapas intermedias. Dichas etapas son las siguientes:

Segmentado del texto en oraciones.
Segmentado de las oraciones en palabras y expansión ortográfica de caracteres no alfabéticos.
Discriminación entre palabras tónicas y átonas.
Segmentado de la palabra en grafemas y desambiguación de su valor fonológico.
Silabeado de los fonemas de la palabra y asignación de tonicidad a las sílabas.
Cálculo de los alófonos que corresponden a los fonemas de la palabra, según el entorno fonético de la palabra aislada.
Resilabeo de las palabras en contacto.

En los apartados siguientes se detallan todos estos puntos.

3.1. El corpus de texto de español contemporáneo

Para hacer un recuento fonético de la secuencia fónica, lo ideal sería contar con un gran corpus de transcripciones reales de muestras orales, principalmente espontáneas, pero los corpus disponibles tienen un tamaño muy limitado.

Una segunda opción sería realizar la transcripción fonética de algún corpus oral con transliteraciones de audios de conversaciones espontáneas. Sin embargo, vuelve a surgir la misma limitación, ya que los corpus orales espontáneos son muy escasos y de muy reducido tamaño: el Corpus Oral de Referencia de la Lengua Española Contemporánea (CORLEC; Marcos Marín, 1992), de 1 100 000 palabras, es el más amplio.

Como se pretende hacer un recuento de un corpus bastante mayor, se ha optado por crear un corpus específico para este recuento, utilizando una recopilación de libros (en su inmensa mayoría, novelas, pero también ensayos y artículos) de escritores españoles. Aunque el dialecto del español que hable el escritor no influye en la transcripción fonética realizada, se ha evitado en general incluir autores hispanoamericanos por las diferencias en expresiones, léxico o giros lingüísticos que pudieran darse con respecto al español del centro-norte peninsular.

El uso de este corpus tiene la ventaja de que podrá ser transcrito automáticamente con facilidad, puesto que se ajusta convenientemente a las normas ortográficas del español. Al tratarse, además, de textos originalmente escritos por autores de lengua española (y no de traducciones), se minimiza la aparición de palabras extranjeras, principalmente topónimos o antropónimos, que presentan problemas para su transcripción fonética y para la asignación de tonicidad.

Por último, puesto que el objetivo del trabajo es el análisis del español contemporáneo de España, se requiere que el texto se haya escrito en las últimas décadas, a ser posible por un autor aún vivo o fallecido en el siglo XXI.

Así pues, se han obtenido las versiones en formato electrónico de 560 obras de 63 autores y se han convertido a formato de texto sin formato (con codificación de caracteres UTF8) utilizando el programa de libre distribución Calibre (Versión 2.53; Goyal, 2016). El corpus así creado ocupa 299 MB de memoria. En la Tabla A3 se listan las 560 obras incluidas en él.

Tras analizarlo, se comprobó que el tamaño del corpus, medido en distintas unidades, es el siguiente:

301 685 816 caracteres;
236 024 884 segmentos (tras resilabeo 233 326 472);
104 439 849 sílabas (tras resilabeo 100 674 739);
52 661 222 palabras;
3 699 383 oraciones.

El corpus utilizado en este trabajo es el corpus en español de mayor tamaño analizado fonéticamente del que se tenga constancia. El precio que se ha de pagar por esta ventaja es el hecho de que este corpus pueda no ser la mejor representación del registro oral. En el artículo de Moreno et al. (2008) se muestra que los porcentajes de aparición de los distintos fonemas y sílabas del español varían según sea el tipo del corpus utilizado (oral o escrito). No obstante, el mencionado estudio no tiene en cuenta el resilabeo (se transcriben automáticamente las palabras aisladas, incluso en el corpus oral), lo que altera en gran medida los valores obtenidos, especialmente por lo que se refiere al recuento de los tipos de sílaba más frecuentes.

3.2. El transcriptor fonético automático

A grandes rasgos, el transcriptor creado para realizar este trabajo tiene un diseño y una estructura interna similares a los del comentado TexAFon (Garrido et al., 2012), pero añade funcionalidad extra. También se ha implementado en Python, aunque no se ha utilizado de ningún modo código de TexAFon.

El transcriptor toma la representación ortográfica del texto y crea una transcripción fonética estrecha siguiendo las directrices que se indican en el manual de Fernández Planas y Carrera Sabaté (2001). En dicho manual se presenta un modelo de castellano estándar (variante centro-norte peninsular) en un registro cuidado de habla sin llegar a adoptar un nivel enfático.

El repertorio fonológico de la variante dialectal escogida (castellana) aparece en la Tabla 2 y la Tabla 3. Consta de 28 fonemas: 19 consonánticos, cinco vocálicos y cuatro paravocales (semiconsonantes y semivocales). Es importante notar que se han diferenciado expresamente las cuatro paravocales como fonemas independientes, resultando en un sistema vocálico con nueve fonemas. Esta postura no es la más extendida entre los fonólogos del español, que suelen postular un sistema con cinco vocales, en las que las paravocales son variantes alofónicas de las vocales cerradas; o a lo sumo, añaden a estas cinco vocales dos fonemas paravocálicos, sin diferenciar su uso como semiconsonante o semivocal. No se pretende con este trabajo abogar por un sistema vocálico de nueve fonemas. Sin embargo, se ha optado por él únicamente porque presenta ventajas, en términos de computación, con respecto a las opciones de cinco o siete fonemas: facilita el recuento final, acelera el cálculo de los alófonos (que, en cualquier caso, coinciden en los tres sistemas fonológicos comentados) y simplifica tanto el proceso de asignación de grafemas a fonemas, como la tarea de extracción de la estructura silábica de la palabra y el cálculo del efecto del resilabeo. En cualquier caso, para obtener los datos de los recuentos de fonemas suponiendo un sistema de cinco fonemas vocálicos, o de dos paravocales más cinco vocales, basta con sumar los porcentajes de aparición de los cuatro fonemas paravocálicos que se consideran en este trabajo a los del fonema que corresponda.

Tabla 2. Repertorio de fonemas consonánticos utilizados en la transcripción, y sus realizaciones alofónicas en ataque y coda silábica.

Fonema	Alófonos de ataque	Alófonos de coda
/m/	[m]	[m ɱ n̟ n̪ n ⁿ n̠ ^n̠ ŋ ɴ][2]
/n/	[n nː]	[m ɱ n̟ n̪ n ⁿ n̠ ^n̠ ŋ ɴ]
/ɲ/	[ɲ]	–
/b/	[b β̞ ^β̞ β̞ː][3]	[β̞ ^β̞]
/p/	[p pː]	[β̞]
/d/	[d̪ ð̞ ^ð̞ ð̞ː]	[ð̞ ^ð̞]
/t/	[t̪ t̟ tː]	[ð̞]
/ɡ/	[ɡ ɣ̞ ^ɣ̞ ɣ̞ː]	[ɣ̞ ^ɣ̞]
/k/	[k k̠ k̟ kː]	[ɣ̞]
/ʧ/[4]	[ʧ ʧː]	[ʧ]
/f/	[f fː]	[f f̬]
/θ/	[θ θː]	[θ θ̬]
/s/	[s sː]	[s s̪ s̬ z̪][5]
/x/	[x ^x χ xː χː]	[^x]
/ʝ̞/	[ʝ̞ ɟ͡ʝ̞][6]	–
/l/	[l lː]	[l l̟ l̪ l̠][7]
/ʎ/	[ʎ]	–
/r/	[r rː]	–
/ɾ/	[ɾ]	[ɾ]

Tabla 3. Repertorio de fonemas vocálicos (y paravocálicos), y de sus alófonos en entornos orales y nasales.

Fonema	Alófonos orales	Alófonos nasales
/j/	[j][8]	[j̃]
/i/	[i i̞ iː i̞ː]	[ĩ ĩ̞ ĩː ĩ̞ː]
/i̯/	[i̯]	[ĩ̯]
/e/	[e ɛ eː ɛː]	[ẽ ẽː]
/a/	[a ɑ aː ɑː]	[ã ãː]
/o/	[o ɔ oː ɔː]	[õ ɔ̃ õː ɔ̃ː]
/w/	[w][9]	[w̃]
/u/	[u u̞ uː u̞ː]	[ũ ũ̞ ũː ũ̞ː]
/u̯/	[u̯]	[ũ̯]

Estos 28 fonemas se realizan con un total de 106 alófonos distintos, de los que 62 son consonánticos, 36 vocálicos y 8 paravocálicos. De los 62 alófonos consonánticos, 31 aparecen en coda y 46 en ataque (hay 15 que aparecen en ambas posiciones). De los 46 alófonos consonánticos de ataque, 31 son simples y 15 son geminados.

En cuanto a los 36 alófonos vocálicos, se cuenta con 20 alófonos orales (10 de duración normal y otros 10 largos) y 16 alófonos nasalizados (ocho de cada duración). De los ocho alófonos de paravocales considerados, cuatro son orales y otros cuatro están nasalizados. Por último, se consideran como fonemas las pausas: largas en el caso del punto, los puntos suspensivos y los signos de exclamación o interrogación; y cortas en el caso de los demás signos de puntuación.

Por otra parte, también se transcribe la tonicidad de la sílaba. Se marcan los acentos primarios de las palabras tónicas, además de los acentos secundarios de los adverbios acabados en <-mente>, pero no los de las palabras compuestas. En el caso de las palabras átonas, no se marca ninguna sílaba como tónica.

Como se comentó, la arquitectura del sistema está compuesta por niveles jerárquicos colocados en capas, que se implementan como clases independientes en Python. Así, cada clase de nivel superior incluye uno o más elementos de las clases inferiores. Se han implementado siete clases, de las que las siguientes cuatro representan la estructura del texto:

Texto: segmenta el texto de entrada en oraciones, y genera las estadísticas de aparición al acabar la transcripción.
Oración: divide las oraciones en palabras y las expande en su forma ortográfica si contienen caracteres no alfabéticos. También realiza el resilabeo final.
Palabra: silabea las palabras y calcula fonemas y alófonos.
Grafema: representa los caracteres de entrada y sus posibles correspondencias fonológicas.

Las otras tres clases se encargan de la transcripción propiamente dicha:

Sílaba: es una estructura auxiliar que representa una sílaba, su tonicidad y sus fonemas/alófonos.
Fonema: representa a un fonema, con sus características y reglas de realización según su entorno fonético.
Alófono: representa a los alófonos de forma similar a la clase Fonema.

Este diseño hace más fácil la división en subtareas y la corrección de errores, que usualmente son atribuibles a un nivel en concreto según el tipo de fallo.

El transcriptor transcribe de media unos 14 000 segmentos por segundo. Aunque no se han encontrado datos de velocidad equivalentes para otros sistemas de transcripción, se considera que se ha conseguido un diseño eficiente teniendo en cuenta las limitaciones del hardware utilizado.[10] Esta velocidad permite que el corpus se analice por completo en menos de cinco horas.

En las siguientes secciones se presentan las clases utilizadas y se explica el funcionamiento del transcriptor.

3.2.1. La clase Texto

Esta clase, que inicia el proceso, toma como entrada el texto total que se ha de transcribir y utiliza expresiones regulares para segmentarlo en oraciones, siguiendo un algoritmo basado en el método enunciado por Grefenstette y Tapanainen (1994).

Para ello, se identifican los caracteres segmentadores de oración, tanto ambiguos [11] como no ambiguos [12]. Estos caracteres se incluyen al inicio o al final de la oración y representan pausas.

3.2.2. La clase Oración

Los objetos de la clase Oración reciben el texto de una oración como entrada y lo segmentan en palabras. De nuevo, se sigue el algoritmo de Grefenstette y Tapanainen (1994) (v. unas líneas más arriba) y se usan expresiones regulares para segmentar por caracteres blancos (espacios, tabulaciones…), comas (siempre que no sean parte de un número), barras (si no son parte de una fecha) y algunos caracteres especiales como <°ºª&>.

Posteriormente, se identifica cuáles de estas palabras son números (cardinales y ordinales), porcentajes, grados, horas, fechas o números romanos, en cuyo caso la cadena de caracteres se expande en su representación ortográfica. Así, un texto como <27,3º a las 15:30 con un 78 % de humedad en el sector XII> se transforma en <veintisiete coma tres grados a las tres y media con un setenta y ocho por ciento de humedad en el sector doce>.

También se detectan acrónimos (que se deletrean si no pueden silabearse), combinaciones de caracteres alfabéticos y numéricos (que se deletrean carácter a carácter, salvo los números, que se transforman en su representación ortográfica agrupando dígitos consecutivos), además de otros caracteres no alfanuméricos (que también se deletrean) y algunas otras combinaciones de caracteres especiales comunes. Cuando se deletrea una cadena de caracteres, los nombres de las vocales y de algunas consonantes como <d> y <t> se transcriben con tilde (<á>, <dé>, <té>) aunque sean monosílabos, para que más adelante, durante el procesado, no se confundan con palabras átonas. Además, se considera que las letras se pronuncian como en una enumeración, separadas por pausas cortas.

Como ejemplo, el texto de entrada <Mª Victoria, la mexicana del 5º, es la socia nº 27 401 de CC.OO., y trabaja en la O.N.U. Su NIF es 56.765-396DW, y cobra 5.000$. Pues tiene 38,7ºC de fiebre> se convierte en <María Victoria, la mejicana del quinto, es la socia número veintisiete mil cuatrocientos uno de ce, ce, ó, ó, y trabaja en la onu. Su nif es cincuenta y seis mil setecientos sesenta y cinco, guion, trescientos noventa y seis, dé, uve doble y cobra cinco mil dólares. Pues tiene treinta y ocho coma siete grados centígrados de fiebre>.

Tras conseguir una transcripción ortográfica segmentada por palabras, y que únicamente contiene caracteres alfabéticos —y signos de puntuación en su inicio o final—, se crea un objeto de la clase Palabra con cada una de ellas, que realiza el siguiente paso del proceso.

3.2.3. La clase Palabra

Al crear un objeto de la clase Palabra, se apartan los posibles signos de puntuación que haya en el texto, y se verifica si se trata de una palabra tónica. Para ello el vocablo en cuestión se compara con una pequeña base de datos en la que se incluyen las palabras átonas del español tal y como especifica la Real Academia Española y la Asociación de Academias de la Lengua Española (2005) o en artículos como el de Pérez Tobarra (2005). Si la palabra no es átona, se asignará tonicidad a una de sus sílabas tras haberla silabeado.

Tras asignar la tonicidad, el objeto Palabra divide el texto de entrada en grafemas y crea un objeto de la clase Grafema para cada uno.

3.2.4. Las clases Grafema y Fonema

Para identificar los grafemas, se procesa la palabra de izquierda a derecha, intentando primero encontrar dígrafos, que pueden ser tanto los compuestos tradicionales <ch>, <ll> y <rr>[13], como las agrupaciones puntuales <gu> y <qu> (seguidos de vocal anterior). Además, se han añadido los dígrafos propios de la lengua vasca <tx> y <tz> puesto que en el corpus aparecen en ocasiones en préstamos (principalmente antropónimos) con el mismo valor fonológico que <ch>, como ocurre con <Etxenike> o <ertzaina>.

Si no se encuentra un dígrafo, se compara el carácter con los monógrafos que el sistema es capaz de reconocer. Además de los grafemas propios del español y de los dígrafos vascos a los que se acaba de aludir, también se ha incluido <ç> como grafema aceptable con el mismo valor fonológico que <s>. Esto se debe a que su uso está bastante extendido en algunas palabras catalanas que se integran en textos en español, como pueden ser <Barça> o <calçot>.

Si el carácter individual es ajeno a la lengua española, se descarta (se considera ‘mudo’). Si el carácter sí pertenece al alfabeto español pero contiene algún diacrítico que no es propio del español o no es combinable con dicho carácter (como ocurre en <València>, <Citroën> o <João>), se eliminan los diacríticos del carácter (dándonos en este caso las españolizaciones <Citroen>, <Valencia> y <Joao>).

Por último, en caso de que la palabra comience por un ataque compuesto, con una <s> al inicio, se añade la prótesis <e> antes de realizar la transcripción. Este tipo de combinación consonántica, que no es posible según la fonotáctica del español, es bastante habitual en términos extranjeros (sobre todo nombres propios), y los hablantes suelen pronunciarla, de hecho, con la mencionada prótesis.

Así, se crea un objeto de la clase Grafema por cada grafema que contenga la palabra. Cada uno, a su vez, contiene una lista de los posibles fonemas que puede representar, junto con restricciones acerca del entorno fonético necesario para que el grafema los represente.

Tales fonemas pueden ser de seis tipos: consonántico, semiconsonántico, vocálico, semivocálico, mudo o de pausa. La mayor parte de los grafemas consonánticos tiene fácil desambiguación, pues representan siempre un único fonema consonántico, a excepción de:

<g>, <c>, que son fricativos ante vocal anterior, u oclusivos en los demás casos.
<r>, que es vibrante múltiple en inicio de palabra y simple o percusiva en los demás casos.
<x>, que puede representar el fonema /s/, el grupo /ks/ o el fonema /k/ según su entorno fonético ([es̪.t̪e.ˈɾjɔɾ] <exterior>, [ɛɣ̞.ˈsa.mẽn] <examen>, [ˈɛɣ̞.rɛi̯] <exrey>[14]).

Los grafemas vocálicos (con o sin tilde) también representan habitualmente un único fonema vocálico a excepción de las vocales <i> y <u>, que pueden tener valor vocálico (<pinta> [ˈpi̞n̪.t̪a], <punta> [ˈpu̞n̪.t̪a]), semivocálico (<faina> [ˈfai̯.na], <fauna> [ˈfɑu̯.na]), semiconsonántico (<pues> [pwes], <pies> [ˈpjes]) o consonántico (<hiela> [ˈɟ͡ʝ̞e.la], <huela> [ˈɡwe.la]).

Por otra parte, la <y> puede tener valor vocálico (<muy> [mwi]), semivocálico (<hay> [ˈai̯]) o consonántico (<yaya> [ˈɟ͡ʝ̞a.ʝ̞a]). La <ü> es siempre semiconsonante en español (por ejemplo, en <pingüe>), aunque el transcriptor acepta también su interpretación como elemento plenamente vocálico para poder transcribir algunas pocas palabras extranjeras que aparecen en el corpus (como <führer> [fu.ˈɾɛɾ]).

Hay que hacer notar que el transcriptor decide que un carácter vocálico es vocal, paravocal (semivocal o semiconsonante) o consonante utilizando únicamente el contexto fonético. Esto origina que se consideren erróneamente como diptongos algunas combinaciones de caracteres vocálicos que ortográficamente sí que son diptongos, pero que en la lengua oral se realizan como hiatos, al menos en el dialecto castellano. Así, <odiando> y <vaciando> se transcriben con diptongo ([o.ˈð̞jan̪.d̪o] y [ba.ˈθjan̪.d̪o]), cuando en realidad la transcripción de <vaciando> debería realizarse como hiato ([ba.θi.ˈan̪.d̪o]).

Los grafemas mudos no representan ningún fonema, tal y como ocurre con la <h> siempre que no forme parte del dígrafo <ch>. También se consideran grafemas mudos algunos signos de puntuación como las comillas, los guiones y similares. Estos grafemas se eliminan de la cadena y no se consideran parte del entorno fonético.

Por último, los signos de puntuación se consideran como grafemas de pausa, algo que afecta al tipo de alófono que puede aparecer en la palabra previa o en la posterior.

Una vez identificados todos los grafemas, se tienen que purgar las variantes fonéticas que no sean adecuadas, escogiendo el fonema que corresponda a su entorno fonético. Así, la lista de objetos de la clase Grafema contenidos en un objeto de la clase Palabra se convierte en una lista de objetos de tipo Fonema, que representan los fonemas contenidos en la palabra.

3.2.5. La clase Sílaba

Tras crear la lista de objetos de tipo Fonema, el objeto Palabra los silabea, creando tantos objetos de la clase Sílaba como se necesiten. El objeto Sílaba no es otra cosa que un contenedor para un máximo de siete fonemas: dos fonemas consonánticos en ataque, semiconsonante, vocal, semivocal y dos consonantes de coda. Además, la Sílaba puede contener una pausa al inicio o al final, y puede ser átona o tónica.

Para agrupar la lista de fonemas en sílabas se utiliza un algoritmo sencillo. En primer lugar, se calcula el contenido de los núcleos de las sílabas:

Se toman los fonemas que se han identificado como vocálicos y se crea una sílaba por cada uno de ellos, asignándolos como núcleos.
Seguidamente se incluyen en dichas sílabas los fonemas correspondientes a las semiconsonantes y semivocales adyacentes al núcleo (saltando, si fuera necesario, los grafemas mudos).

En segundo lugar, se procesan los fonemas consonánticos, procediendo de la siguiente forma:

Se añaden como ataque de la primera sílaba todas las consonantes previas a la primera vocal, y, como coda de la última sílaba, todas las consonantes posteriores a la última vocal.
Todas aquellas consonantes seguidas de un fonema vocálico o semiconsonántico se añaden como ataque de la sílaba a la que pertenezca el vocoide.
Las consonantes seguidas de consonante se añaden como ataque complejo si su combinación está permitida en español. En cualquier otro caso la consonante en cuestión se añade a la coda de la sílaba cuyo núcleo es la vocal más próxima a dicha consonante por la izquierda.

Por último, se procesan los posibles signos de puntuación y se asignan las pausas al inicio o al final de la palabra.

Así, se coloca cada fonema en su posición correcta dentro de la sílaba a la que pertenezca. Si se tienen más de dos consonantes en coda o en ataque absoluto solo se mantienen la primera y la última. En cualquier caso, estas palabras serán de origen extranjero y su pronunciación no será la estándar.

Tras ello, si la palabra no está integrada en el grupo de palabras átonas, se asigna una de las sílabas como tónica:

Si la palabra es un adverbio en <-mente>, se asigna un acento primario en la penúltima sílaba, y se sigue procesando el resto como si la palabra careciera de las dos últimas sílabas (pero se asignará un acento secundario en vez de primario).
Si la palabra contiene un grafema vocálico con tilde, se asigna como tónica la sílaba cuyo núcleo es dicha vocal. Si la palabra contiene más de una tilde, solo se considera la última.
Si no hay vocales acentuadas, se siguen las normas de acentuación estándar.

Llegados a este punto se obtiene la transcripción fonológica de cada palabra aislada.

3.2.6. La clase Alófono

Esta clase permite calcular el alófono con el que se realiza en el habla cada fonema. Los objetos de esta clase contienen información sobre cuál es el fonema del que derivan, además de restricciones que especifican el entorno fonético en el que pueden aparecer. Estas restricciones están condicionadas por los tres fonemas previos y los tres fonemas posteriores en la secuencia. La necesidad de un entorno fonético tan amplio viene dada por el fenómeno de nasalización de las semivocales o de las semiconsonantes, que depende de que al núcleo al que pertenecen le preceda o le suceda una consonante nasal: por ejemplo, la combinación <ni aun> se transcribe como [nj̃ãũ̯n]).

Gracias a estas restricciones de aparición se calcula la variante alofónica con la que se realizará cada uno de los fonemas, de forma similar a la que se utilizaba para desambiguar el valor fonológico de cada grafema. En este punto, se obtiene una transcripción fonética estrecha de cada palabra aislada.

3.2.7. Resilabeo de las oraciones

Una vez que el objeto de clase Oración ha creado todas las estructuras de clase Palabra, silabeadas y transcritas fonéticamente según lo indicado hasta ahora, se procede al resilabeo.

El resilabeo es un proceso inconsciente y natural, que se produce al encadenar palabras en el habla. La existencia de este fenómeno puede ocasionar los siguientes efectos (Hualde, 1989):

Una consonante pasa de coda de una sílaba a ataque de la siguiente: <el avión hindú> = [ɛl] + [a.ˈβ̞jɔn] + [i̞n̪.ˈd̪u] → [e.la.ˈβ̞jo.nĩ̞n̪.ˈd̪u]. Esto no ocurre si la sílaba siguiente comienza por consonante, incluso aunque la consonante de la coda y la del ataque siguiente se puedan combinar como ataque complejo (si bien en estos casos puede reforzarse una pronunciación debilitada): <club latino> = [ˈklu^β̞] + [la.ˈt̪i.no] → [ˈkluβ̞.la.ˈt̪i.no].
Una vocal se consonantiza y pasa a formar parte de la sílaba siguiente: <Eva y Ana> = [ˈe.β̞a] + [i] + [ˈa.na] → [ˈe.β̞a.ˈʝ̞a.na].
Una vocal se convierte en paravocal (bien en una semivocal de la sílaba previa, o bien en una semiconsonante de la sílaba siguiente): <uno y dos> = [ˈu.no] + [i] + [ˈd̪ɔs] → [ˈu.nɔi̯.ˈð̞ɔs]; <él y otro> = [ɛl] + [i] + [ˈo.t̪ɾo] → [ˈe.ˈljo.t̪ɾo].
Una consonante o una vocal se alarga: <dame el libro> = [ˈd̪a.me] + [ɛl] + [ˈli.β̞ɾo] → [ˈd̪a.meː.ˈlːi.β̞ɾo].

Como se ve en los ejemplos presentados, al realizarse cambios en el ataque y en la coda, además de en la semiconsonante y en la semivocal, se producen modificaciones adicionales en la abertura de la vocal, así como en su nasalidad, debido a la creación de un nuevo entorno fonético. Se pueden incluso perder sílabas si todos sus segmentos migran a las sílabas adyacentes.

Por otra parte, aun cuando no se produzcan traslaciones de segmentos de una sílaba a otra, el mero contacto de dos palabras puede producir cambios alofónicos en el núcleo y en la coda final de la palabra previa o en el ataque absoluto de la palabra siguiente: <la jueza> = [la] + [ˈχwe.θa] → [lɑ.ˈχwe.θa], <con vino> = [ˈk̠ɔn] + [ˈbi.no] → [k̠ɔm.ˈbi.no], <es ron > = [ˈes] + [ˈrɔn] → [ˈe.ˈrɔn], <veo bien> = [ˈbe.o] + [ˈbjen] → [ˈbe.o.ˈβ̞jen].

El proceso del resilabeo depende de la tonicidad de las sílabas. Así, <muy alta> se transcribe como [mu.ˈʝ̞ɑl̪.t̪a], pero <muy altanera> se transcribe como [mwi.ɑl̪.t̪a.ˈne.ɾa], debido al cambio de tonicidad.

Tras realizar el resilabeo, se unen todas las oraciones incluyendo pausas en sus junturas. Con este último paso se consigue la transcripción fonética estrecha del texto completo, pero además se crea una estructura organizada en fonemas/alófonos integrados en sílabas, con lo que será fácil hacer el tipo de recuento y de estadísticas que se necesitan en este trabajo.

3.3. Recuento de apariciones de segmentos y tipos de sílaba

Llegados a este punto y gracias a las estructuras de datos que se han creado, las estadísticas que se pueden extraer son muchas. Se fijará la atención tan solo en dos aspectos:

La frecuencia de aparición de cada fonema o alófono según su posición en la sílaba (y según la tonicidad de esta).
La frecuencia de aparición de los distintos tipos de sílabas, categorizadas en función del número de segmentos en el ataque, el núcleo y la coda. El hecho de que sea posible tener de cero a dos consonantes en el ataque o en la coda, y la posibilidad de que aparezca una semiconsonante [15] o una semivocal, dan como resultado 30 posibles tipos de sílaba (que, a su vez, pueden ser átonas o tónicas). Estos tipos abarcan desde la sílaba más simple (tipo V) hasta la más compleja (de tipo CCScVSvCC)[16].

4. RESULTADOSTop

El primer resultado que se puede analizar es el del desempeño del transcriptor. Tal y como se ha podido comprobar en los tests exhaustivos a los que se ha sometido como parte de su desarrollo, la transcripción automática obtenida es de gran calidad y prácticamente libre de errores. Como ejemplo del texto de salida del transcriptor, en la Tabla A4 se muestra una serie de once textos cortos (1618 palabras, 7542 fonemas) que aparecen en el mencionado manual de transcripción de Fernández Planas y Carrera Sabaté (2001). En esta tabla, aparece a la izquierda la transcripción ortográfica del texto, y a la derecha una comparación entre su transcripción fonética automática y la transcripción realizada por las propias autoras del manual de transcripción. Se utilizan estos textos porque han sido estudiados a fondo y se han tomado como modelo para la salida que debe generar el transcriptor automático.

Las transcripciones fonéticas de la tabla incluyen espacios para facilitar la identificación de las palabras con sus símbolos fonéticos. Además, puesto que se trata de una comparación entre dos transcripciones fonéticas distintas, se sigue la convención de que todos los alófonos que coinciden en ambas transcripciones se muestran en fondo blanco sin ningún formato especial, mientras que las divergencias entre la versión manual y automática se marcan de la siguiente forma:

Los alófonos que aparecen en la transcripción automática pero no en la manual, se muestran con fondo gris, recuadro negro y en negrita, como por ejemplo [ɑ].
Aquellos alófonos que, por el contrario, aparecen únicamente en la transcripción manual, se muestran con fondo negro, fuente blanca y en negrita, como por ejemplo [u̯].

Siguiendo esta notación, cuando un alófono no se inserta ni se elide, sino que se modifica, se indica la situación como un alófono que sólo aparece en la transcripción automática, seguido de un alófono que sólo aparece en la transcripción manual. De esta manera, si por ejemplo la transcripción automática incluye el alófono nasalizado [ẽ] mientras que la transcripción manual utiliza [e], la transcripción de la Tabla A4 es [ẽe].

Las dos transcripciones difieren en 175 casos, que involucran el cambio de uno o más alófonos. Se puede comprobar que, de todos estos casos, solo en uno la divergencia puede atribuirse sin dudas a un (predecible) error en la transcripción automática (en concreto con respecto a la palabra [ˌe.ljo.θen̪.ˈt̪ɾi̞s̪.t̪a], en la que se omite la marca de acento secundario). Este error se produce por la imposibilidad de identificar las palabras compuestas y de asignarles la tonicidad convenientemente, como ya se hizo notar, si bien este tipo de vocablos es poco habitual.

Sin embargo, existen 174 divergencias entre las dos transcripciones que son principalmente atribuibles a diferencias de criterio y a algunos pocos (e inevitables) fallos humanos. Estas 174 divergencias pueden categorizarse en los siguientes tipos:

El transcriptor automático añade una marca de tonicidad que no aparece en la transcripción manual: 57 casos. De ellos, 52 son debidos a que la transcripción manual considera, por lo general, que los artículos indeterminados y algunas otras palabras gramaticales son átonos, mientras que el transcriptor automático sigue la indicación de la Real Academia Española y la Asociación de Academias de la Lengua Española (2005), que indica lo contrario.
El transcriptor automático elimina una marca de tonicidad que sí aparece en la transcripción manual: 37 casos. En la transcripción manual se considera que muchas preposiciones y conjunciones son tónicas, en oposición al criterio de la RAE, que es el que sigue el transcriptor automático.
El transcriptor transcribe un alófono vocálico distinto: 33 casos. Hay 21 casos en los que, siguiendo el criterio del manual de Fernández Planas y Carrera Sabaté (2001), el transcriptor utiliza una variante abierta cuando la transcripción manual lo transcribe como cerrado. En otros 12 casos la transcripción manual no utiliza el diacrítico de nasalización que sí se incluye en la transcripción automática debido a que se dan las condiciones para que el fenómeno ocurra.
Divergencias en las pausas: 25 casos. La transcripción automática añade 19 pausas y elide otras dos. En otros cuatro casos la pausa escogida en ambas transcripciones es de distinta duración. Estas diferencias se deben a que el transcriptor automático se ciñe a lo que indican los signos de puntuación, mientras que la transcripción manual es más libre en este aspecto (y quizá más realista).
El transcriptor automático combina dos fonemas iguales consecutivos, que en la transcripción manual aparecen separados, y los agrupa en un alófono largo: 12 casos, tanto con vocales como con consonantes. De nuevo, la transcripción manual es más liberal en cuanto a dónde incluir un alófono largo y dónde utilizar dos de duración normal, mientras que el transcriptor automático sigue siempre las reglas de combinación fonética convenidas.
Divergencia en alófonos consonánticos: 8 casos. Usualmente, se omite un diacrítico en la transcripción manual que, posiblemente, se haya olvidado.
El transcriptor no incluye un alófono que sí aparece en la transcripción manual: 1 caso. Se trata de la palabra <éxtasis>, transcrita manualmente como [ˈeɣ̞s̪t̪asi̞s̬], con una [ɣ̞] que se omite en la transcripción automática. En este caso la transcripción manual se aleja de la norma expuesta en el manual de transcripción, pero es una pronunciación que también es válida.
Uso en la transcripción manual de un carácter que no es un símbolo fonético: 1 caso. La transcripción manual utiliza [v] en lugar de [β̞].

Como se ve, la mayor parte de las divergencias no pueden estrictamente considerarse como fallos en ninguna de las dos transcripciones —en concreto las debidas a diferencias de criterio sobre la tonicidad de ciertas palabras gramaticales, la posición o duración de las pausas, y el alargamiento de segmentos—. Las divergencias originadas por cambios en la apertura o nasalización de vocales también son discutibles, puesto que son fenómenos que no siempre ocurren de forma sistemática.

Sin embargo, aún quedarían varias divergencias que podrían ser consideradas como fallos en la transcripción manual. Su existencia prueba que la tarea de la transcripción no es una labor sencilla, sino que requiere gran concentración y puede resultar tediosa, lo que facilita la aparición de errores humanos. Estos errores son difíciles de corregir, ya que a menudo pasan inadvertidos en las revisiones posteriores (especialmente cuando se trata de la ausencia de algún diacrítico en una transcripción larga). Este es un problema que no afecta a un transcriptor automático, el cual, aun con sus limitaciones, ofrece transcripciones que, especialmente sin son largas, pueden llegar a ser incluso más exactas que las realizadas manualmente por profesionales.

En cuanto al resultado del recuento, como se ha comentado ya, el corpus contiene 100 674 739 sílabas, de las cuales el 68,33 % son átonas y el 31,67 % son tónicas. Por lo que se refiere a los fonemas, suman 233 326 472, de los cuales el 66,22 % se encuentra en sílabas átonas y el 33,78 %, en tónicas. Se puede decir, por tanto, que en el español hablado aproximadamente uno de cada tres fonemas o una de cada tres sílabas son tónicos.

De los fonemas analizados, un 46,87 % son vocoides (el 43,15 % vocales, y el 3,72 % deslizantes), y el 53,13 % restante está dividido entre un 41,04 % de fonemas consonánticos en ataque y un 12,09 % en coda. En la Tabla 4 se puede observar la distribución de los distintos fonemas según su porcentaje de aparición, discriminando entre posiciones átonas y tónicas. También se añade una columna con la llamada tonicidad relativa, que relaciona el porcentaje de apariciones del fonema en sílabas tónicas con el valor medio mencionado del 33,78 %.

Tabla 4. Porcentajes de aparición de los fonemas del español, desglosados por tonicidad, y su tonicidad relativa (el porcentaje de apariciones tónicas dividido entre la tonicidad media, 33,78 %).

Fonema	% Ap. total	% Ap. átona	% Ap. tónica	Ton. rel.
/a/	13,30	9,27	4,03	0,90
/e/	13,10	9,31	3,79	0,86
/o/	9,85	7,54	2,31	0,70
/s/	7,47	5,72	1,74	0,69
/n/	7,07	4,30	2,77	1,16
/ɾ/	5,88	3,43	2,45	1,23
/d/	4,95	3,79	1,16	0,69
/l/	4,95	3,74	1,21	0,72
/i/	4,67	2,37	2,30	1,46
/t/	4,29	2,70	1,59	1,10
/k/	3,93	2,92	1,01	0,76
/m/	3,04	1,78	1,26	1,23
/b/	2,81	1,58	1,23	1,30
/p/	2,58	1,85	0,73	0,83
/u/	2,23	0,99	1,24	1,65
/j/	2,09	0,71	1,38	1,95
/θ/	1,67	0,79	0,88	1,56
/ɡ/	1,12	0,55	0,57	1,50
/w/	0,87	0,28	0,58	1,99
/r/	0,73	0,50	0,23	0,92
/x/	0,73	0,40	0,33	1,33
/f/	0,64	0,32	0,31	1,46
/i̯/	0,61	0,45	0,16	0,77
/ʎ/	0,42	0,31	0,11	0,77
/ʝ̞/	0,36	0,16	0,20	1,66
/ʧ/	0,28	0,19	0,09	0,93
/ɲ/	0,21	0,13	0,08	1,12
/u̯/	0,15	0,12	0,03	0,61
Total	100	66,22	33,78	100

Se puede comprobar que las vocales fuertes /a e o/ son los fonemas más frecuentes. Juntos representan más del 36 % de todos los fonemas de la cadena hablada. Si se ciñe la atención a las vocales, se observa que la siguiente en aparecer, /i/, ocupa la 9.ª posición y la /u/ queda en la 15.ª. En cuanto a las paravocales, la más común es la /j/, que está en la 16.ª posición. Sigue en esta lista la semiconsonante posterior /w/, en 19.ª posición, y, por último, las semivocales /i̯ u̯/ en 23.ª y 28.ª (y última) posición.

En cuanto a los datos de tonicidad relativa, se puede apreciar que las vocales abiertas son, en proporción, menos tónicas que las cerradas. Por otra parte, las semiconsonantes son los fonemas que más tienden a aparecer en posición tónica, mientras que las semivocales se sitúan en el extremo opuesto.

En cuanto a las consonantes, se observa que, con una diferencia muy apreciable, las consonantes más frecuentes son las alveolares o dentoalveolares /s n ɾ d l t/, que se reparten entre la 4.ª y la 10.ª posición (la /i/ está en la 9.ª, como se comentó). La /r/ sin embargo, es un fonema poco común, que no aparece hasta la 20.ª posición. En un dialecto con seseo, la /s/ sería, con diferencia, el fonema consonántico más habitual del español, con un 9,13 % del total (aproximadamente, una de cada seis consonantes), con una frecuencia de aparición muy cercana a la de la /o/.

Tras las alveolares, el grupo de las bilabiales /m b p/ es el siguiente tipo de consonante más frecuente: entre la 12.ª y la 14.ª posición. Se podría asimismo concluir que el siguiente grupo de consonantes estaría formado por las interdentales, las velares (excepto la /k/, que es más frecuente que las bilabiales, en 11.ª posición) y las labiodentales, es decir con el orden siguiente: /θ g x f/.

Por último, las consonantes menos frecuentes, con diferencia, son las palatales /ʎ ʝ̞ ʧ ɲ/, ubicadas en cuatro de las últimas cinco posiciones, si bien hay que tener en cuenta que, en una pronunciación que no diferencie la /ʎ/ de la /ʝ̞/, el fonema /ʝ̞/ aparecería en la 20.ª posición del listado.

Es más difícil establecer algún tipo de relación entre el segmento y la tonicidad en el caso de las consonantes. Sí se puede apreciar que los fonemas que aparecen más habitualmente en sílaba tónica son /ʝ̞ θ g f x b/, que se incluyen entre las consonantes menos frecuentes. Lo contrario también se cumple en gran medida, ya que las consonantes más frecuentes tienden más a aparecer en sílaba átona que la media de fonemas.

También se ha realizado un análisis en el nivel de alófono, y la Tabla A5 muestra los resultados para los fonemas situados en el núcleo. En ella se muestra el fonema en cuestión, su porcentaje de aparición entre los fonemas del núcleo [17], los alófonos con los que se presenta, el porcentaje de aparición de dicho alófono para ese fonema [18], y los porcentajes de aparición del alófono en sílaba átona o tónica, pero esta vez en relación con el total de fonemas analizados y no solo con los fonemas del núcleo [19].

Puede apreciarse que las variantes alofónicas más frecuentes de los vocoides son sus versiones orales, principalmente las variantes cerradas [j i i̯ e a o w u u̯]. Menos frecuentes que ellas son las variantes orales abiertas [i̞ ɛ ɑ ɔ u̞], y por último, las variantes nasalizadas [j̃ ĩ ĩ̯ ẽ ã õ w̃ ũ ũ̯] son las más escasas. Este mismo patrón se repite para las vocales largas: las orales cerradas son más habituales que las abiertas, y estas, a su vez, son más frecuentes que las nasalizadas.

También se han analizado los alófonos de las consonantes, distinguiendo entre posición de ataque y de coda. En la Tabla A6 y en la Tabla A7 (con las mismas columnas que la Tabla A5) aparecen los resultados para las posiciones de ataque y coda, respectivamente. Como puede observarse, las dos tablas ofrecen resultados bastante diferentes.

Al considerar la distribución de los fonemas en posición de ataque, lo primero que se observa es que las dos consonantes más frecuentes en el recuento total (/s n/) bajan hasta la 5.ª y la 7.ª posición cuando solo se considera el ataque. Estas dos consonantes son eminentemente consonantes de coda, lo que se debe a la propia morfología del español, ya que son terminaciones habituales de muchos morfemas de flexión y derivación nominal y verbal.

En cambio, las dentoalveolares son las consonantes más frecuentes en ataque: /d t/ aparecen en 1.ª y 2.ª posición, de forma que su agrupación constituye el 22,13 % de los fonemas en ataque. Por lo demás, el orden de frecuencias es similar al recuento consonántico global ya presentado. No debe olvidarse que los fonemas consonánticos en ataque suman el 77,24 % del total de fonemas consonánticos, con lo que el recuento global ha de ser forzosamente parecido al recuento de ataque.

Los resultados para las consonantes en coda también son sustancialmente diferentes de los del recuento general de consonantes. Los dos fonemas consonánticos más frecuentes, /s n/, también lo son en coda, pero en posición inversa (algo más frecuente la /n/ que la /s/). Además, en este caso estos dos fonemas por sí mismos representan el 64,21 % del total. Si se les suman las otras dos consonantes alveolares del español /ɾ l/ (la /r/ no puede aparecer en coda salvo en pronunciación enfática), en 3.ª y 4.ª posición, se obtiene el 91,70 % del total. Como puede comprobarse, la distribución de consonantes en coda es mucho más irregular, con unas pocas consonantes que aparecen en la mayoría de los casos.

Puede verse en la Tabla A7 que, de estos cuatro fonemas, la /ɾ/ se encuentra en sílaba tónica mucho más frecuentemente que el resto. Otros fonemas más frecuentes que la media en codas de sílabas tónicas son /x d θ ʧ f/. El resto tiende a ubicarse más en posición átona que la media. Los fonemas más habituales en sílabas átonas que la media son /s b l g p/.

En la Tabla A8 se puede ver un listado de los 106 alófonos utilizados, ordenados por frecuencia de aparición y distribuidos según su aparición en sílabas tónicas y átonas.

En cuanto al análisis del corpus en el nivel de sílaba, la Tabla A9 muestra los 30 distintos tipos silábicos posibles en español, con sus porcentajes de aparición (discriminados por tonicidad). En las últimas columnas se recoge la sílaba concreta con la que se encuentra representado más frecuentemente cada tipo, junto con el dato de la tonicidad relativa, ya utilizado anteriormente.

Según los datos de la Tabla A9 la sílaba por excelencia en español (en la cadena hablada) es la del tipo CV, con el 57,45 % del total, seguida muy de lejos por las que responden a los tipos CVC y V. Solo con la suma de estos tres tipos de sílaba (de los 30 posibles) se aglutina el 83 % de las sílabas. Si se añaden los siguientes cuatro tipos de sílaba más frecuentes (CScV, CCV, CC y CScVC) se alcanza el 96,93 %. También puede apreciarse en la Tabla A9 que, por lo general, las sílabas con semivocal tienden a ser átonas y las sílabas con semiconsonante tienden a ser tónicas en mayor proporción que el resto.

Por último, la Tabla A10 recoge las 40 sílabas más frecuentes en la cadena hablada, cuya frecuencia de aparición en conjunto supera ligeramente el 50 %. Son sílabas del tipo CV casi en su totalidad, salvo por dos sílabas de tipo V, otras dos de tipo VC y otra del tipo CVC.

En total, el corpus analizado contiene 13 424 sílabas distintas a nivel de fonema. Dichas sílabas tienen 33 777 realizaciones distintas a nivel alofónico.

5. CONCLUSIONES Y LÍNEAS DE TRABAJO FUTUROTop

Comparar los resultados de este trabajo con los de estudios previos (que aparecen en la Tabla A1 y en la Tabla A2) no es un asunto trivial, debido a que en ellos la metodología es diferente: se mezclan distintos dialectos del español y además se agrupan los fonemas de formas diversas. Las paravocales suelen agruparse con las vocales cerradas correspondientes y algunos trabajos utilizan archifonemas en la coda o los desglosan en (algunos) alófonos. En cualquier caso, puede comprobarse que los resultados de este trabajo van en la misma línea que los estudios previos y que las variaciones pueden ser atribuibles al distinto corpus utilizado en el recuento.

Los resultados obtenidos describen bastante bien la realidad fonética del castellano hablado. Sin embargo, tienen claras limitaciones. Los principales fallos se producen debido a los problemas expuestos por Ríos (1993), principalmente con relación al silabeo y a la asignación de los acentos secundarios. Además, no se puede evitar que en el corpus aparezca alguna palabra extranjera que no siempre se transcribirá como es debido, ya que el transcriptor solo está preparado para trabajar con la ortografía española.

Quizá el problema más importante sea el hecho de que existen casos ambiguos en los que la norma indica que existe un diptongo ortográfico aunque oralmente pueda realizarse con diptongo o hiato dependiendo de la palabra y del hablante. Por ejemplo, las secuencias <ia>/<ua> forman habitualmente un diptongo (como en <odiar> o <aguar>), pero existen verbos (y algunas otras pocas palabras) en los que dicha combinación constituye un hiato (<vaciar>, <actuar>, <truhan>, <guion>), algo que no se refleja en la ortografía. Debido a ello, no es posible crear un procedimiento de silabeo que funcione de forma correcta sin tener un lexicón con formas con hiato y formas con diptongo. Estas formas son poco numerosas y se podría crear una pequeña base de datos que incluyera tales excepciones.

En este sentido, la existencia de prefijos que no se silabean junto con el lexema principal también causa problemas. Como se indica en Hualde (1989), estos prefijos se silabean en un nivel más bajo, como si el prefijo y el lexema fueran dos palabras consecutivas. Así, el transcriptor producirá la forma [su.β̞lu.ˈnaɾ] para la palabra <sublunar>, cuando una transcripción más correcta sería [ˌsuβ̞.lu.ˈnaɾ]. Para corregir este defecto, se podría disponer de una lista de aquellos prefijos que experimentan este fenómeno, de manera que se identificaran y se listaran como palabras independientes, con la particularidad de que llevarían acento secundario. La identificación de los prefijos facilitaría que se produjera la forma correcta también en aquellos casos en que la sucesión de dos vocales produce en realidad un hiato y no un diptongo (<antihéroe> debería transcribirse como [ˌan̪.t̪i.ˈe.ɾo.e] y no como [an̪.ˈt̪je.ɾo.e]).

Surgen asimismo problemas en cuanto a los acentos secundarios en las palabras compuestas. El transcriptor solo es capaz de detectar los adverbios acabados en <-mente>, pero, según se ha visto, existen prefijos que adquieren un acento secundario, como también ocurre en palabras compuestas del tipo de [ˌsɑl̪.t̪a.ˈmɔ̃n̪.t̪es], y que se transcriben incorrectamente. Sucede igualmente el fenómeno contrario, es decir, que se transcribe incorrectamente una marca de tonicidad que no debería aparecer, como en los compuestos de dos o más palabras donde solo la última es tónica, como en <centro derecha>, <José Luis> o <nueve mil>, algo de lo que se habla con más detalle en Gómez Torrego (2011).

Aparte del mencionado problema de la tonicidad, la expansión de los numerales no siempre es correcta, ya que se emplea por defecto su forma masculina no apocopada. Así, la transcripción de <21 semanas> será [bɛi̯n̪.ˈt̪ju.no.se.ˈmã.nas]. Esto se podría evitar realizando un análisis sintáctico previo, lo que añadiría bastante complejidad al sistema.

Por otra parte, el tratamiento de siglas, acrónimos y abreviaturas es incompleto. Aunque los acrónimos se deletrean correctamente, existen casos en los que la transcripción producida no es la apropiada. También puede ocurrir que se confunda una palabra o un acrónimo con un número romano. Así, <talla XL> se transcribe erróneamente como [ˈt̪a.ʎa.k̠wa.ˈɾen̪.t̪a].

El transcriptor creado es muy potente, y es capaz de calcular la transcripción fonética correcta (en la práctica totalidad de los casos) como una sucesión de los 106 alófonos posibles, incluyendo el (re)silabeo y la asignación de tonicidad. Por ello, podría ser un recurso muy importante para un sistema de conversión de texto a habla, en el que la transcripción se tomara como input para un dispositivo que la convirtiera en habla sintética. En este caso, sería deseable analizar, además, las características entonativas del texto, como se hace en TexAFon (Garrido et al., 2012).

AGRADECIMIENTOSTop

Quiero expresar mi agradecimiento a Juan María Garrido Almiñana por atender mis consultas y por sus sugerencias durante la realización de este trabajo.

NOTASTop


[1]	Python es un software estándar, disponible en https://www.python.org.
[2]	Se ha optado por utilizar la notación [n̠] frente a [nʲ] por simplicidad y para poder utilizar la forma [^n̠].
[3]	Los alófonos [^{β̞ ð̞ ɣ̞ x}] son alófonos de coda que pueden llegar a aparecer en ataque por efecto del resilabeo.
[4]	Se prefiere la forma /ʧ/ frente a /t͡ʃ/ por simplicidad.
[5]	Se utiliza la notación [z̪] en vez de la forma, quizá más correcta, [s̬̪] para evitar el uso de dos diacríticos.
[6]	Se sigue la propuesta de transcripción de Martínez Celdrán y Fernández Planas (2000) para la africada palatal sonora: [ɟ͡ʝ̞].
[7]	Como ocurre con la nasal, se utiliza la notación [l̠] frente a [lʲ] por simplicidad.
[8]	Las realizaciones [ʝ̞ ɟ͡ʝ̞] se consideran alófonos del fonema consonántico /ʝ̞/.
[9]	La realización de /w/ como [ɣ̞w] o [ɡw] se considera como una inserción del fonema /ɡ/.
[10]	Un ordenador portátil Lenovo IdeaPad Z510, con un procesador Intel Core i7-4702MQ a 2,2 GHz y una memoria RAM de 16 Gb DDR3L a 1333 MHz.
[11]	Caracteres ambiguos son el punto, que puede no segmentar oraciones si es parte de un acrónimo, de una abreviatura o de un número; y los dos puntos, que pueden ser parte de una hora.
[12]	Esto es, los saltos de línea, además de los caracteres <¿?¡!()[]{}…;>.
[13]	Aunque los ejemplos se dan siempre en minúsculas, en realidad, cuando se trata con caracteres (incluso dígrafos) es indiferente si están en mayúsculas o minúsculas o combinados de alguna manera.
[14]	El manual de transcripción de Fernández Planas y Carrera Sabaté (2001) considera que el fonema /s/ en coda se elide si va seguido de /r/ en ataque.
[15]	No se permiten sílabas sin ataque y con semiconsonante. En esos casos se produce una consonantización de la semiconsonante: <hielo> [ˈɟ͡ʝ̞e.lo], <cacahuete> [ka.ka.ˈɣ̞we.t̪e].
[16]	Para identificar los elementos de los distintos tipos de sílaba, se utiliza la siguiente convención: C para consonante, S_c para semiconsonante, V para vocal y S_v para semivocal.
[17]	La suma de porcentajes es, pues, 100 %, y no 46,87 %.
[18]	La suma de todas las filas para un fonema dado es por lo tanto el 100 %.
[19]	La suma total de la tercera y cuarta columnas es el porcentaje de aparición de vocoides, un 46,87 %.

REFERENCIASTop


Alameda, J. R., y Cuetos, F. (1995). Diccionario de frecuencias de las unidades lingüísticas del castellano. Oviedo: Servicio de Publicaciones de la Universidad de Oviedo.
Alarcos Llorach, E. (1965). Fonología española (4.ª ed.). Madrid: Gredos.
Álvarez, C. J., Carreiras, M., y de Vega, M. (1992). Estudio estadístico de la ortografía castellana: (1) La frecuencia silábica. Cognitiva, 4(1), 75-105.
Bonaventura, P., Giuliani, F., Garrido, J. M., y Ortín, I. (1998). Grapheme-to-phoneme transcription rules for Spanish, with application to automatic speech recognition and synthesis. Proceedings of the Workshop on Partially Automated Techniques for Transcribing Naturally Occurring Continuous Speech, 16th August 1998, Université de Montréal. Montréal: COLING-ACL, 33-39. https://doi.org/10.3115/1628291.1628295
Castro, M. J., España, S., Salvador, I., y Marzalz, A. (2001). Transcriptor ortográfico-fonético para el castellano. Procesamiento del lenguaje natural, 27, 241-246.
Delattre, P. (1965).Comparing the phonetic features of English, German, Spanish and French. Heidelberg: Groos.
Fernández Planas, A. M., y Carrera Sabaté, J. (2001). Prácticas de transcripción fonética en castellano. Barcelona: Salvatella.
Garrido, J.M., Laplaza, Y., Marquina, M., Schoenfelder, C., y Rustullet, S. (2012). TexAFon: A multilingual text processing tool for text-to-speech applications. Proceedings of IberSPEECH 2012. Séptimas Jornadas en Tecnología del Habla and 3rd Iberian SLTech Workshop, 281-289. http://iberspeech2012.ii.uam.es/IberSPEECH2012_OnlineProceedings.pdf
Gómez Torrego, L. (2011). Algunos compuestos sintagmáticos con el primer componente átono y algunas formas prefijadas con la preposición «sin». En M. V. Escandell Vidal, M. Leonetti y C. Sánchez López, 60 problemas de gramática (pp. 366-379). Madrid: AKAL.
González Rátiva, M. C., y Mejía Escobar, J. A. (2011). Frecuencia fonemática del español de Colombia. Forma y Función, 24(2), 69-102. http://www.bdigital.unal.edu.co/37067/
Goyal, K. (2016). Calibre (Versión 2.53) [software]. Obtenido de https://calibre-ebook.com/
Grefenstette, G., y Tapanainen, P. (1994). What is a word, What is a sentence? Problems of Tokenization. Third International Conference on Computational Lexicography, Budapest, 1994, 79–87.
Guerra, R. (1983). Estudio estadístico de la sílaba en español. En M. Esgueva y M. Cantarero, Estudios de fonética1 (pp. 9-112). Madrid: Consejo Superior de Investigaciones Científicas e Instituto «Miguel de Cervantes».
Guirao, M., y Borzone de Manrique, A. M. (1972). Fonemas, sílabas y palabras en el español de Buenos Aires. Filología, 16, 135-165.
Guirao, M., y García, M. A. (1993). Estudio estadístico del español. Buenos Aires: Consejo Nacional de Investigaciones Científicas y Técnicas.
Hualde, J. I. (1989). Silabeo y estructura morfémica en español. Hispania, 72(4), 821-831. https://oadoi.org/10.2307/343560
Llisterri, J., y Mariño, J. B. (1993). Spanish adaptation of SAMPA and automatic phonetic transcription (informe SAM-A/UPC/001/V1). ESPRIT Project 6819.
Lloyd, P. M., y Schnitzer, R. D. (1967). A statistical study of the structure of the Spanish syllable. Linguistics, 5(37), 58-72. https://oadoi.org/10.1515/ling.1967.5.37.58
Marcos Marín, F. (Dir.) (1992) Corpus Oral de Referencia de la Lengua Española CORLEC [corpus]. http://www.lllf.uam.es/ESP/Corlec.html
Martínez Celdrán, E., y Fernández Planas, A. M. (2000). Características fonéticas de la africada palatal sonora del español. Actas del IV Congreso de Lingüística General (Vol. 4). Universidad de Cádiz, pp. 1751-1761.
Moreno Sandoval, A., Torre Toledano, D., Curto, N., y de la Torre, R. (2006). Inventario de frecuencias fonémicas y silábicas del castellano espontáneo y escrito. http://www.lllf.uam.es/ESP/Publicaciones/LLI-UAM-4JTH.pdf
Moreno Sandoval, A., Toledano, D. T., de la Torre, R., Garrote, M., y Guirao, J. M. (2008). Developing a phonemic and syllabic frequency inventory for spontaneous spoken Castilian Spanish and their comparison to text-based inventories. Proceedings of the 6th Conference on Language Resources and Evaluation (LREC), pp. 1097-1100.
Mosterín, J. (1981). La ortografía fonémica del español. Madrid: Alianza Universidad.
Navarro Tomás, T. (1966). Escala de frecuencia de fonemas españoles. Estudios de fonología española (2.ª ed.), 15-30. New York: Las Américas.
Pérez, H. E. (2003). Frecuencia de fonemas. Revista Electrónica en Tecnologías del Habla, 1.
Pérez Tobarra, L. (2005). El acento en español. redELE: Revista Electrónica de Didáctica ELE,4, 14-33.
Pineda, L. A., Villaseñor, L., Cuétara, J., Castellanos, H., y López, I. (2004). DIMEx100: A new phonetic and speech corpus for Mexican Spanish. Advances in Artificial Intelligence-IBERAMIA 2004, 974-983. Berlin: Springer. https://oadoi.org/10.1007/978-3-540-30498-2_97
Quilis, A., y Esgueva, M. (1980). Frecuencia de fonemas en el español hablado. Lingüística Española Actual,2(1), 1-25.
REAL ACADEMIA ESPAÑOLA, y ASOCIACIÓN DE ACADEMIAS DE LA LENGUA ESPAÑOLA (2005). Diccionario panhispánico de dudas. Madrid: Santillana.
Ríos Mestre, A. (1993). La información lingüística en la transcripción fonética automática del español. VIII Congreso de la SEPLN, Granada, 381-387. https://rua.ua.es/dspace/bitstream/10045/4619/1/PLN_13_28.pdf
Rojo Sánchez, G. (1991). Frecuencia de fonemas en español actual. En M. Brea y F. Fernández Rei (Coords.), Homenaxe ó Profesor Constantino García, vol. 1 (pp. 451-467). http://hdl.handle.net/10347/12469
Sebastián-Gallés, N., Martí, M. A., Carreiras, M. y Cuetos, F. (2000). LEXESP: Una base de datos informatizada del español [CD-ROM y libro]. Barcelona: Universitat de Barcelona.
Zipf, G. K., y Rogers, F. M. (1939). Phonemes and variphones in four present-day Romance languages and Classical Latin from the viewpoint of dynamic philology. Archives néerlandaises de phonétique expérimentale, 15, 111-147.

ANEXOTop

A.1. RESULTADOS DE LOS TRABAJOS PREVIOS (1939-1981) QUE INCLUYEN RECUENTOS DE FRECUENCIAS DE APARICIÓN DE FONEMAS DEL ESPAÑOL (CIFRAS EXPRESADAS COMO PORCENTAJE DEL TOTAL)Top

Fonema	Zipf y Rogers (1939)	Navarro (1966)	Alarcos (1965)	Delattre (1965)	Lloyd y Schnitzer (1967)	Guirao y Borzone (1972)	Quilis y Esgueva (1980)	Mosterín (1981)
/i/	4,20	6,81	8,60	4,63	8,53	7,27	7,38	7,97
/e/	12,20	12,92	12,60	14,06	9,73	14,51	14,67	13,89
/a/	14,06	13,55	13,70	13,06	15,21	12,45	12,19	12,13
/o/	9,32	9,11	10,30	9,21	10,27	9,85	9,98	9,23
/u/	1,76	2,82	2,10	1,87	2,77	3,08	3,33	3,27
/w/				1,25
Diptongos	2,02
Vocoides	43,56	45,21	47,30	44,08	46,51	47,16	47,55	46,49
/p/	2,92	2,97	2,10	2,29	2,36	2,76	2,77	2,40
/t/	4,46	4,67	4,60	4,74	5,32	4,92	4,53	4,40
/k/	3,84	4,10	3,80	4,64	3,76	4,37	3,98	3,95
/b/	3,26	2,46	2,50	2,85	2,92	2,45	2,37	2,10
/B/			0,10		0,13		0,03
/d/	5,06	4,85	4,00	5,20	3,81	4,16	4,24	4,59
/D/			0,25		0,23		0,31
/ɡ/	1,02	1,01	1,00	0,71	1,46	0,94	0,94	0,84
/G/			0,25		0,31		0,28
/f/	0,72	0,70	1,00	0,52	1,46	0,67	0,55	0,88
/θ/	1,74	2,16	1,70	1,42	2,49		1,45	1,95
/s/	8,12	8,24	8,00	8,35	4,26	9,72	8,32	9,01
/x/	0,58	0,49	0,70	0,37	1,02	0,65	0,57	0,73
/ʧ/	0,30	0,29	0,40	0,32	0,57	0,33	0,37	0,15
/ʝ̞/	2,40	0,39	0,40	2,94	0,15		0,41	0,09
/m/	2,98	3,00	2,50	3,73	2,48	3,04	3,06	2,74
/n/	5,94	6,73	2,70	7,01	2,34	7,67	2,78	7,99
/ɲ/	0,36	0,35	0,20	0,30	0,28	0,28	0,25	0,00
/N/			3,70		4,44		4,86
/ɾ/	5,90	5,73	2,50		8,24	5,58	3,26	5,59
/R/			4,50	6,23			1,93
/r/	1,04	0,78	0,60		1,17	0,50	0,43	0,81
/l/	5,20	5,29	4,70	3,84	2,96	4,25	4,23	4,98
/ʎ/	0,60	0,58	0,50	0,47	0,60		0,38	0,31
/ʒ/						0,55
Consonantes	56,44	54,79	52,70	55,93	52,76	52,84	52,30	53,51

A.2. RESULTADOS DE TRABAJOS PREVIOS (1991-2011) QUE INCLUYEN RECUENTOS DE FRECUENCIAS DE APARICIÓN DE FONEMAS DEL ESPAÑOL (CIFRAS EXPRESADAS COMO PORCENTAJE DEL TOTAL). LA ÚLTIMA COLUMNA CORRESPONDE A ESTE TRABAJOTop

Fonema	Rojo (1991)	Guirao y García (1993)	Llisterri y Mariño (1993)	Pérez (2003)	Pineda *et al.* (2004)	Moreno *et al.* (2006)	González y Mejía (2011)	Arias (2016)
/i̯/								0,61
/i/	7,50	6,59	4,29	7,46	6,60	7,59	7,82	4,67
/j/			2,60		1,90			2,09
/e/	13,51	14,99	13,72	14,13	10,94	12,74	12,11	13,10
/ɛ/					2,59
/a/	13,40	13,27	13,43	12,31	11,45	12,89	14,38	13,30
/ɑ/					0,62
/o/	9,57	10,75	10,37	9,28	5,05	9,32	11,20	9,85
/ɔ/					4,26
/u/	3,16	2,79	1,98	3,05	1,87	3,04	2,95	2,23
/w/			1,35		1,14			0,87
/u̯/								0,15
Vocoides	47,14	48,39	47,74	46,23	46,42	45,58	48,46	46,87
/p/	2,66	2,68	2,60	2,58	2,57	2,73	2,76	2,58
/t/	4,48	4,48	4,63	4,92	4,66	4,31	5,26	4,29
/k/	3,98	4,31	4,04	3,94	3,33	3,80	3,55	3,93
/k̟/					0,57
/b/	2,66	3,08	0,45	1,92	0,32	2,55	3,60	2,81
/β̞/			2,47		1,79
/d/	4,79	4,00	0,76	4,84	0,98	5,42	4,41	4,95
/ð̞/			3,20		4,59
/ɡ/	0,95	1,11	0,11	0,94	0,09	1,04	1,36	1,12
/ɣ̞/			0,79		0,73
/f/	0,68	0,53	0,51	0,75	0,80	0,92	0,71	0,64
/θ/	1,68		1,53			2,00		1,67
/s/	7,58	9,39	6,95	9,61	7,86	7,33	5,84	7,47
/s̬/			1,33		1,27
/s̪/					1,11
/x/	0,73	0,70	0,63	0,74	0,70	0,77	0,91	0,73
/ʧ/	0,28	0,40	0,40	0,32	0,15	0,18	0,39	0,28
/ʨ/							0,10
/ʝ̞/	0,22	0,72	0,19	0,69	0,31		0,85	0,36
/ɟ͡ʝ̞/					0,01
/m/	3,09	3,17	3,63	2,62	2,77	2,76	3,63	3,04
/n/	6,99	7,14	7,02	7,78	4,85	7,09	7,16	7,07
/n̪/					1,86
/ŋ/			0,46		0,38
/ɲ/	0,19	0,24	0,27	0,24	0,13	0,31	0,28	0,21
/ɾ/	5,67	5,40	4,25	6,19	5,70	6,19	6,47	5,88
/r/	0,79	0,39	0,40	0,64	0,62	0,99	0,98	0,73
/l/	5,08	3,88	4,25	5,05	5,43	5,46	3,28	4,95
/ʎ/	0,38		0,54			0,53		0,42
Consonantes	52,88	51,62	51,41	53,77	53,58	54,38	51,54	53,13

A.3. LISTADO DE LAS OBRAS QUE COMPONEN EL CORPUS Y SU AÑO DE PUBLICACIÓN, AGRUPADOS POR AUTORTop

Autor/Obra	Año
Adón, Pilar
El mes más cruel	2010
Aguilar, Carlos
Nueve colores sangra la luna	2005
Árbol, Víctor del
La tristeza del samurái	2011
Respirar por la herida	2013
Un millón de gotas	2014
Asensi, Matilde
El salón de ámbar	1999
Iacobus	2000
El último catón	2001
El origen perdido	2003
Peregrinatio	2004
Todo bajo el cielo	2006
Tierra Firme	2007
Venganza en Sevilla	2010
La conjura de Cortés	2012
Benítez Reyes, Felipe
Mercado de espejismos	2007
Caballero Bonald, José Manuel
Dos días de septiembre	1962
Campo de Agramante	1992
Carrillo, Mónica
La luz de Candela	2014
Caso, Ángeles
El peso de las sombras	1994
Un largo silencio	2000
Las olvidadas, una historia de mujeres creadoras	2005
Contra el viento	2009
Donde se alzan los tronos	2012
Cela Conde, Camilo José
Cela, mi padre. La vida íntima y literaria de Camilo José Cela contada por su hijo	1989
Cela, Camilo José
La familia de Pascual Duarte	1942
Viaje a La Alcarria	1948
La colmena	1951
Mrs Caldwell habla con su hijo	1953
Primer viaje andaluz. Notas de un vagabundaje por Jaén, Córdoba, Sevilla, Huelva y sus tierras	1959
Garito de hospicianos o guirigay de imposturas o bombollas	1963
San Camilo 1936	1969
La insólita y gloriosa hazaña del cipote de Archidona	1977
Mazurca para dos muertos	1983
Nuevo viaje a la Alcarria	1986
Cachondeos, escarceos y otros meneos	1993
La cruz de San Andrés	1994
Madera de boj	1999
Cercas, Javier
El móvil	1987
El vientre de la ballena	1997
Soldados de Salamina	2001
La velocidad de la luz	2005
Anatomía de un instante	2009
Las leyes de la frontera	2012
El impostor	2014
Corral, José Luis
El salón dorado	1996
El amuleto de bronce	1998
El invierno de la corona	1999
El Cid	2000
Trafalgar	2001
La torre y el caballero. El ocaso de los feudales	2002
Numancia	2003
El número de Dios	2004
¡Independencia!	2005
Breve historia de la Orden del Temple	2006
El caballero del templo	2006
Fulcanelli, el dueño del secreto	2008
El rey felón	2009
Fátima, el enigma de las apariciones	2009
¿Qué fue la Corona de Aragón?	2010
La prisionera de Roma	2011
El Códice del Peregrino	2012
El médico hereje	2013
El trono maldito	2014
Delibes, Miguel
La sombra del ciprés es alargada	1947
El camino	1950
La partida	1954
Diario de un cazador	1955
Diario de un emigrante	1958
La hoja roja	1959
Las ratas	1962
Viejas historias de Castilla la Vieja	1964
Cinco horas con Mario	1966
La mortaja	1970
El príncipe destronado	1973
Mis amigas las truchas	1977
El disputado voto del señor Cayo	1978
Un mundo que agoniza	1979
Los santos inocentes	1981
Dos viajes en automóvil: Suecia y Países Bajos	1982
Cartas de amor de un sexagenario voluptuoso	1983
Tres pájaros de cuenta	1987
Mi querida bicicleta	1988
Señora de rojo sobre fondo gris	1991
Diario de un jubilado	1995
El hereje	1998
España 1939-1950: Muerte y resurrección de la novela	2004
Dueñas, María
El tiempo entre costuras	2009
Misión Olvido	2012
Eslava Galán, Juan
En busca del unicornio	1987
Roma de los césares	1988
Yo, Aníbal	1988
Tartessos y otros enigmas de la historia	1991
El viaje de Tobías	1992
Historia secreta del sexo en España	1992
Historias de la Inquisición	1992
Los templarios y otros enigmas medievales	1992
Historia de España contada para escépticos	1995
Julio César, el hombre que pudo reinar	1995
El fraude de la Sábana Santa y las reliquias de Cristo	1997
Tumbaollas y hambrientos. Los españoles comiendo y ayunando a través de la historia	1997
Señorita	1998
Escuela y prisiones de Vicentito González	1999
Los dientes del Dragón	2001
El paraíso disputado. Ruta de los castillos y las batallas	2003
La mula	2003
Los íberos. Los españoles como fuimos	2004
Una historia de la guerra civil que no va a gustar a nadie	2005
El mercenario de Granada	2006
Califas, guerreros, esclavas y eunucos. Los moros en España	2008
Los años del miedo	2008
El catolicismo explicado a las ovejas	2009
De la alpargata al seiscientos	2010
Rey Lobo	2010
Homo Erectus	2011
La década que nos dejó sin aliento	2011
La primera guerra mundial contada para escépticos	2014
Etxebarría, Lucía
Amor, curiosidad, prozac y duda	1997
Beatriz y los cuerpos celestes	1998
Nosotras que no somos como las demás	1999
Un milagro en equilibrio	2004
Lo verdadero es un momento de lo falso	2010
El contenido Del Silencio	2011
Tu corazón no está bien de la cabeza. Cómo salí de una relación tóxica	2013
Falcones, Ildefonso
La catedral del mar	2006
La mano de Fátima	2009
La reina descalza	2013
Freire, Espido
Melocotones helados	1999
Cuando comer es un infierno. Confesiones de una bulímica	2002
Cuentos malvados	2003
Mileuristas: cuerpo, alma y mente de la generación de los 1000 euros	2006
La flor del Norte	2011
Los malos del cuento. Cómo sobrevivir entre personas tóxicas	2013
García Montero, Luis
Habitaciones separadas	1994
Mañana no será lo que Dios quiera	2009
No me cuentes tu vida	2012
Una forma de resistencia	2012
Alguien dice tu nombre	2013
Giner, Gonzalo
La cuarta alianza	2005
El secreto de la logia	2007
El sanador de caballos	2008
El jinete del silencio	2011
Pacto de lealtad	2015
Gómez Jurado, Juan
La leyenda del ladrón	2012
Goytisolo, Juan
Juegos de manos	1954
Para vivir aquí	1960
Señas de identidad	1966
Paisajes después de la batalla	1982
Coto vedado	1985
En los reinos de taifa	1986
Las virtudes del pájaro solitario	1988
El sitio de los sitios	1995
Carajicomedia	2000
Grandes, Almudena
Las edades de Lulú	1989
Te llamare Viernes	1991
Malena es un nombre de tango	1994
Modelos de mujer	1996
Atlas de geografía humana	1998
Los aires difíciles	2002
Castillos de cartón	2004
Estaciones de paso	2005
El corazón helado	2007
Inés y la alegría	2010
El lector de Julio Verne	2012
Las tres bodas de Manolita	2014
Los besos en el pan	2015
Lindo, Elvira
Manolito Gafotas	1994
Pobre Manolito	1995
¡Cómo molo!	1996
Los trapos sucios	1997
El otro barrio	1998
Manolito on the road	1998
Yo y el imbécil	1999
Tinto de verano	2001
Tinto de verano 2. El mundo es un pañuelo	2002
Manolito tiene un secreto	2002
Tinto de verano 3. Otro verano contigo	2003
Una palabra tuya	2008
Lo que me queda por vivir	2010
Lugares que no quiero compartir con nadie	2011
Mejor Manolo	2012
Llamazares, Julio
Luna de lobos	1985
La lluvia amarilla	1988
El río del olvido	1990
Trás-os-Montes	1998
El cielo de Madrid	2005
Las lágrimas de San Lorenzo	2013
Lloréns, Chufo
La otra lepra	1993
Catalina, la fugitiva de San Benito	2001
La saga de los malditos	2003
Te daré la tierra	2008
Mar de fuego	2011
Mallorquí del Corral, César
El último trabajo del Señor Luna	1997
La cruz de El Dorado	1999
La catedral	2000
Las lágrimas de Shiva	2002
El viajero perdido	2005
El juego de Caín	2008
El juego de los herejes	2010
La isla de Bowen	2012
Marías, Javier
Los dominios del lobo	1971
Travesía del horizonte	1973
El hombre sentimental	1986
Mientras ellas duermen	1990
Corazón tan blanco	1992
Vidas escritas	1992
Mañana en la batalla piensa en mí	1994
Cuando fui mortal	1996
Mala índole	1998
Fiebre y lanza	2002
Baile y sueño	2004
Veneno y sombra y adiós	2007
Los enamoramientos	2011
Así empieza lo malo	2014
Marsé, Juan
Encerrados con un solo juguete	1960
Últimas tardes con Teresa	1966
La oscura historia de la prima Montse	1970
Si te dicen que caí	1973
La muchacha de las bragas de oro	1978
Un día volveré	1982
Ronda del Guinardó	1984
El amante bilingüe	1990
El embrujo de Shanghai	1993
Rabos de lagartija	2000
Caligrafía de los sueños	2011
Matute, Ana María
Los soldados lloran de noche	1963
La trampa	1969
Luciérnagas	1993
Demonios familiares	2014
Mejide, Risto
#Annoyomics: El arte de molestar para ganar dinero	2000
No busques trabajo	2000
El pensamiento negativo	2008
Que la muerte te acompañe	2011
Mendoza, Eduardo
La verdad sobre el caso Savolta	1975
El misterio de la cripta embrujada	1978
El laberinto de las aceitunas	1982
La ciudad de los prodigios	1986
Nueva York	1986
La isla inaudita	1989
Sin noticias de Gurb	1991
El año del diluvio	1992
La aventura del tocador de señoras	2001
Baroja, la contradicción	2001
El último trayecto de Horacio Dos	2002
Mauricio o las elecciones primarias	2006
El asombroso viaje de Pomponio Flato	2008
Tres vidas de santos	2009
Rina de gatos. Madrid 1936	2010
El enredo de la bolsa y la vida	2012
Millás, Juan José
Visión del ahogado	1977
La soledad era esto	1990
Tonto, muerto, bastardo e invisible	1995
El orden alfabético	1998
No mires debajo de la cama	1999
Dos mujeres en Praga	2002
El mundo	2007
Lo que sé de los hombrecillos	2010
Articuentos completos	2011
La mujer loca	2014
Moix, Terenci
No digas que fue un sueño	1986
El cine de los sábados	1990
Garras de astracán	1991
La herida de la esfinge	1991
Memorias. El peso de la paja. El beso de Peter Pan	1993
Mujercísimas	1995
El amargo don de la belleza	1996
Memorias. El peso de la paja. Extraño en el paraíso	1998
Chulas y famosas	1999
El arpista ciego	2002
Montero, Carla
La piel dorada	2014
Montero, Rosa
Te trataré como a una reina	1983
Amado amo	1988
Temblor	1990
Bella y oscura	1993
La hija del caníbal	1997
Amantes y enemigos. Cuentos de parejas	1998
El corazón del tártaro	2001
La loca de la casa	2003
Historia del Rey Transparente	2005
Lágrimas en la lluvia	2011
Dictadoras: Las mujeres de los hombres más despiadados de la historia	2013
La ridícula idea de no volver a verte	2013
Muñoz Molina, Antonio
Beatus ille	1986
El invierno en Lisboa	1987
Beltenebros	1989
Córdoba de los Omeyas	1991
El jinete polaco	1991
Los misterios de Madrid	1992
Ardor guerrero	1995
Plenilunio	1997
Carlota Fainberg	1999
En ausencia de Blanca	2001
Ventanas de Manhattan	2004
El viento de la luna	2006
La noche de los tiempos	2009
Navarro, Julia
La hermandad de la sábana santa	2004
La Biblia de barro	2005
La sangre de los inocentes	2007
Dime quién soy	2010
Dispara, yo ya estoy muerto	2013
Historia de un canalla	2016
Palomas, Alejandro
El alma del mundo	2011
El tiempo que nos une	2016
Pérez Reverte, Arturo
El maestro de esgrima	1988
La tabla de Flandes	1990
El club Dumas o La sombra de Richelieu	1993
La sombra del águila	1993
Territorio comanche	1994
La piel del tambor	1995
Un asunto de honor	1995
El capitán Alatriste	1996
Limpieza de sangre	1997
El sol de Breda	1998
Patente de corso	1998
El oro del rey	2000
La carta esférica	2000
La Reina del Sur	2002
El caballero del jubón amarillo	2003
Cabo Trafalgar	2004
El húsar	2004
Corsarios de Levante	2006
El pintor de batallas	2006
Ojos azules	2009
El asedio	2010
El puente de los asesinos	2011
El tango de la guardia vieja	2012
El francotirador paciente	2013
Pombo, Álvaro
Relatos sobre la falta de sustancia	1977
Aparición del eterno femenino contada por S. M. el Rey	1993
Donde las mujeres	1996
Contra natura	2005
La Fortuna de Matilda Turpin	2006
El temblor del héroe	2012
Quédate con nosotros, Señor, porque atardece	2013
Posadas, Carmen
Pequeñas infamias	1998
La cinta roja	2008
Invitación a un asesinato	2010
El testigo invisible	2013
Posteguillo Gómez, Santiago
Africanus: el hijo del cónsul	2006
La traición de Roma	2009
Los asesinos del emperador	2011
Circo Máximo	2013
La sangre de los libros	2014
Trajano y Decebalo en la Rumanía del siglo XXI	2014
Las legiones malditas	2008
Prada, Juan Manuel de
Las máscaras del héroe	1996
La tempestad	1997
Rivas, Manuel
¿Qué me quieres, amor?	1997
El lápiz del carpintero	2002
Los libros arden mal	2006
Todo es silencio	2010
Las voces bajas	2012
Ruescas, Javier
Cuentos de Bereth I: Encantamiento de luna	2009
Cuentos de Bereth II: La maldición de las Musas	2010
Tempus Fugit, ladrones de almas	2010
Cuentos de Bereth III: Los versos del destino	2011
Salas, Antonio
El año que trafiqué con mujeres	2004
Diario de un skin	2010
El palestino	2011
Operación princesa	2013
Sampedro, José Luis
El río que nos lleva	1961
Octubre, Octubre	1981
La sonrisa etrusca	1985
La vieja sirena	1990
Real Sitio	1993
El amante lesbiano	2000
Escribir es vivir	2005
Sánchez Adalid, Jesús
La luz de Oriente	2000
El mozárabe	2001
Félix de Lusitania	2002
La tierra sin mal	2003
El cautivo	2004
La sublime puerta	2005
En compañía del sol	2006
El caballero de Alcántara	2008
Los milagros del vino	2010
Galeón	2011
Alcazaba	2012
El camino Mozárabe	2013
Treinta doblones de oro	2014
Y de repente, Teresa	2014
Sánchez Dragó, Fernando
La prueba del Laberinto	1992
Sánchez, Mamen
Gafas de sol para días de lluvia	2007
Agua del limonero	2010
Juego de damas	2011
La felicidad es un té contigo	2013
Se prohíbe mantener afectos desmedidos en la puerta de la pensión	2014
Sánchez-Garnica, Paloma
La brisa de oriente	2009
El alma de las piedras	2011
Las tres heridas	2012
La sonata del silencio	2014
Santandreu, Rafael
El arte de no amargarse la vida	2014
Las gafas de la felicidad	2014
Savater, Fernando
Ética para Amador	1991
Política para Amador	1992
El jardín de las dudas	1993
La hermandad de la buena suerte	1993
El valor de educar	1997
Las preguntas de la vida	1999
Mira por dónde. Autobiografía razonada	2003
Los diez mandamientos en el siglo XXI	2004
El gran laberinto	2005
La vida eterna	2007
Ética de urgencia	2012
Los invitados de la princesa	2012
Sierra, Javier
Roswell, secreto de Estado	1995
La dama azul	1998
En busca de la edad de oro	2000
Las puertas templarias	2000
La cena secreta	2004
La ruta prohibida y otros enigmas de la Historia	2007
El ángel perdido	2011
El quinto mundo	2012
El maestro del Prado	2013
La guía secreta del Prado	2013
La pirámide inmortal	2014
Silva, Lorenzo
Noviembre sin violetas	1995
La sustancia interior	1996
La flaqueza del bolchevique	1997
El lejano país de los estanques	1998
El ángel oculto	1999
El urinario	1999
El alquimista impaciente	2000
La lluvia de París	2000
Del Rif al Yebala	2001
El nombre de los nuestros	2001
La isla del fin de la suerte	2001
Niños feroces	2001
La niebla y la doncella	2002
El déspota adolescente	2003
Carta blanca	2004
Nadie vale más que otro	2004
La reina sin espejo	2005
El blog del inquisidor	2008
El Derecho en la obra de Kafka	2008
La estrategia del agua	2010
Sereno en el peligro	2010
Tres mil metros en la noche	2011
Zona desdinerizada	2011
La marca del meridiano	2012
Siete ciudades en África: Historia del Marruecos español	2013
Los cuerpos extraños	2014
Torres, Maruja
Un calor tan cercano	1998
Mientras vivimos	2000
Esperadme en el cielo	2009
Fácil de matar	2011
Sin entrañas	2012
Diez veces siete	2014
Umbral, Francisco
Valle-Inclán, los botines blancos de piqué	1968
Las ninfas	1975
Mortal y rosa	1975
Ramón y las vanguardias	1978
Nada en el domingo	1988
El fulgor de África	1989
La leyenda del césar visionario	1992
Memorias borbónicas	1992
Madrid 650	1995
La forja de un ladrón	1997
La bestia rosa	1998
El socialista sentimental	1999
Un ser de lejanías	2001
Cela: un cadáver exquisito	2002
Días felices en Argüelles	2005
Carta a mi mujer	2008
Ussía, Alfonso
Memorias del marqués de Sotoancho. La albariza de los juncos	1998
El secuestro de Mamá y otros relatos del marqués de Sotoancho	1999
Lo que Dios ha unido que no lo separe Mamá	2000
Pachucha tirando a mal	2001
Un talibán en La Jaralera	2002
Las dos bodas. El Príncipe y Sotoancho se casan	2004
Las canicas, las cuquis y el novio tontito de Mamá	2005
Mamá se quiere morir y no hay manera	2006
¡Milagro! Se ha muerto Mamá	2007
El diario de Mamá	2009
Vargas Llosa, Mario
Los jefes y otros cuentos	1959
La ciudad y los perros	1963
La casa verde	1966
Conversación en La Catedral	1969
García Márquez: historia de un deicidio	1971
Pantaleón y las visitadoras	1973
La orgía perpetua. Flaubert y Madame Bovary	1975
La tía Julia y el escribidor	1977
La guerra del fin del mundo	1981
Historia de Mayta	1984
¿Quién mató a Palomino Molero?	1986
El hablador	1987
Elogio de la madrastra	1988
La verdad de las mentiras	1990
El loco de los balcones	1993
El pez en el agua	1993
Lituma en Los Andes	1993
Cartas a un joven novelista	1997
Los cuadernos de don Rigoberto	1997
La fiesta del chivo	2000
Artículos y ensayos	2002
El Paraíso en la otra esquina	2003
Travesuras de niña mala	2006
El viaje a la ficción	2008
El sueño del celta	2010
La civilización del espectáculo	2012
El héroe discreto	2013
Vázquez Figueroa, Alberto
Bajo siete mares. Largo viaje al paraíso	1968
Tierra virgen. La destrucción del Amazonas	1973
¿Quién mató al embajador?	1974
Ébano	1975
Manaos	1975
¡Panamá, Panamá!	1977
Marea negra	1977
Nuevos dioses	1980
Tuareg	1980
Matar a Gadafi	1981
La iguana	1982
Océano	1984
Yaiza	1984
Maradentro	1985
Cienfuegos	1987
Palmira	1987
Viracocha	1987
El perro	1989
Caribes	1990
Azabache	1991
Sicario	1991
Montenegro	1992
Brazofuerte	1993
África llora	1994
Negreros	1996
Piratas	1996
Leon Bocanegra	1998
Los ojos del tuareg	2000
Tiempo de conquistadores	2000
Bora Bora	2001
Delfines	2001
La puerta del Pacífico	2004
Alí en el país de las maravillas	2005
El rey leproso	2005
Centauros	2007
Pederastas	2007
Por mil millones de dólares	2007
Vivos y muertos	2007
Coltán	2008
Saud el leopardo	2009
Garoé	2010
El mar en llamas	2011
Irina Dogonovic	2011
Codicia	2012
Bimini	2013
Vázquez Montalbán, Manuel
Yo maté a Kennedy. Impresiones, observaciones y memorias de un guardaespaldas	1972
Tatuaje	1974
La soledad del mánager	1977
La rosa de Alejandría	1984
El balneario	1986
Historias de padres e hijos	1987
Escritos subnormales	1989
Galíndez	1990
El hombre de mi vida	2000
La aznaridad	2003
Vila Matas, Enrique
Bartleby y compañía	2001
París no se acaba nunca	2003
Doctor Pasavento	2005
El viento ligero en Parma	2008
Aire de Dylan	2012

A.4. COMPARACIÓN ENTRE TRANSCRIPCIÓN MANUAL Y AUTOMÁTICA. CON FONDO GRIS LOS SÍMBOLOS QUE APARECEN EN LA TRANSCRIPCIÓN AUTOMÁTICA PERO NO EN LA MANUAL, Y CON FONDO NEGRO LOS QUE SOLO APARECEN EN LA TRANSCRIPCIÓN MANUALTop

Transcripción ortográfica	Transcripción fonética estrecha
Los metros son históricos, mientras que el ritmo se confunde con el lenguaje mismo. No es difícil distinguir en cada metro los elementos intelectuales y abstractos y los más puramente rítmicos. En las lenguas modernas los metros están compuestos por un determinado número de sílabas, duración cortada por acentos tónicos y pausas. Los acentos y las pausas constituyen la porción más antigua y puramente rítmica del metro; están cerca aún del golpe de tambor, de la ceremonia ritual y del talón danzante que hiere la tierra. El acento es danza y rito. Gracias al acento, el metro se pone en pie y es unidad danzante. La medida silábica implica un principio de abstracción, una retórica y una reflexión sobre el lenguaje. Duración puramente lineal, tiende a convertirse en mecánica pura. Los acentos, las pausas, las aliteraciones, los choques o reuniones inesperadas de un sonido con otro, constituyen la porción concreta y permanente del metro.	[lɔs̬ ˈmet̪ɾoˈs ːon i̞s̪ˈt̪oɾik̠ɔs\| ˈmj̃ẽn̪t̪ɾas k̟ɛ ːl ˈri̞ð̞mo se k̠ɔɱˈfu̞n̪d̪e k̠on el ːeŋˈɡwɑxe ˈmi̞s̬mo‖ no ˈez̪ ð̞iˈfiθi̞l̪ d̪i̞s̪t̪i̞ŋˈɡiɾ eŋ ˈkað̞a ˈmet̪ɾo los eleˈmẽn̪t̪os i̞n̪t̪elɛɣ̞ˈt̪wales j as̪ˈt̪ɾaɣ̞t̪os i lɔs̬ ˈmas ˌpuɾaˈmẽn̪t̪ɛ ˈri̞ð̞mik̠ɔs‖ en las̬ ˈleŋɡwas̬ moˈð̞ɛɾnas̬s‖ lɔs̬ ˈmet̪ɾos es̪ˈt̪aŋ k̠ɔmˈpwes̪t̪ɔs poˈɾ u̞n̪ d̪et̪ɛɾmĩˈnað̞o ˈnũmeɾo ð̞e ˈsilaβ̞as\| d̪uɾaˈθjɔŋ k̠ɔɾˈt̪að̞a poɾ aˈθen̪t̪ɔs̪ ˈt̪onik̠os i ˈpɑu̯sas‖ los aˈθen̪t̪os i las ˈpɑu̯sas k̠ɔⁿs̪t̪iˈt̪uʝ̞en la pɔɾˈθjɔⁿ ˈmas an̪ˈt̪iɣ̞wa i̯ ˌpuɾaˈmẽn̪t̪ɛ ˈri̞ð̞mika ð̞ɛl ˈmet̪ɾo\| es̪ˈt̪an̟ ˈθɛɾkɑ ːˈu̞n̪ d̪ɛl ˈɣ̞ɔlpe ð̞ɛl̪ t̪amˈbɔɾ\| d̪e la θeɾeˈmõnja ri̞ˈt̪wal i ð̞ɛl̪ t̪aˈlɔn̪ d̪an̟ˈθan̪t̪e k̟e ˈʝ̞eɾe la ˈt̪jɛra‖ el aˈθen̪t̪o ˈez̪ ˈð̞an̟θa i̯ ˈri̞t̪o‖ ˈɡɾaθjas al aˈθen̪t̪o\| ɛl ˈmet̪ɾo se ˈponẽe ːm ˈpje ˈʝ̞ es uniˈð̞að̞ ːan̟ˈθan̪t̪e‖ la meˈð̞ið̞a siˈlaβ̞ika i̯mˈplikɑ ˈu̞u̯m pɾi̞n̟ˈθipjo ð̞e as̪t̪ɾaɣ̞ˈθjɔn\| ˈuna rɛˈt̪oɾika ˈʝ̞ una rɛflɛɣ̞ˈsjɔn soβ̞ɾe ːl ːeŋˈɡwɑxe‖ d̪uɾaˈθjɔm ˌpuɾaˈmẽn̪t̪e lineˈɑl\| ˈt̪jen̪d̪e a k̠ɔmbɛɾˈt̪i̞ɾse ːⁿ meˈkanika ˈpuɾa‖ los aˈθen̪t̪ɔs\| las ˈpɑu̯sas\| las alit̪eɾaˈθjones\| lɔs ˈʧok̟es ɔ rɛu̯ˈnj̃õnes inespeˈɾað̞az̪ ð̞e ˈu̞u̯n soˈnið̞o k̠oˈn ot̪ɾo\| k̠ɔⁿs̪t̪iˈt̪uʝ̞en la pɔɾˈθjɔŋ k̠ɔŋˈkɾet̪a i̯ pɛɾmãˈnẽn̪t̪e ð̞ɛl ˈmet̪ɾo]
Es posible que si Galileo hubiese concretado su modelo heliocentrista tras un éxtasis místico, la Iglesia hubiese acabado por aceptarlo sin usar la Inquisición como medio disuasorio para obligarle a reconocer su error. Pero lo hizo con una máquina diabólica: el telescopio; y con un don derivado de un pacto con el diablo: la observación, ampliada, eso sí, por el efecto de las lentes y la experimentación, merced a la cual el mundo pierde la escala humana y se acerca a la divinidad.	[ˈes poˈsiβ̞le k̟e si ɣ̞aliˈleo u̯ˈβ̞jese k̠ɔŋkɾeˈt̪að̞o su moˈð̞elo ˌeljoθen̪ˈt̪ɾi̞s̪t̪a t̪ɾaˈs uˈn eɣ̞s̪t̪asi̞s̬ ˈmi̞s̪t̪ik̠o\| la i̯ˈɣ̞lesjɑa u̯ˈβ̞jese akaˈβ̞að̞o poɾ aθeβ̞ˈt̪aɾlo sin uˈsaɾ la i̯ŋk̟isiˈθjɔŋ ˈk̠omõ ˈmeð̞jo ð̞iswaˈsoɾjo ˈpaɾɑa oβ̞liˈɣ̞aɾle a rɛk̠onoˈθɛɾ sw ɛˈrɔɾ‖ ˈpeɾo lo ˈiθo k̠oˈn ũnã ˈmak̟ina ð̞jaˈβ̞olika\| ɛl̪ t̪elesˈk̠opjo\| i k̠oˈn ũ̞n̪ ˈd̪ɔn̪ d̪eɾiˈβ̞að̞o ð̞e ˈu̞u̯m ˈpaɣ̞t̪o k̠on ɛl̪ ˈd̪jaβ̞lo\| lɑa ɔoβ̞sɛɾβ̞aˈθjɔon\| aãmˈpljað̞a\| ˈeso ˈsi\| poɾ el eˈfɛɣ̞t̪o ð̞e las̬ ˈlen̪t̪es i la espeɾimẽn̪t̪aˈθjɔn\| mɛɾˈθeð̞ a la ˈk̠wal ɛl ˈmũ̞n̪d̪o ˈpjɛɾð̞e la esˈkalɑ u̯ˈmãna i̯ se aˈθɛɾ ka ː la ð̞iβ̞iniˈð̞að̞]
Señorita: esta misma mañana, bajo la dulce llovizna del cielo, cruzó usted, aparición fortuita, por delante de la puerta de la casa donde aún vivo y ya no tengo hogar. Cuando desperté, fui a la puerta de la suya, donde ignoro si tiene usted hogar o no le tiene. Me habían llevado allí sus ojos, sus ojos, que son refulgentes estrellas mellizas en la nebulosa de mi mundo. Perdóneme, Eugenia, y deje que le dé familiarmente este dulce nombre; perdóneme la lírica. Yo vivo en perpetua lírica infinitesimal.	[seɲoˈɾit̪a\| ˈes̪t̪a ˈmi̞s̬mã mãˈɲãna\| ˈbɑχo la ˈð̞u̞l̟θe ʎoˈβ̞i̞θ̬na ð̞ɛl̟ ˈθjelo\| kɾuˈθo u̯s̪ˈt̪eð̞\| apaɾiˈθjɔɱ fɔɾˈt̪wit̪a\| pɔɾ ð̞eˈlan̪t̪e ð̞e la ˈpwɛɾt̪a ð̞e la ˈkasa ˈð̞ɔn̪d̪e ɑˈu̞m ˈbiβ̞ɔ i̯ ˈʝ̞a no ˈt̪eŋɡo ːˈɣ̞aɾ‖ ˈk̠wan̪d̪o ð̞espɛɾˈt̪e\| ˈfwi a la ˈpwɛɾt̪a ð̞e la ˈsuʝ̞a\| d̪ɔn̪d̪ɛ i̯ɣ̞ˈnoɾo si ˈt̪jene u̯s̪ˈt̪eð̞ oˈɣ̞aɾ o no le ˈt̪jene‖ me aˈβ̞ian̠ ʎeˈβ̞að̞o aˈʎi suˈsː ɔχɔs\| suˈsː ɔχɔs\| k̟e ˈsɔn rɛfu̞lˈxen̪t̪es es̪ˈt̪ɾeʎas̬ meˈʎiθas en la neβ̞uˈlosa ð̞e mĩ ˈmũ̞n̪d̪o‖ pɛɾˈð̞onẽme\| eu̯ˈxenja\| i ˈð̞ɛxe k̟e le ˈð̞e famiˌljaɾˈmẽn̪ˈt̪e ː ˈes̪t̪e ˈð̞u̞l̟θe ˈnɔ̃mbɾe\| pɛɾˈð̞onẽme la ˈliɾika‖ ˈɟ͡ʝ̞o ˈβ̞iβ̞o em pɛɾˈpet̪wa ˈliɾika i̯ɱfinit̪esiˈmɑl]
Los amores de la Guindilla y Quino, el Manco, tardaron en conocerse en el pueblo. Además, progresaron con una lentitud crispante. Era un paso definitivo, a la postre. Quino, el Manco, ya había pensado en ella, en la Guindilla, antes del incidente con los mozos. La Guindilla no era joven y él tampoco. Por otro lado, la Guindilla era enjuta y delgada y poseía un negocio en marcha; y un evidente talento comercial. Precisamente de lo que él carecía. Últimamente, Quino estaba asfixiado por las hipotecas. Bien mirado, propiedad de él, lo que se dice de él, no restaba ni un hierbajo del huerto.	[los aˈmoɾez̪ ð̞e la ɣ̞i̞n̪ˈd̪iʎa i̯ ˈk̟i no\| ɛl ˈmãŋk̠o\| t̪aɾˈð̞aɾon ẽŋ k̠onoˈθɛɾse ːn ɛl ˈpweβ̞lo‖ að̞eˈmas\| pɾoɣ̞ɾeˈsaɾɔŋ k̠oˈn ũna len̪t̪iˈt̪u̞ð̞ kɾi̞sˈpan̪t̪e‖ ˈeɾɑ ˈu̞u̯m ˈpaso ð̞efiniˈt̪iβ̞o\| a la ˈpɔs̪t̪ɾe‖ ˈk̟ino\| ɛl ˈmãŋk̠o\|ˈɟ͡ʝ̞ʝ̞a ːˈβ̞ia penˈsað̞o eˈn eʎa\| en la ɣ̞i̞n̪ˈd̪iʎa\| ˈan̪t̪ez̪ ð̞el i̞n̟θiˈð̞en̪t̪e k̠ɔn lɔs̬ ˈmoθɔs‖ la ɣ̞i̞n̪ˈd̪iʎa no ˈeɾɑ ˈχo β̞eˈn jɟ͡ʝ̞ɛl̪ t̪amˈpok̠o‖ poˈɾ ot̪ɾo ˈlað̞o\| la ɣ̞i̞n̪ˈd̪iʎa ˈeɾa eɴˈχut̪a i̯ ð̞ɛlˈɣ̞að̞a i̯ poseˈiɑa ˈuu̯n ːeˈɣ̞oθjo eⁿ ˈmaɾʧa\|ˈɟ͡ʝ̞ʝ̞ un eβ̞iˈð̞en̪t̪e t̪aˈlen̪t̪o k̠omɛɾˈθjɑl‖ pɾeˌθisaˈmẽn̪t̪e ð̞e lo ˈk̟ɛe ːˈɛl kaɾeˈθia‖ ˌu̞l̪t̪imãˈmẽn̪t̪e\| ˈk̟ino es̪ˈt̪aβ̞a ːsfi̞ɣ̞ˈsjað̞o pɔɾ las ipoˈt̪ekas‖ ˈbjeⁿ miˈɾað̞o\| pɾopjeˈð̞aˈð̞ ːɛe ːˈɛl\| lo k̟e se ˈð̞iθe ˈð̞ɛe ːˈɛl\| nɔ rɛs̪ˈt̪aβ̞a ˈnj̃ ũ̞ũn̠ ɟ͡ʝ̞ɛɾˈβ̞ɑχo ð̞ɛl ˈɣ̞wɛɾt̪o]
Julio vivía con unas tías viejas; su padre, empleado en una capital de provincia, era de una posición bastante modesta. Julio se mostraba muy independiente; podía haber buscado la protección de su primo Enrique Aracil, que por entonces acababa de obtener una plaza de médico en el hospital, por oposición, y que podía ayudarle; pero Julio no quería protección alguna, no iba ni a ver a su primo; pretendía debérselo todo a sí mismo. Dada su tendencia práctica, era un poco paradójica esta resistencia suya a ser protegido. Julio, muy hábil, no estudiaba casi nada, pero aprobaba siempre. Buscaba amigos menos inteligentes que él para explotarles; allí donde veía una superioridad cualquiera, fuese en el orden que fuese, se retiraba. Llegó a confesar a Hurtado que le molestaba pasear con gente de más estatura que él. Julio aprendía con gran facilidad todos los juegos. Sus padres, haciendo un sacrificio, podían pagarle los libros, la matrícula y la ropa. La tía de Julio solía darle, para que fuera alguna vez al teatro, un duro todos los meses, y Aracil se las arreglaba jugando a las cartas con sus amigos, de tal manera, que, después de ir al café y al teatro y comprar cigarrillos, al cabo del mes, no solo le quedaba el duro de su tía, sino que tenía dos o tres más.	[ˈχuljo β̞iˈβ̞ia k̠oˈn ũnas̪ ˈt̪ias̬ ˈβ̞jɛxas\| su ˈpað̞ɾe\| empleˈað̞o eˈn ũna kapiˈt̪ɑl̪ d̪e pɾoˈβ̞i̞n̟θja\| ˈeɾa ð̞e ˈuu̯na posiˈθjɔm bas̪ˈt̪an̪t̪e moˈð̞es̪t̪a‖ ˈχuljo se mɔs̪ˈt̪ɾaβ̞a mw̃wĩ̞i ːn̪d̪epen̪ˈd̪jen̪t̪e\| poˈð̞ia ːˈβ̞bɛɾ β̞u̞sˈkað̞o la pɾot̪ɛeɣ̞ˈθjɔn̪ d̪e su ˈpɾimo enˈri̞k̟e aɾaˈθi̞l\| k̟e poɾ en̪t̪ɔn̟θes akaˈβ̞aβ̞a ð̞e ɔoβ̞t̪eˈneˈɾ una ˈplaθa ð̞e ˈmeð̞ik̠o en el ɔspiˈt̪ɑl\| poɾ oposiˈθjɔon\| i k̟e poˈð̞ia ːʝ̞uˈð̞aɾle\| ˈpeɾɔ ˈχuljo no k̟eˈɾia pɾot̪ɛɣ̞ˈθjon ɑlˈɣ̞una\| no ˈi β̞a nj a ˈβ̞eɾ a su ˈpɾimo\| pɾet̪en̪ˈd̪ia ð̞eˈβ̞ɛɾselo ˈt̪oð̞o a ˈsi ˈmi̞s̬mo‖ ˈd̪að̞a su t̪en̪ˈd̪en̟θja ˈpɾaɣ̞t̪ika\| ˈeɾɑ ˈu̞u̯m ˈpok̠o paɾaˈð̞ɔxika ˈes̪t̪a rɛsi̞s̪ˈt̪en̟θja ˈsuʝ̞a ː ˈsɛɾ pɾot̪ɛeˈxið̞o‖ ˈχuljo\|muˈʝ̞ aβ̞i̞l\| no es̪t̪uˈð̞jaβ̞a ˈkasi ˈnað̞a\| ˈpeɾo a pɾoˈβ̞aβ̞a ˈsjem pɾe‖ bu̞sˈkaβ̞a ːˈmiɣ̞ɔs̬ ˈmẽnos i̞n̪t̪eli̞ˈxen̪t̪es ˈk̟ɛe ːˈɛl paɾa esploˈt̪aɾles\| aˈʎi ð̞ɔn̪d̪e β̞veˈiɑ ˈuu̯na supeɾjoɾiˈð̞að̞ k̠wɑlˈk̟jeɾa\| ˈfwese ːn eˈl ɔɾð̞eŋ k̟e ˈfwese\| sɛ rɛt̪iˈɾaβ̞a‖ ʎeˈɣ̞o a k̠ɔɱfeˈsaɾ ɑ u̯ɾˈt̪að̞o k̟e le moles̪ˈt̪aβ̞a paseˈaɾ k̠ɔŋ ˈxen̪t̪e ð̞e ˈmas es̪t̪aˈt̪uɾa ˈk̟ɛe ːˈɛl‖ ˈχuljo apɾen̪ˈd̪ia k̠ɔŋ ˈɡɾaɱ faθiliˈð̞að̞ ˈt̪oð̞ɔs̬ lɔs ˈχweɣ̞ɔs‖ su̞s ˈpað̞ɾes\| aˈθjen̪d̪o ˈu̞u̯n sakɾiˈfiθjo\| poˈð̞iam paˈɣ̞aɾle lɔs̬ ˈliβ̞ɾɔs\| la maˈt̪ɾik̠ula i̯ la ˈrɔpa‖ la ˈt̪ia ð̞ɛe ˈχuljo soˈlia ˈð̞aɾle\| ˈpaɾa k̟e ˈfweɾɑ ːlˈɣ̞una ˈβ̞eθ ɑl̪ t̪eˈat̪ɾo\| ˈu̞n̪ ˈd̪uɾo ˈt̪oð̞ɔs̬ lɔs̬ ˈmeses\| ɟ͡ʝ̞ aɾaˈθi̞l se las arɛˈɣ̞laβ̞ɑ χuˈɣ̞an̪d̪o a las ˈkaɾt̪as k̠ɔn sus aˈmiɣ̞ɔs z̪\| d̪ ð̞e ˈt̪ɑl mãˈneɾa\| k̟e\| d̪esˈpwez̪ ð̞e ˈiɾ ɑl kaˈfe ʝ̞ ɑl̪ t̪eˈat̪ɾɔ i̯ k̠ɔmˈpɾaɾ θiɣ̞aˈri̞ʎɔos\| ɑl ˈkaβ̞o ð̞ɛl ˈmes\| no ˈsolo le k̟eˈð̞aβ̞a ɛl̪ ˈd̪uɾo ð̞e su ˈt̪ia\| ˈsino k̟e t̪eˈnia ˈð̞os o ˈt̪ɾes̬ ˈmas]
Vetusta, la muy noble y leal ciudad, corte en lejano siglo, hacía la digestión del cocido y de la olla podrida, y descansaba oyendo entre sueños el monótono y familiar zumbido de la campana de coro, que retumbaba allá en lo alto de la esbelta torre en la Santa Basílica. La torre de la catedral, poema romántico de piedra, delicado himno, de dulces líneas de belleza muda y perenne, era obra del siglo dieciséis, aunque antes comenzada, de estilo gótico, pero, cabe decir, moderado por un instinto de prudencia y armonía que modificaba las vulgares exageraciones de esta arquitectura. La vista no se fatigaba contemplando horas y horas aquel índice de piedra que señalaba al cielo; no era una de esas torres cuya aguja se quiebra de sutil, más flacas que esbeltas, amaneradas como señoritas cursis que aprietan demasiado el corsé; era maciza sin perder nada de su espiritual grandeza, y hasta sus segundos corredores, elegante balaustrada, subía como fuerte castillo, lanzándose desde allí en pirámide de ángulo gracioso, inimitable en sus medidas y proporciones. Como haz de músculos y nervios, la piedra, enroscándose en la piedra, trepaba a la altura, haciendo equilibrios de acróbata en el aire; y como prodigio de juegos malabares, en una punta de caliza se mantenía, cual imantada, una bola grande de bronce dorado, y encima otra más pequeña, y sobre esta una cruz de hierro que acababa en pararrayos.	[beˈt̪u̞s̪t̪a\| la mw̃wĩi ˈnoβ̞lɛ i̯ leˈɑl̟ θjuˈð̞að̞\| ˈk̠ɔɾt̪e ːn lɛˈxano ˈsiɣ̞lo\| aˈθia la ð̞i̞xes̪ˈt̪jɔn̪ d̪ɛl k̠oˈθið̞ɔ i̯ ð̞e lɑa ˈoʎa poˈð̞ɾið̞a\| i ð̞eskanˈsaβ̞ɑ oˈʝ̞en̪d̪o ˈen̪t̪ɾe ˈsweɲos ɛl mõˈnot̪onɔo i̯ famiˈljaɾ θu̞mˈbið̞o ð̞e la kamˈpana ð̞e ˈk̠oɾo\| k̟ɛ rɛet̪u̞mˈbaβ̞a ːˈʎa en lo ˈɑl̪t̪o ð̞e la es̬ˈβ̞ɛl̪t̪a ˈt̪ɔrɛe ːn la ˈsan̪t̪a β̞aˈsilika‖ la ˈt̪ɔrɛ ð̞e la kat̪eˈð̞ɾɑl\| poˈema rɔˈmãn̪t̪ik̠o ð̞e ˈpjeð̞ɾa\| d̪eliˈkað̞o ˈi̞nmːno \|d̪ð̞e ˈð̞u̞l̟θes̬ ˈlineaz̪ ð̞e β̞eˈʎeθa ˈmuð̞a i̯ peˈɾenːe\| ˈeɾɑ ˈoβ̞ɾa ð̞ɛl ˈsiɣ̞lo ð̞jeθiˈsɛi̯s\| ɑu̯ŋk̟e ˈan̪t̪es k̠omẽn̟ˈθað̞a\| d̪e ːs̪ˈt̪ilo ˈɣ̞ot̪ik̠o\| peɾo\| ˈkaβ̞e ð̞eˈθi̞ɾ\| moð̞eˈɾað̞o poˈɾ un ĩ̞i̞ⁿs̪ˈt̪i̞n̪t̪o ð̞e pɾuˈð̞en̟θja ʝ̞ aɾmõˈnia k̟e moð̞ifiˈkaβ̞a las̬ β̞u̞lˈɣ̞aɾes ɛɣ̞sɑaxeɾaˈθjonez̪ ˈð̞e ːs̪t̪a ːɾk̟it̪ɛɣ̞ˈt̪uɾa‖ la ˈβ̞i̞s̪t̪a no se fat̪iˈɣ̞aβ̞a k̠ɔn̪t̪emˈplan̪ˈd̪o ːˈoɾaˈs j oɾas aˈk̟eˈl i̞n̪d̪iθe ð̞e ˈpjeð̞ɾa k̟e seɲaˈlaβ̞ɑ ːl̟ ˈθjelo\| no ˈeɾɑ ˈuu̯na ˈð̞e ːsas̪ ˈt̪ɔrɛs ˈk̠uʝ̞a ːˈɣ̞u̞xa se ˈk̟jeβ̞ɾa ð̞e suˈt̪i̞l\| ˈmas ˈflakas k̟eːs̬ˈβ̞ɛl̪t̪as\| amãneˈɾað̞as k̠omo seɲoˈɾit̪as ˈk̠u̞ɾsi̞s k̟e aˈpɾjet̪an̪ d̪emaˈsjað̞o ɛl k̠ɔɾˈse\| ˈeɾa maˈθiθa si̞m pɛɾˈð̞ɛɾ ˈnað̞a ð̞e sw espiɾiˈt̪wɑl ɣ̞ɾan̪ˈd̪eθa\| ɟ͡ʝ̞ as̪t̪a sus ːeˈɣ̞u̞n̪d̪ɔs k̠ɔrɛˈð̞oɾes\| eleˈɣ̞an̪t̪e β̞alɑu̯s̪ˈt̪ɾað̞a\| suˈβ̞ia ˈk̠omo ˈfwɛɾt̪e kas̪ˈt̪iʎo\| lan̟ˈθan̪d̪ose ˈð̞ez̪ð̞e aˈʎi em piˈɾamið̞e ð̞e ˈaŋɡulo ɣ̞ɾaˈθjoso\| inĩmiˈt̪aβ̞le ːn su̞s̬ meˈð̞ið̞as i pɾopɔɾˈθjones‖ ˈk̠omo ˈaθ̬ ð̞e ˈmu̞sk̠ulos i ˈnɛɾβ̞jɔs\| la ˈpjeð̞ɾa\| enrɔsˈkan̪d̪ose ːn la ˈpjeð̞ɾa\| t̪ɾeˈpaβ̞a ː lɑ ːl̪ˈt̪uɾa\| aˈθjen̪d̪o ek̟iˈliβ̞ɾjɔz̪ ð̞e aˈkɾoβ̞at̪a en eˈl ai̯ ɾe\| i ˈk̠omo pɾoˈð̞i̞xjo ð̞ɛ ˈχweɣ̞ɔs̬ malaˈβ̞aɾes\| eˈn ũna ˈpu̞n̪t̪a ð̞e kaˈliθa se mãn̪t̪eˈnia\|ˈk̠wal imãn̪ˈt̪að̞a\| ˈuna ˈβ̞ola ˈɣ̞ɾan̪d̪e ð̞e ˈβ̞ɾɔn̟θe ð̞oˈɾað̞o\|ɟ͡ʝ̞ʝ̞ en̟ ˈθimɑa ˈot̪ɾa ˈmas peˈk̟eɲa\| i ˈsoˈβ̞ɾe ːˈes̪t̪ɑ ˈuna ˈkɾu̞θ̬θ ð̞e ˈʝ̞ɛrɔ k̟e akaˈβ̞aβ̞a em paɾaˈraʝ̞ɔs]
Se me encogió el corazón cuando vi a ese muchacho sentado en el borde del sofá con los paquetes envueltos en papel de regalo, su pelo recién cortado, sin saber dónde meter ese amor que anduvo juntando todos estos años para Irene; buen mozo me pareció, alto y elegante como un príncipe, bien vestido como siempre anda él, tieso como un palo de escoba, un verdadero caballero, pero de poco le vale su pinta de galán, porque la niña no se fija en esas cosas y menos ahora que anda enamorada del fotógrafo; camarón que se duerme se lo lleva la corriente, no debió irse Gustavo dejándola sola por tantos meses. Yo no entiendo a estas parejas modernas, en mis tiempos no había tanta libertad y todo funcionaba como es debido: la mujer callada en su casa. Las novias esperaban bordando sábanas y no andaban encaramadas al anca de las motocicletas de otros hombres; eso debió prevenirlo el Capitán en vez de partir de viaje tan tranquilo, yo lo vi desde el principio y se lo dije: ausencias causan olvidos; pero nadie me hizo caso, me miraron con lástima, como si yo fuera una estúpida, pero no tengo ni un pelo de tonta, más sabe el diablo por viejo que por diablo.	[se mẽe ːŋk̠kɔˈxjo ɛl k̠koɾaˈθɔŋ k̠wan̪d̪o ˈβ̞i a ˈese muˈʧaʧo sen̪ˈt̪að̞o en ɛl ˈβ̞ɔɾð̞e ð̞ɛl soˈfa k̠ɔn lɔs paˈk̟et̪es emˈbwɛl̪t̪os emn paˈpɛl̪ d̪ɛ rɛˈɣ̞alo\|su ˈpelɔ rɛˈθjeŋ k̠ɔɾˈt̪að̞o\| si̞n saˈβ̞ɛɾ ˈð̞ɔn̪d̪e meˈt̪eˈɾ ese aˈmɔɾ k̟e an̪ˈd̪uβ̞ɔ χu̞n̪ˈt̪an̪d̪o ˈt̪oð̞oˈs es̪t̪oˈs aɲɔs paɾa i̯ˈɾene\| ˈbweⁿ ˈmoθo me paɾeˈθjo\| ˈɑl̪t̪o ʝ̞ eleˈɣ̞an̪t̪e ˈk̠omo ˈu̞u̯m ˈpɾi̞n̟θi pe\| ˈbjem bes̪ˈt̪ið̞o ˈk̠omo ˈsjempɾe ˈan̪d̪a ˈɛl\| ˈt̪jeso ˈk̠omo ˈu̞u̯m ˈpalo ð̞e ːsˈk̠oβ̞a\| ˈu̞m bɛɾð̞aˈð̞eɾo kaβ̞aˈʎe ɾo\| ˈpeɾo ð̞e ˈpok̠o le ˈβ̞ale su ˈpi̞n̪t̪a ð̞e ɣ̞aˈlanm\| pɔɾk̟e la ˈnĩɲã no se ˈfi̞xa eˈn esas ˈk̠osas i ˈmẽnos ɑˈɔɾa k̟e ˈan̪d̪a enãmoˈɾað̞a ð̞ɛl foˈt̪oɣ̞ɾafo\| kamaˈɾɔŋ k̟e se ˈð̞wɛɾme se lo ˈʎeβ̞a la k̠ɔˈrjen̪t̪e\| no ð̞eˈβ̞jo ˈi̞ɾse ɣ̞u̞s̪ˈt̪aβ̞o ð̞ɛˈxan̪d̪ola ˈsola pɔɾ ˈt̪an̪t̪ɔs̬ ˈmeses‖ ˈɟ͡ʝ̞o no en̪ˈt̪jen̪d̪o a ˈes̪t̪as paˈɾɛxas̬ moˈð̞ɛɾnas\| eⁿ mi̞s̪ ˈt̪jempɔs̬ no aˈβ̞ia ˈt̪an̪t̪a liβ̞ɛɾˈt̪að̞ i ˈt̪oð̞o fu̞n̟θjoˈnaβ̞a k̠omo ˈez̪ ð̞eˈβ̞ið̞o\|‖ la mu̞ˈxɛɾ kaˈʎað̞a en su ˈkasa‖ las̬ ˈnoβ̞jas espeˈɾaβ̞am bɔɾˈð̞an̪d̪o ˈsaβ̞anas i no an̪ˈd̪aβ̞an ẽeŋkaɾaˈmað̞as aˈl aŋka ð̞e las̬ mot̪oθiˈklet̪az̪ ð̞e ˈot̪ɾoˈs ɔmbɾes\| ˈeso ð̞eˈβ̞jo pɾeβ̞eˈni̞ɾlo ɛl kapiˈt̪an ẽm ˈbeθ̬ ð̞e paɾˈt̪i̞ɾ ð̞e ˈβ̞jɑxe t̪an̪ t̪ɾaŋˈk̟ilo\| ˈɟ͡ʝ̞o lo ˈβ̞i ð̞ez̪s̬ð̞ɛ ːl pɾi̞n̟ˈθipjɔo i̯ se lo ˈð̞i̞xe\| ɑu̯ˈsen̟θjas ˈkɑu̯san ɔlˈβ̞ið̞ɔs\| ˈpeɾo ˈnað̞je me ˈiθo ˈkaso\| mẽ miˈɾaɾɔŋ k̠ɔn ˈlas̪t̪ima\| k̠omo si ˈʝ̞o ˈfweɾɑ ˈuu̯na es̪ˈt̪upið̞a\| ˈpeɾo no ˈt̪eŋɡo ˈnj̃j ũ̞u̞m ˈpelo ð̞e ˈt̪ɔn̪t̪a\| ˈmaˈs ːaβ̞ɛ ːl̪ ˈd̪jaβ̞lo pɔɾ ˈβ̞jɛχo k̟e pɔɾ ˈð̞jaβ̞lo]
Todo calla; todo reposa. Pasa de tarde en tarde, cruzando el ancho ámbito, con esa indolencia privativa de los perros de pueblo, un alto mastín que se detiene un momento, sin saber por qué, y luego se pierde a lo lejos por una empinada calleja; una bandada de gorriones se abate rápida sobre el suelo, picotea, salta, brinca, se levanta veloz y se aleja piando, moviendo voluptuosamente las alas sobre el azul límpido. A lo lejos, como una nota metálica, incisiva, que rasga de pronto la diafanidad del ambiente, vibra el cacareo sostenido de un gallo.	[ˈt̪oð̞o ˈkaʎa\| ˈt̪oð̞ɔ rɛˈposa‖ ˈpasa ð̞e ˈt̪aɾð̞e ːn̪ ˈt̪aɾð̞e\|kɾuˈθan̪d̪o eˈl an̠ʧo ˈambit̪o\| k̠oˈn esa i̯n̪d̪oˈlen̟θja pɾiβ̞aˈt̪iβ̞a ð̞e lɔs ˈpɛrɔz̪ ð̞e ˈpweβ̞lo\| ˈuˈn ɑl̪t̪o mas̪ˈt̪i̞ŋ k̟e se ð̞eˈt̪jene ˈu̞ⁿ mõˈmẽn̪t̪o\| si̞n saˈβ̞ɛɾ pɔɾ ˈk̟e\| i ˈlweɣ̞o se ˈpjɛɾð̞e a lo ˈlɛχɔs poˈɾ una empiˈnað̞a kaˈʎɛxa\| ˈuna β̞an̪ˈd̪að̞a ð̞e ɣ̞ɔˈrjones ːe aˈβ̞at̪ɛ ˈrapið̞a ˈsoβ̞ɾɛ ːl ˈswelo\| pik̠oˈt̪ea\| ˈsɑl̪t̪a\| ˈbɾi̞ŋka\|se leˈβ̞an̪t̪a β̞eˈloθ i se aˈlɛxa ˈpjan̪d̪o\| moˈβ̞jen̪d̪o β̞olu̞β̞ˌt̪wosaˈmẽn̪t̪e laˈs alas ːoβ̞ɾe ːl aˈθuˈl ːi̞mpið̞o‖a lo ˈlɛχɔs\|ˈk̠omo ˈuu̯nã ˈnot̪a meˈt̪alika\| i̞n̟θiˈsiβ̞a\| k̟ɛ ˈras̬ɣ̞a ð̞e ˈpɾɔn̪t̪o la ð̞jafaniˈð̞að̞ð̞ ːð̞el amˈbjen̪t̪e\| ˈbiβ̞ɾa ɛl kakaˈɾeo sɔs̪t̪eˈnið̞o ð̞e ˈu̞u̯ŋ ˈɡaʎo]
La cumbre. Ahí está el ocaso, todo empurpurado, herido por sus propios cristales, que le hacen sangre por doquiera. A su esplendor, el pinar verde se agria, vagamente enrojecido; y las hierbas y las florecillas, encendidas y transparentes, embalsaman el instante sereno de una esencia mojada, penetrante y luminosa. Yo me quedo extasiado en el crepúsculo. Platero, granas de ocaso sus ojos negros, se va, manso, a un charquero de aguas de carmín, de rosa, de violeta; hunde suavemente su boca en los espejos, que parece que se hacen líquidos al tocarlos él; y hay por su enorme garganta como un pasar profundo de umbrías aguas de sangre. El paraje es conocido, pero el momento lo trastorna y lo hace extraño, ruinoso y monumental. Se dijera, a cada instante, que vamos a descubrir un palacio abandonado... La tarde se prolonga más allá de sí misma, y la hora, contagiada de eternidad, es infinita, pacífica, insondeable...	[la ˈk̠u̞mbɾe‖ aˈi es̪ˈt̪a el oˈkaso\| ˈt̪oð̞o empu̞ɾpuˈɾað̞o\| eˈɾið̞o pɔɾ su̞s ˈpɾopjɔs kɾi̞s̪ˈt̪ales\| k̟e le ˈaθen ˈsaŋɡɾe pɔɾ ð̞oˈk̟jeɾa‖ a sw esplen̪ˈd̪ɔɾ\| ɛl piˈnaɾ ˈβ̞ɛɾð̞e se ˈaɣ̞ɾja\| ˌbaɣ̞aˈmẽn̪t̪e ːnrɔxeˈθið̞o\| i las̬ ˈʝ̞ɛɾβ̞as i las floɾeˈθiʎas\| en̟θen̪ˈd̪ið̞as i t̪ɾaⁿspaˈɾen̪t̪es\| embɑlˈsamãn el i̞ⁿs̪ˈt̪an̪t̪e seˈɾeno ð̞e ˈuu̯na eˈsen̟θja mɔˈxað̞a\| peneˈt̪ɾan̪t̪ɛ i̯ lumĩiˈnosa‖ ˈɟ͡ʝ̞o me ˈk̟eð̞o es̪t̪aˈsjað̞o en ɛl kɾeˈpu̞sk̠ulo‖ plaˈt̪eɾo\| ˈɡɾanaz̪ ð̞e oˈkaso suˈs ɔχɔs̬ ˈneɣ̞ɾɔs\| se ˈβ̞a\| ˈmãnso\| ɑ ˈu̞u̯n̠ ʧaɾˈk̟eɾo ð̞e ˈaɣ̞waz̪ ð̞e kaɾˈmĩ̞n\| d̪ð̞ɛ ˈrɔsa\| d̪e β̞joˈlet̪a\| ˈu̞n̪d̪e ˌswaβ̞eˈmẽn̪t̪e su ˈβ̞oka en los esˈpɛχɔs\| k̟e paˈɾeθe k̟e se ˈaθen ˈlik̟ið̞os ɑl̪ t̪oˈkaɾloˈs ɛl\|‖ ˈɟ͡ʝ̞ ai̯ pɔɾ sw eˈnɔɾme ɣ̞aɾˈɣ̞an̪t̪a ˈk̠omo ˈu̞u̯m paˈsaɾ pɾoˈfu̞n̪d̪o ð̞e u̯mˈbɾiaˈs aɣ̞waz̪ ð̞e ˈsaŋɡɾe‖ ɛl paˈɾɑˈxe ːs k̠onoˈθið̞o\| ˈpeɾo ɛl mõˈmẽn̪t̪o lo t̪ɾas̪ˈt̪ɔɾna i̯ lo ˈaθe ːs̪ˈt̪ɾaɲo\| rwiˈnosɔ i̯ mõnũmẽn̪ˈt̪ɑl‖ se ð̞i̞ˈxeɾa\| a ˈkað̞a i̯ⁿs̪ˈt̪an̪t̪e\| k̟e ˈβ̞amos a ð̞esk̠uˈβ̞ɾiˈɾ u̞um paˈlaθjo aβ̞an̪d̪oˈnað̞o‖ la ˈt̪aɾð̞e se pɾoˈlɔŋɡa ˈmas aˈʎa ð̞e ˈsi ˈmi̞s̬ma\| i lɑ ˈɔɾa\| k̠ɔn̪t̪ɑˈxjað̞a ð̞e ːt̪ɛɾniˈð̞að̞\| ˈes i̞ɱfiˈnit̪a\| paˈθifika\| i̞nsɔn̪d̪eˈaβ̞le]
La lingüística estudia el lenguaje humano. El lenguaje se manifiesta solo en los seres humanos a través de las lenguas que les permiten hablar entre sí y consigo mismos. Hemos dicho que se manifiesta solo en los seres humanos, pues cualquier otra cosa que reciba la denominación de lenguaje lo será solo metafóricamente; es decir, por similitud al lenguaje humano. Los mismos seres humanos hablan entre sí; esto es, se comunican intercambiando mensajes con los demás seres humanos de su entorno; pero también hablan consigo mismos, aunque no se profieran palabras: el lenguaje es también la base del pensamiento humano; no es posible conectar dos ideas, ni tan siquiera estructurar una sola sin la ayuda del lenguaje. De ahí que sea el centro de nuestra vida intelectual y social. Por esto mismo, las lenguas, manifestaciones concretas del lenguaje humano, juegan un papel fundamental en la cultura de cualquier pueblo.	[la li̞ŋˈɡwi̞s̪t̪ika es̪ˈt̪uð̞ja el ːeŋˈɡwɑxe u̯ˈmãno‖ el ːeŋˈɡwɑxe se mãniˈfjes̪t̪a ˈsolo en loˈs ːeɾes uˈmãnos a t̪ɾaˈβ̞ez̪ ð̞e las̬ ˈleŋɡwas k̟e les pɛɾˈmit̪en aˈβ̞laɾ en̪t̪ɾe ˈsi ː\|i k̠ɔnˈsiɣ̞o ˈmi̞s̬mɔs‖ ˈemɔz̪ ˈð̞iʧo k̟e se mãniˈfjes̪t̪a ˈsolo en loˈs ːeɾes uˈmãnɔs\| pwes k̠wɑlˈk̟jeˈɾ ot̪ɾa ˈk̠osa k̟ɛ rɛˈθiβ̞a la ð̞enõmĩnaˈθjɔn̪ d̪e leŋˈɡwɑxe lo seˈɾa ˈsolo met̪aˌfoɾikaˈmẽn̪t̪e\| ˈez̪ ð̞eˈθi̞ɾ\| pɔɾ similiˈt̪uu̞ð̞ al ːeŋˈɡwɑxe u̯ˈmãno‖ lɔs̬ ˈmi̞s̬moˈs ːeɾes uˈmãnoˈs aβ̞laˈn ẽn̪t̪ɾe ˈsi\| ˈes̪t̪o ˈes\| se k̠omũˈnikan ĩ̞i̞n̪t̪ɛɾkamˈbjan̪d̪o mẽnˈsɑxes k̠ɔn lɔz̪ ð̞eˈmaˈs ːeɾes uˈmãnɔz̪ ð̞e ˈsw en̪ˈt̪ɔɾno\|‖ˈpeɾo t̪amˈbjeˈn aβ̞laŋ k̠ɔnˈsiɣ̞o ˈmi̞s̬mɔs\| ˈɑu̯ŋk̟e no se pɾoˈfjeɾam paˈlaβ̞ɾas\|‖ el ːeŋˈɡwɑˈxe ːs̪ t̪amˈbjen la ˈβ̞ase ð̞ɛl pensaˈmj̃ẽn̪t̪o u̯ˈmãno\| no ˈes poˈsiβ̞le k̠onɛɣ̞ˈt̪aɾ ˈð̞os iˈð̞eas\| ni t̪an siˈk̟jeɾa es̪t̪ɾu̞ɣ̞t̪uˈɾaˈɾ una ˈsola si̞n la ːˈʝ̞uð̞a ð̞el ːeŋˈɡwɑxe‖ d̪e aˈi k̟e ˈsea ɛl̟ ˈθen̪t̪ɾo ð̞e ˈnwes̪t̪ɾa ˈβ̞ið̞a i̯n̪t̪elɛɣ̞ˈt̪wal i soˈθjɑl‖ poˈɾ es̪t̪o ˈmi̞s̬mo\| las̬ ˈleŋɡwas\| mãnifes̪t̪aˈθjones k̠ɔŋˈkɾet̪az̪ ð̞el ːeŋˈɡwɑxe u̯ˈmãno\| ˈχweɣ̞aˈn ũ̞ũm paˈpɛl fu̞n̪d̪amẽn̪ˈt̪al en la k̠u̞l̪ˈt̪uɾa ð̞e k̠wɑlˈk̟jɛɾ ˈpweβ̞lo]
El hombre viene subiendo por el medio del camino, silbando entre dientes una canción y tirando sin demasiadas ganas de la caballería. Trae un viejo tabardo de piel vuelta, descolorido ya por los años y la lluvia, y un sombrero hongo de fieltro hundido hasta los ojos. Quizá por eso no nos ve hasta que está ya prácticamente encima de nosotros. Aún no son las ocho todavía de un día que ha amanecido hinchado de negros nubarrones, amenazando lluvia, y, aquí arriba, en el puerto de Amarza, la humedad y la luz se funden formando una misma sustancia, una niebla pegajosa y fría que empapa mansamente la tierra y el espacio. Cuando no nos ve, parados en medio del camino, al final de una revuelta, el hombre tira del ronzal a la caballería y se detiene. De reojo, bajo el ala del sombrero, mientras Ramiro y yo nos acercamos, observa los hayedos más cercanos buscando otras personas. Recibe con recelo mi saludo. Pero sus ojos, hundidos bajo el sombrero no dejan traslucir la menor sombra de miedo.	[eˈl ɔmbɾe ˈβ̞jene suˈβ̞jen̪d̪o poɾ ɛl ˈmeð̞jo ð̞ɛl kaˈmĩno\| si̞lˈβ̞an̪d̪o ˈen̪t̪ɾe ˈð̞jen̪t̪eˈs una kan̟ˈθjon i t̪iˈɾan̪d̪o si̞n̪ d̪emaˈsjað̞as̬ ˈɣ̞anaz̪ ð̞e la kaβ̞aʎeˈɾia‖ ˈt̪ɾae ˈu̞u̯m ˈbjɛχo t̪aˈβ̞aɾð̞o ð̞e ˈpjɛl ˈβ̞wɛl̪t̪a\| d̪esk̠oloˈɾið̞o ˈʝ̞a pɔɾ loˈs aɲos i la ˈʎuβ̞ja\| ˈɟ͡ʝ̞ u̞n sɔmˈbɾeˈɾɔo ːˈɔŋɡo ð̞e ˈfjɛl̪t̪ɾɔo u̯n̪ˈd̪ið̞o ˈas̪t̪a loˈs ɔχɔs‖ k̟iˈθa poˈɾ eso nõo nɔs̬ ˈβ̞e as̪t̪a k̟e ːs̪ˈt̪a ˈʝ̞a ˌpɾaɣ̞t̪ikaˈmẽn̪t̪e ːn̟ˈθima ð̞e noˈsot̪ɾɔs‖ ɑˈun ːo ˈsɔn laˈs oʧo t̪oð̞aˈβ̞ia ð̞e ˈu̞u̯n̪ ˈd̪ia k̟e ˈa ːmãneˈθið̞ɔ i̯n̠ˈʧað̞o ð̞e ˈneɣ̞ɾɔs̬ nuβ̞aˈrɔnes\| amẽnaˈθan̪d̪o ˈʎuβ̞ja\| i\| aˈk̟i aˈri̞β̞a\| en ɛl ˈpwɛɾt̪o ð̞e aˈmaɾθa\| lɑ u̯meˈð̞að̞ i la ˈlu̞θ se ˈfu̞n̪d̪eɱ fɔɾˈmãn̪d̪o ˈuu̯nã ˈmi̞s̬ma su̞s̪ˈt̪an̟θja\| ˈunã ˈnjeβ̞la peɣ̞ɑˈχosa i̯ ˈfɾia k̟e ːmˈpapa ˌmãnsaˈmẽn̪t̪e la ˈt̪jɛra ʝ̞ el esˈpaθjo‖ ˈk̠wan̪d̪o nõo nɔs̬ ˈβ̞e\| paˈɾað̞os eⁿ ˈmeð̞jo ð̞ɛl kaˈmĩno\| ɑl fiˈnɑl̪ d̪e ˈuu̯na rɛˈβ̞wɛl̪t̪a\| eˈl ɔmbɾe ˈt̪iɾa ð̞ɛl rɔn̟ˈθal a la kaβ̞aʎeˈɾia i̯ se ð̞eˈt̪jene‖ d̪ɛ rɛˈɔχo\| ˈbɑχo eˈl ala ð̞ɛl sɔmˈbɾeɾo\| ˈmj̃ẽn̪t̪ɾa raˈmiɾɔ i̯ ˈʝ̞o nos aθɛɾˈkamɔs\| ɔβ̞ˈsɛɾβ̞a los aˈʝ̞eð̞ɔs̬ ˈmas θɛɾˈkanɔs̬ β̞u̞sˈkan̪ˈd̪o ːt̪ɾas pɛɾ ˈso nas‖ rɛˈθiβ̞e k̠ɔn rɛˈθelo mi saˈluð̞o‖ ˈpeɾo suˈs ɔχɔs\| u̞n̪ˈd̪ið̞ɔs̬ β̞ɑχo ɛl sɔmˈbɾeɾo\| no ˈð̞ɛxan̪ t̪ɾas̬luˈθi̞ɾ la mẽˈnɔɾ ˈsɔmbɾa ð̞e ˈmjeð̞o]

A.5. PORCENTAJES DE APARICIÓN DE FONEMAS Y ALÓFONOS EN NÚCLEO: PORCENTAJE DE APARICIÓN DEL FONEMA EN NÚCLEO, Y PORCENTAJE GLOBAL DE APARICIONES DEL ALÓFONO SEGÚN TONICIDADTop

Fon.	% apa. núcleo	Al.	% del fonema	% áto. total	% tón. total
/a/	28,39	[a]	88,54	8,24	3,54
		[ɑ]	6,72	0,61	0,28
		[aː]	2,16	0,25	0,04
		[ã]	2,13	0,16	0,12
		[ɑː]	0,41	0,05	0,01
		[ãː]	0,04	<0,01	<0,01
/e/	27,96	[e]	76,98	7,40	2,69
		[ɛ]	16,83	1,51	0,69
		[ẽ]	2,96	0,15	0,23
		[eː]	2,55	0,20	0,13
		[ɛː]	0,59	0,06	0,02
		[ẽː]	0,08	0,01	<0,01
/o/	21,03	[o]	67,21	5,22	1,40
		[ɔ]	30,77	2,20	0,83
		[õ]	1,00	0,08	0,02
		[ɔ̃]	0,52	0,02	0,03
		[oː]	0,33	0,02	0,01
		[ɔː]	0,16	0,01	0,01
		[ɔ̃ː]	<0,01	<0,01	<0,01
		[õː]	<0,01	<0,01	<0,01
/i/	9,94	[i]	76,04	1,81	1,73
		[i̞]	20,36	0,45	0,50
		[ĩ]	2,48	0,08	0,04
		[ĩ̞]	0,87	0,04	<0,01
		[iː]	0,12	<0,01	<0,01
		[i̞ː]	0,08	<0,01	<0,01
		[ĩ̞ː]	0,04	<0,01	<0,01
		[ĩː]	0,01	<0,01	<0,01
/u/	4,78	[u]	61,27	0,67	0,70
		[u̞]	31,63	0,31	0,40
		[ũ̞]	3,78	0,01	0,08
		[ũ]	3,24	0,01	0,06
		[uː]	0,06	<0,01	<0,01
		[u̞ː]	0,03	<0,01	<0,01
		[ũ̞ː]	<0,01	<0,01	<0,01
		[ũː]	<0,01	<0,01	<0,01
/j/	4,47	[j]	95,85	0,71	1,29
/j/	4,47	[j̃]	4,15	0,01	0,08
/w/	1,84	[w]	99,59	0,28	0,58
/w/	1,84	[w̃]	0,41	<0,01	<0,01
/i̯/	1,27	[i̯]	96,02	0,43	0,14
/i̯/	1,27	[ĩ̯]	3,98	0,02	<0,01
/u̯/	0,32	[u̯]	98,35	0,12	0,03
/u̯/	0,32	[ũ̯]	1,65	<0,01	<0,01
Tot.	100		Tot.	31,15	15,69

A.6. PORCENTAJES DE APARICIÓN DE FONEMAS Y ALÓFONOS EN ATAQUE: PORCENTAJE DE APARICIÓN DEL FONEMA EN ATAQUE, Y PORCENTAJE GLOBAL DE APARICIONES DEL ALÓFONO SEGÚN TONICIDADTop

Fon.	% apa. ataque	Al.	% del. fonema	% áto. total	% tón. total
/d/	11,75	[ð̞]	77,91	2,95	0,80
		[d̪]	20,67	0,76	0,24
		[ð̞]	0,76	0,03	0,01
		[ð̞ː]	0,66	0,03	<0,01
/t/	10,38	[t̪]	99,83	2,68	1,57
		[tː]	0,12	<0,01	<0,01
		[t̟]	0,05	<0,01	<0,01
/ɾ/	9,50	[ɾ]	100	2,68	1,22
/k/	9,13	[k̠]	41,74	1,29	0,27
		[k̟]	32,57	0,92	0,30
		[k]	25,61	0,58	0,38
		[kː]	0,08	<0,01	<0,01
/s/	9,29	[s]	95,98	2,68	0,98
/s/	9,29	[sː]	4,02	0,11	0,04
/l/	8,80	[l]	99,24	2,79	0,79
/l/	8,80	[lː]	0,76	0,02	0,01
/n/	7,19	[n]	98,30	2,04	0,86
/n/	7,19	[nː]	1,70	0,03	0,02
/b/	6,77	[β̞]	86,06	1,34	1,05
		[b]	13,82	0,22	0,17
		[β̞ː]	0,08	<0,01	<0,01
		[β̞]	0,04	<0,01	<0,01
/m/	6,31	[m]	100	1,51	1,08
/p/	6,21	[p]	99,95	1,83	0,72
/p/	6,21	[pː]	0,05	<0,01	<0,01
/θ/	3,81	[θ]	99,94	0,77	0,80
/θ/	3,81	[θː]	0,06	<0,01	<0,01
/ɡ/	2,66	[ɣ̞]	80,46	0,47	0,41
		[ɡ]	19,41	0,06	0,15
		[ɣ̞]	0,11	<0,01	<0,01
		[ɣ̞ː]	0,02	<0,01	<0,01
/x/	1,77	[x]	64,08	0,23	0,24
		[χ]	35,86	0,17	0,09
		[x]	0,05	<0,01	<0,01
		[xː]	0,01	<0,01	<0,01
		[χː]	<0,01	<0,01	<0,01
/r/	1,78	[r]	98,49	0,49	0,22
/r/	1,78	[rː]	1,51	0,01	<0,01
/f/	1,55	[f]	99,83	0,32	0,31
/f/	1,55	[fː]	0,17	<0,01	<0,01
/ʎ/	1,02	[ʎ]	100	0,31	0,11
/ʝ̞/	0,89	[ʝ̞]	72,27	0,12	0,14
/ʝ̞/	0,89	[ɟ͡ʝ̞]	27,73	0,04	0,06
/ʧ/	0,68	[ʧ]	99,99	0,19	0,09
/ʧ/	0,68	[ʧː]	<0,01	<0,01	<0,01
/ɲ/	0,52	[ɲ]	100	0,13	0,08
Tot.	100		Tot.	27,85	13,20

A.7. PORCENTAJES DE APARICIÓN DE FONEMAS Y ALÓFONOS EN CODA: PORCENTAJE DE APARICIÓN DEL FONEMA EN CODA, Y PORCENTAJE GLOBAL DE APARICIONES DEL ALÓFONO SEGÚN TONICIDADTop

Fon.	% apa. coda	Al.	% del fon.	% áto. total	% tón. total
/n/	34,05	[n̪]	47,76	0,89	1,07
		[n]	20,31	0,52	0,32
		[ŋ]	11,92	0,30	0,19
		[n̟]	6,54	0,15	0,12
		[m]	6,23	0,15	0,11
		[ⁿ]	4,08	0,12	0,05
		[ɱ]	2,14	0,07	0,02
		[n̠]	0,71	0,01	0,02
		[ɴ]	0,31	0,01	0,01
		[n̠]	<0,01	<0,01	<0,01
/s/	30,16	[s]	47,73	1,53	0,21
		[s̪]	24,00	0,57	0,31
		[s̬]	15,94	0,44	0,14
		[z̪]	12,34	0,39	0,06
/ɾ/	16,45	[ɾ]	100	0,75	1,24
/l/	11,04	[l]	75,55	0,72	0,29
		[l̪]	21,27	0,17	0,12
		[l̟]	2,28	0,02	0,01
		[l̠]	0,91	0,01	<0,01
/m/	3,72	[m]	97,38	0,27	0,17
		[n]	1,62	<0,01	0,01
		[ⁿ]	0,45	<0,01	<0,01
		[n̪]	0,26	<0,01	<0,01
		[ŋ]	0,19	<0,01	<0,01
		[ɱ]	0,06	<0,01	<0,01
		[n̠]	0,02	<0,01	<0,01
		[n̟]	0,02	<0,01	<0,01
		[ɴ]	<0,01	<0,01	<0,01
		[n̠]	<0,01	<0,01	<0,01
/k/	1,54	[ɣ̞]	100	0,12	0,07
/d/	1,07	[ð̞]	84,28	0,01	0,10
/d/	1,07	[ð̞]	15,72	0,01	0,01
/θ/	0,88	[θ]	60,61	0,01	0,05
/θ/	0,88	[θ̬]	39,39	0,01	0,04
/b/	0,29	[β̞]	93,69	0,03	<0,01
/b/	0,29	[β̞]	6,31	<0,01	<0,01
/p/	0,25	[β̞]	100	0,02	0,01
/ɡ/	0,24	[ɣ̞]	86,92	0,02	0,01
/ɡ/	0,24	[ɣ̞]	13,08	<0,01	<0,01
/t/	0,23	[ð̞]	100	0,01	0,02
/ʧ/	0,03	[ʧ]	100	<0,01	<0,01
/f/	0,03	[f]	76,27	<0,01	<0,01
/f/	0,03	[f̬]	23,73	<0,01	<0,01
/x/	0,01	[x]	100	<0,01	<0,01
Tot.	100		Tot.	7,32	4,76

A.8. PORCENTAJES DE APARICIÓN DE LOS DISTINTOS ALÓFONOSTop

Al.	% total	Al.	% total	Al.	% total
[a]	11,776	[ʎ]	0,423	[ɔː]	0,016
[e]	10,083	[ẽ]	0,387	[ɴ]	0,013
[o]	6,610	[b]	0,384	[ɴ]	0,012
[ɾ]	5,885	[eː]	0,334	[rː]	0,011
[s]	5,400	[aː]	0,287	[ẽː]	0,010
[l]	4,592	[l̪]	0,284	[iː]	0,006
[t̪]	4,252	[ã]	0,283	[tː]	0,005
[ð̞]	3,804	[ʧ]	0,283	[ɣ̞]	0,005
[n]	3,743	[n̟]	0,269	[ãː]	0,005
[i]	3,549	[ʝ̞]	0,263	[w̃]	0,005
[m]	3,282	[χ]	0,260	[i̞ː]	0,004
[ɔ]	3,044	[ɲ]	0,215	[β̞]	0,003
[p]	2,548	[ɡ]	0,212	[kː]	0,003
[β̞]	2,453	[ⁿ]	0,170	[ĩ̞ː]	0,003
[ɛ]	2,205	[sː]	0,153	[ũ̯]	0,002
[j]	2,005	[u̯]	0,148	[β̞ː]	0,002
[n̪]	1,966	[ð̞]	0,145	[t̟]	0,002
[θ]	1,628	[ĩ]	0,115	[uː]	0,001
[k̠]	1,564	[ɟ͡ʝ̞]	0,101	[x]	0,001
[u]	1,364	[õ]	0,098	[pː]	0,001
[k̟]	1,221	[ɱ]	0,089	[fː]	0,001
[ɣ̞]	1,091	[j̃]	0,087	[θː]	0,001
[d̪]	0,996	[ũ̞]	0,085	[f̬]	0,001
[k]	0,960	[ɛː]	0,078	[u̞ː]	0,001
[i̞]	0,947	[ũ]	0,073	[ĩː]	0,001
[ɑ]	0,894	[ɑː]	0,055	[ɔ̃ː]	0,001
[s̪]	0,875	[ɔ̃]	0,052	[õː]	<0,001
[w]	0,864	[nː]	0,050	[ɣ̞ː]	<0,001
[r]	0,718	[θ̬]	0,042	[xː]	<0,001
[u̞]	0,709	[ĩ̞]	0,041	[χː]	<0,001
[f]	0,637	[ð̞ː]	0,032	[n̠]	<0,001
[i̯]	0,591	[oː]	0,032	[ʧː]	<0,001
[s̬]	0,581	[l̟]	0,030	[ũ̞ː]	<0,001
[ŋ]	0,491	[n̠]	0,029	[ũː]	<0,001
[x]	0,465	[lː]	0,027
[z̪]	0,450	[ĩ̯]	0,024

A.9. PORCENTAJES DE APARICIÓN DE LOS DISTINTOS TIPOS DE SÍLABA, DIFERENCIANDO ENTRE SÍLABAS ÁTONAS Y TÓNICAS, SÍLABA MÁS FRECUENTE DEL TIPO, Y SU TONICIDAD RELATIVATop

Tipo	% apar. total	% apar. átona	% apar. tón.	Sílaba más frecuen.	Ton. rel.
CV	57,45	42,18	15,26	/de/	0,84
CVC	19,82	12,71	7,11	/kon/	1,13
V	6,13	4,35	1,78	/a/	0,92
CSV	3,74	1,59	2,16	/θjo/	1,82
CCV	3,54	2,44	1,10	/tɾa/	0,98
VC	3,34	2,41	0,93	/en/	0,88
CSVC	2,91	0,63	2,28	/θjon/	2,47
CCVC	1,01	0,55	0,46	/tɾas/	1,43
CVS	0,97	0,73	0,24	/tai̯/	0,79
CVSC	0,41	0,33	0,08	/bei̯n/	0,61
CVCC	0,12	0,08	0,04	/kons/	1,13
VS	0,12	0,06	0,06	/ai̯/	1,57
CCSV	0,09	0,03	0,06	/bɾjo/	2,17
VSC	0,08	0,08	<0,01	/au̯n/	0,16
CCVS	0,07	0,05	0,02	/tɾai̯/	0,81
CSVS	0,06	0,05	0,01	/θjai̯/	0,60
CCSVC	0,04	0,01	0,03	/kljen/	2,49
CCVSC	0,03	0,01	0,02	/tɾei̯n/	2,25
CCVCC	0,02	0,02	<0,01	/tɾans/	0,61
CVSCC	0,02	0,02	<0,01	/sei̯ns/	0,44
CSVSC	0,01	0,01	<0,01	/θjai̯n/	1,03
VCC	0,01	<0,01	0,01	/ins/	1,94
CSVCC	<0,01	<0,01	<0,01	/kwaɾt/	1,88
VSCC	<0,01	<0,01	<0,01	/ai̯ns/	0,45
CCSVS	<0,01	<0,01	<0,01	/bɾjoi̯/	0,79
CCVSCC	<0,01	<0,01	<0,01	/pɾou̯st/	1,56
CSVSCC	<0,01	<0,01	<0,01	/djoi̯ns/	1,59
CCSVCC	<0,01	<0,01	<0,01	/stwaɾt/	2,19
CCSVSC	<0,01	<0,01	<0,01	/bɾjoi̯n/	0,70
CCSVSCC	<0,01	<0,01	<0,01	/bɾjoi̯ns/	1,58

A.10. PORCENTAJES DE APARICIÓN DE LAS SÍLABAS MÁS FRECUENTES DEL ESPAÑOLTop

Sílaba	% aparición	Sílaba	% aparición
/de/	3,71	/ma/	1,09
/a/	3,29	/e/	1,02
/la/	2,34	/so/	0,96
/do/	2,17	/me/	0,91
/ke/	2,05	/bi/	0,91
/ɾa/	1,68	/mo/	0,90
/ta/	1,67	/kon/	0,87
/te/	1,59	/pe/	0,81
/se/	1,58	/di/	0,80
/na/	1,58	/ti/	0,79
/no/	1,54	/mi/	0,79
/to/	1,52	/le/	0,76
/ko/	1,47	/po/	0,75
/sa/	1,32	/ɾo/	0,74
/ka/	1,30	/ne/	0,68
/lo/	1,19	/su/	0,67
/ba/	1,17	/re/	0,66
/da/	1,16	/en/	0,65
/pa/	1,15	/es/	0,63
/si/	1,11	/be/	0,63

Cálculo de frecuencias de aparición de fonemas y alófonos en español actual utilizando un transcriptor automático

RESUMEN

ABSTRACT