Cálculo de frecuencias de aparición de fonemas y alófonos en español actual utilizando un transcriptor automático
DOI:
https://doi.org/10.3989/loquens.2016.029Palabras clave:
frecuencia de aparición, fonemas, alófonos, español, cadena habladaResumen
El cálculo de la frecuencia de aparición de los distintos fonemas de la lengua española es un asunto que se ha abordado previamente en varias ocasiones. Sin embargo, la gran mayoría de los estudios realizados no toma en consideración la variación alofónica o la trata solo parcialmente. Además, en todos estos trabajos los recuentos se han llevado a cabo a partir de palabras aisladas, sin tener en cuenta los fenómenos fonéticos que se producen en la secuencia fónica, especialmente el resilabeo. En el presente trabajo se realiza un recuento de los porcentajes de aparición de los distintos fonemas y alófonos en el dialecto castellano. Para ello, se ha creado un corpus de novelas en español, que se transcriben automáticamente con ayuda de un programa informático creado ex profeso, cuyo diseño se detalla en este artículo. También se realiza un estudio limitado de la estructura silábica en términos de frecuencias de aparición.
Descargas
Citas
Alameda, J. R., y Cuetos, F. (1995). Diccionario de frecuencias de las unidades lingüísticas del castellano. Oviedo: Servicio de Publicaciones de la Universidad de Oviedo.
Alarcos Llorach, E. (1965). Fonología española (4.ª ed.). Madrid: Gredos.
Álvarez, C. J., Carreiras, M., y de Vega, M. (1992). Estudio estadístico de la ortografía castellana: (1) La frecuencia silábica. Cognitiva, 4(1), 75-105.
Bonaventura, P., Giuliani, F., Garrido, J. M., y Ortín, I. (1998). Grapheme-to-phoneme transcription rules for Spanish, with application to automatic speech recognition and synthesis. Proceedings of the Workshop on Partially Automated Techniques for Transcribing Naturally Occurring Continuous Speech, 16th August 1998, Université de Montréal. Montréal: COLINGACL, 33-39. https://doi.org/10.3115/1628291.1628295
Castro, M. J., España, S., Salvador, I., y Marzalz, A. (2001). Transcriptor ortográfico-fonético para el castellano. Procesamiento del lenguaje natural, 27, 241-246.
Delattre, P. (1965). Comparing the phonetic features of English, German, Spanish and French. Heidelberg: Groos.
Fernández Planas, A. M., y Carrera Sabaté, J. (2001). Prácticas de transcripción fonética en castellano. Barcelona: Salvatella. PMid:11553819
Garrido, J.M., Laplaza, Y., Marquina, M., Schoenfelder, C., y Rustullet, S. (2012). TexAFon: A multilingual text processing tool for text-to-speech applications. Proceedings of IberSPEECH 2012. Séptimas Jornadas en Tecnología del Habla and 3rd Iberian SLTech Workshop, 281-289. http://iberspeech2012.ii.uam.es/IberSPEECH2012_OnlineProceedings.pdf
Gómez Torrego, L. (2011). Algunos compuestos sintagmáticos con el primer componente átono y algunas formas prefijadas con la preposición «sin». En M. V. Escandell Vidal, M. Leonetti y C. Sánchez López, 60 problemas de gramática (pp. 366-379). Madrid: AKAL.
González Rátiva, M. C., y Mejía Escobar, J. A. (2011). Frecuencia fonemática del español de Colombia. Forma y Función, 24(2), 69-102. http://www.bdigital.unal.edu.co/37067/
Goyal, K. (2016). Calibre (Versión 2.53) [software]. Obtenido de https://calibre-ebook.com/
Grefenstette, G., y Tapanainen, P. (1994). What is a word, What is a sentence? Problems of Tokenization. Third International Conference on Computational Lexicography, Budapest, 1994, 79–87.
Guerra, R. (1983). Estudio estadístico de la sílaba en español. En M. Esgueva y M. Cantarero, Estudios de fonética 1 (pp. 9-112). Madrid: Consejo Superior de Investigaciones Científicas e Instituto «Miguel de Cervantes».
Guirao, M., y Borzone de Manrique, A. M. (1972). Fonemas, sílabas y palabras en el español de Buenos Aires. Filología, 16, 135-165.
Guirao, M., y García, M. A. (1993). Estudio estadístico del español. Buenos Aires: Consejo Nacional de Investigaciones Científicas y Técnicas.
Hualde, J. I. (1989). Silabeo y estructura morfémica en español. Hispania, 72(4), 821-831. https://doi.org/10.2307/343560
Llisterri, J., y Mariño, J. B. (1993). Spanish adaptation of SAMPA and automatic phonetic transcription (informe SAM-A/ UPC/001/V1). ESPRIT Project 6819.
Lloyd, P. M., y Schnitzer, R. D. (1967). A statistical study of the structure of the Spanish syllable. Linguistics, 5(37), 58-72. https://doi.org/10.1515/ling.1967.5.37.58
Marcos Marín, F. (Dir.) (1992) Corpus Oral de Referencia de la Lengua Española CORLEC [corpus]. http://www.lllf.uam.es/ESP/Corlec.html
Martínez Celdrán, E., y Fernández Planas, A. M. (2000). Características fonéticas de la africada palatal sonora del español. Actas del IV Congreso de Lingüística General (Vol. 4). Universidad de Cádiz, pp. 1751-1761. PMid:10758307
Moreno Sandoval, A., Torre Toledano, D., Curto, N., y de la Torre, R. (2006). Inventario de frecuencias fonémicas y silábicas del castellano espontáneo y escrito. http://www.lllf.uam.es/ESP/ Publicaciones/LLI-UAM-4JTH.pdf
Moreno Sandoval, A., Toledano, D. T., de la Torre, R., Garrote, M., y Guirao, J. M. (2008). Developing a phonemic and syllabic frequency inventory for spontaneous spoken Castilian Spanish and their comparison to text-based inventories. Proceedings of the 6th Conference on Language Resources and Evaluation (LREC), pp. 1097-1100.
Mosterín, J. (1981). La ortografía fonémica del español. Madrid: Alianza Universidad.
Navarro Tomás, T. (1966). Escala de frecuencia de fonemas españoles. Estudios de fonología española (2.ª ed.), 15-30. New York: Las Américas.
Pérez, H. E. (2003). Frecuencia de fonemas. Revista Electrónica en Tecnologías del Habla, 1.
Pérez Tobarra, L. (2005). El acento en español. redELE: Revista Electrónica de Didáctica ELE, 4, 14-33.
Pineda, L. A., Villase-or, L., Cuétara, J., Castellanos, H., y López, I. (2004). DIMEx100: A new phonetic and speech corpus for Mexican Spanish. Advances in Artificial Intelligence-IBERAMIA 2004, 974-983. Berlin: Springer. https://doi.org/10.1007/978-3-540-30498-2_97
Quilis, A., y Esgueva, M. (1980). Frecuencia de fonemas en el español hablado. Lingüística Española Actual, 2(1), 1-25.
REAL ACADEMIA ESPAÑOLA, y ASOCIACIÓN DE ACADEMIAS DE LA LENGUA ESPAÑOLA (2005). Diccionario panhispánico de dudas. Madrid: Santillana.
Ríos Mestre, A. (1993). La información lingü.stica en la transcripción fonética automática del español. VIII Congreso de la SEPLN, Granada, 381-387. https://rua.ua.es/dspace/bitstream/10045/4619/1/PLN_13_28.pdf
Rojo Sánchez, G. (1991). Frecuencia de fonemas en español actual. En M. Brea y F. Fernández Rei (Coords.), Homenaxe ó Profesor Constantino García, vol. 1 (pp. 451-467). http://hdl.handle.net/10347/12469
Sebastián-Gallés, N., Martí, M. A., Carreiras, M. y Cuetos, F. (2000). LEXESP: Una base de datos informatizada del español [CD-ROM y libro]. Barcelona: Universitat de Barcelona.
Zipf, G. K., y Rogers, F. M. (1939). Phonemes and variphones in four present-day Romance languages and Classical Latin from the viewpoint of dynamic philology. Archives néerlandaises de phonétique expérimentale, 15, 111-147.
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2016 Consejo Superior de Investigaciones Científicas (CSIC)

Esta obra está bajo una licencia internacional Creative Commons Atribución 4.0.
© CSIC. Los originales publicados en las ediciones impresa y electrónica de esta Revista son propiedad del Consejo Superior de Investigaciones Científicas, siendo necesario citar la procedencia en cualquier reproducción parcial o total.
Salvo indicación contraria, todos los contenidos de la edición electrónica se distribuyen bajo una licencia de uso y distribución “Creative Commons Reconocimiento 4.0 Internacional ” (CC BY 4.0). Consulte la versión informativa y el texto legal de la licencia. Esta circunstancia ha de hacerse constar expresamente de esta forma cuando sea necesario.
No se autoriza el depósito en repositorios, páginas web personales o similares de cualquier otra versión distinta a la publicada por el editor.