Estudio comparativo de erratas en diccionarios especializados inglés-español en papel de los ámbitos económico-financiero, jurídico e industrial. Una propuesta metodológica

Rodríguez-Rubio Mediavilla, Santiago

Estudio comparativo de erratas en diccionarios especializados inglés-español en papel de los ámbitos económico-financiero, jurídico e industrial. Una propuesta metodológica

Rodríguez-Rubio Mediavilla, Santiago

Zuzendaria:

Nuria Fernández Quesada Zuzendaria

Defentsa unibertsitatea: Universidad Pablo de Olavide

Fecha de defensa: 2021(e)ko azaroa-(a)k 26

Epaimahaia:

Stefan Ruhstaller Kuhne Presidentea
María Auxiliadora Castillo Carballo Idazkaria
Juan Manuel García Platero Kidea

Saila:

Filología y Traducción

Mota: Tesia

Teseo: 675598 DIALNET RIO editor

Laburpena

En el presente trabajo se compara la frecuencia de erratas de dos colecciones de diccionarios especializados bilingües españoles en papel de los ámbitos económico-financiero, jurídico e industrial (amén de una obra del campo del turismo y otra del ámbito de las ciencias médicas). La primera colección (que calificaremos «de clase A») se conoce en el mundo de la lexicografía y metalexicografía especializada como «The Alicante Dictionaries», y se compone de catorce obras editadas por Editorial Ariel vinculadas al grupo de investigación de la Universidad de Alicante «El inglés profesional y académico» y al Instituto Interuniversitario de Lenguas Modernas Aplicadas de la Comunidad Valenciana (IULMA). La segunda colección («de clase B»), que funcionará como grupo de control, está formada por cuatro diccionarios realizados por autores individuales y editados por Ediciones Gestión 2000. Para la categorización de las erratas, nos hemos basado en la literatura de la sicolingüística (Wells 1916) y en la del procesamiento del lenguaje natural, PLN (Damerau 1964). En campo del PLN, en inglés se distingue entre non-word errors (erratas que generan términos idiomáticamente incorrectos) y real-word errors (erratas que generan términos idiomáticamente correctos, pero inválidos de acuerdo con el contexto). La sicolingüística ha tratado los mismos fenómenos, pero sin usar esas denominaciones. Los real-word errors han sido especialmente objeto de estudios del PLN (Mitton 1987; Kukich 1992), aunque también se han descrito en trabajos de la sicolingüística, bajo otras denominaciones: word error (Dvorak et al. 1936), type error (MacNeilage 1964), another word (Logan 1999). En nuestro estudio, hemos acuñado las denominaciones errata de no palabra (ENP) y errata de palabra (EP), para non-word error y real-word error, respectivamente, introduciendo algunos matices diferenciales . Usamos el término «errata», pues no nos referimos a cualquier tipo de error, como explicaremos en «5.4.1. Tratamiento de la ambigüedad». Se han descrito dos vías de reproducción de las erratas: subentradas relacionadas (v. gr. subentradas equivalentes u homólogas) y subentradas no relacionadas (a través de frases ilustrativas compartidas). La reproducción de erratas prueba que no estamos ante una mera acumulación, sino ante un sistema de erratas. Nuestro estudio pone de manifiesto la importancia de la corrección formal en obras de referencia, en un contexto tecnológico en que la calidad de los datos es fundamental no solo en aplicaciones lexicográficas (v. gr. herramientas de corpus, búsqueda automática), sino también en áreas del procesamiento del lenguaje natural como el aprendizaje automático de correctores (machine learning for spellcheckers) o la limpieza de datos (data cleansing). Con el estudio, se pretende ofrecer un método de análisis y un modelo de categorización de erratas que pueda servir de referencia no solo a los lexicógrafos, sino a los profesionales del lenguaje en general (autores, traductores, correctores, editores, etc.). Los diccionarios deberían ser un dechado de corrección formal, dado que a los profesionales que los usan se les exige (o se les debería exigir) un alto nivel de precisión. Recomendamos la revisión de las principales obras del corpus.