Elaboración de glosarios económicos con fines docentes:

aproximación metodológica basada en corpus y explotación terminológica en el aula de traducción

By Daniel Gallego-Hernández (University of Alicante, Spain)

Abstract & Keywords

English:

The aim of this paper is to present the methodology used to compile a business corpus and identify its terminology in order to create a glossary to be used in translator training. First, we briefly review the literature on corpus building and exploitation for terminological purposes. Then, we present the methodology itself and a series of activities aimed at acquiring business knowledge. The results show that both techniques used to exploit the corpus (term detection and extraction) were useful, even though they do not fit the specific needs of this study. On the other hand, the exercises can be complemented with other exercises and modified according to the teaching context.

Spanish:

Este trabajo presenta la metodología empleada para compilar un corpus económico e identificar su terminología con el fin de crear un glosario de utilidad en la formación de traductores. Por una parte, se repasa brevemente la bibliografía sobre compilación de corpus y explotación con fines terminológicos. Por otra parte, se presenta la metodología en cuestión, así como una serie de actividades enfocadas a la adquisición de conocimiento especializado en economía. Los resultados muestran que las técnicas usadas para detectar términos y extraer automáticamente candidatos a término, si bien no terminan de adecuarse a las necesidades concretas del presente trabajo, son de utilidad e incluso pueden complementarse. Por su parte, las actividades propuestas pueden sumarse igualmente a otro tipo de actividades y modificarse según el contexto docente.

Keywords: Traducción especializada, lexicografía especializada, Lingüística de Corpus, formación de traductores, economía y negocios, specialized and technical translation, specialized lexicography, corpus linguistics, translator training, business and economics

©inTRAlinea & Daniel Gallego-Hernández (2014).
"Elaboración de glosarios económicos con fines docentes:"
inTRAlinea Special Issue: Translation & Lexicography
Edited by: María Sánchez, María Porciel & Iris Serrat
This article can be freely reproduced under Creative Commons License.
Permanent URL: http://www.intralinea.org/specials/article/2033

1. Introducción

Como docentes de asignaturas de traducción especializada en el ámbito económico, comercial y financiero nos vemos obligados no solo a tratar de estudiar el funcionamiento del mercado de este tipo de traducción con el fin de estrechar la distancia de la traducción profesional y la traducción en contexto formativo, sino también a investigar cuáles son las necesidades específicas (terminológicas, conceptuales, teórico-prácticas, tecnológicas, etc.) de nuestros propios estudiantes. En este sentido, una de las conclusiones a las que pudimos llegar en el pasado seminario sobre traducción e interpretación económica e institucional (Gallego et al. 2013), destinado precisamente a satisfacer este tipo de necesidades docentes y discentes, tiene que ver con las carencias que nuestros propios estudiantes reconocen tener a la hora de comprender ya no solo los textos con los que trabajamos en el aula de traducción, sino también la prensa y las noticias de actualidad, que, a día de hoy, tienen mucho que ver con la economía. Ante este panorama, como profesores de traducción económica, financiera y comercial y de terminología, entendemos que debemos reaccionar con el propósito de intentar dotar a nuestros estudiantes de los elementos formales y conceptuales necesarios para satisfacer sus necesidades informativas en estos ámbitos, de modo que puedan llegar a un equilibro entre lo temático y lo lingüístico.

Existen muchos trabajos sobre enseñanza del lenguaje económico, además de diferentes diccionarios y repertorios léxicos especializados que igualmente pueden ayudar a adquirir conocimiento especializado en economía. Sin ánimo de ser exhaustivos, podemos mencionar trabajos como los de Vangehuchten (2005), diccionarios bilingües (francés, en nuestro caso), como el Diccionario de economía y comercio: francés-español, español-francés (Garnot 1987), el Diccionario jurídico-económico: francés-español, español-francés (Campos et al. 2005), el Dictionnaire de l’espagnol économique commercial et financier (espagnol-français/français-espagnol) (Chapron y Gerboin 2005) o multilingües, como el Diccionario LID empresa y economía (Elosua 2007), e incluso trabajos lexicográficos centrados en aspectos más concretos, como los de Martín (2003) o Le Poder (2012), también bilingües. Se han propuesto incluso tareas que, desde una perspectiva terminológica, ayudan a adquirir una competencia cognitiva y especializada por medio del análisis de textos especializados (Cabré 2002), de la elaboración de resúmenes de textos económicos (Fuertes 2003) o de la traducción señalética (Trybisz 2002). Ahora bien, a nuestro entender, estos trabajos, o bien están enfocados para la enseñanza del español como lengua extranjera, en el caso de los métodos o estudios sobre didáctica, o bien pueden no centrarse en la actualidad o tener una cobertura excesiva para nuestros propósitos, en el caso de los diccionarios, o bien hacen énfasis en tal o cual aspecto de la economía sin que necesariamente coincida con el área o las áreas de especialización que a día de hoy aparecen en los medios de comunicación, en el caso de los repertorios léxicos, o bien implican el estudio profundizado de un solo texto, lo que, a su vez, conlleva la necesidad de enseñar la metodología destinada a tal efecto. Ante este panorama, teniendo en cuenta ya no solo las necesidades específicas de nuestros estudiantes (recordemos: comprensión de la terminología que actualmente divulgan los medios de comunicación), sino también la naturaleza de la economía, que se encuentra en constante evolución o cambio, creemos que no nos queda más remedio que ejercer de terminólogos y tratar de averiguar con nuestros propios medios cuál es esa terminología básica para trabajarla en el aula.

A día de hoy podemos entender la terminología no solo como una disciplina, sino también como una práctica que surge de las múltiples necesidades de diferentes colectivos consistente en la recopilación de términos (o terminologías) que ayuden a representar o transmitir el conocimiento especializado conforme a dichas necesidades. En este sentido, dado que cada colectivo ejerce actividades específicas, parece lógico pensar que sus necesidades difieran respecto de otras comunidades, lo que, a su vez, puede redundar en los métodos de trabajo de la terminología, conducir a distintas prácticas y permitir generar recursos de tipo distinto según los casos. Entre estos colectivos, es posible distinguir, por una parte, los profesionales de la terminología o terminólogos, cuyo objeto de trabajo y finalidad es la propia terminología (profesionales lingüísticos que se dedican a la recopilación, la descripción, el tratamiento y la creación de términos, planificadores lingüísticos y especialistas en el tratamiento de la información), y, por otra parte, los usuarios de la terminología, que la utilizan para establecer la comunicación, ya sea de modo directo (especialistas), ya sea de modo intermediado (traductores, intérpretes, periodistas, etc.) (Cabré 2005).

Teniendo, pues, en cuenta, no solo esta breve introducción a la terminología, sino también nuestras necesidades (identificar la terminología económica básica de actualidad y utilizarla en nuestro contexto docente), debemos ejercer un papel doble respecto de la terminología: por una parte, el del terminólogo ad hoc, con el propósito de crear un producto terminológico específico adecuado a la docencia de la traducción especializada en el ámbito de la economía y los negocios, y, por otra parte, el del docente, que trata de hacer llegar a los estudiantes dicha terminología con el propósito de que comprendan con mejores garantías los medios de comunicación, ya no solo en su lengua materna, sino en la lengua extranjera con la que puedan trabajar.

Así pues, el objetivo del presente trabajo es doble: por una parte, presentamos la metodología que hemos seguido a la hora de confeccionar un glosario de términos económicos en castellano de actualidad, y, por otra parte, presentamos una serie de actividades docentes que pueden ayudar a que el estudiante de traducción económica, comercial y financiera se familiarice con este tipo de vocabulario. Pero antes de pasar a dichos objetivos, tratemos de estudiar qué trabajos relacionados con la compilación y explotación de corpus, fase imprescindible para estudiar la terminología in vivo, se han llevado a cabo.

2. Explotación de corpus con fines terminológicos

La explotación de corpus pasa de manera ineludible por la compilación previa de textos. En la última década, han sido varios los programadores que han creado aplicaciones informáticas y paquetes específicos con el objetivo de proporcionar no solo la posibilidad de automatizar el proceso de compilación de corpus, sino también su explotación. Ejemplos de estas aplicaciones son Sketch Engine (Kilgarriff et al. 2004), Jaguar (Nazar et al. 2008), BootCaT (Baroni y Bernardini 2003), WebGetter, integrada en el programa comercial Wordsmith Tools (Scott 2010), y Terminus (Cabré et al. 2010). Estas aplicaciones permiten recuperar archivos de la web, compilarlos (o bien en sus respectivas plataformas virtuales, o bien en la propia estación de trabajo) y etiquetarlos. Si bien la recuperación de archivos se basa esencialmente en la formulación de ecuaciones de búsqueda elaboradas a partir de la combinación aleatoria de palabras clave o semilla representativas de la especialidad del corpus que se pretende compilar, también algunas de estas aplicaciones permiten establecer filtros de búsqueda, así como descargar archivos a partir de un listado previo de URL e incluso subir documentos propios del usuario.

Ahora bien, desde los estudios de traducción, aunque suele reseñarse la utilidad de este tipo de herramientas, algunos autores, como Zanettin (2002: 241), afirman que estos programas “do not solve the problems of the relevance and the reliability of the document abstracts retrieved”. Sánchez (2003), por su parte, considera que “no sempre resulten ser l’instrument adequat per al traductor, ja que aquest desconeix els tipus i la quantitat de textos que està consultant. A més, les consultes són poc flexibles i difícils de manipular”. Ferraresi (2009) sostiene que estas aplicaciones “allow for very little control on the data that they display”. Ante este panorama, se ha propuesto, de manera paralela, la posibilidad de compilar corpus ad hoc mediante aplicaciones independientes que asisten al usuario en cada una de las fases del proceso de compilación. En este sentido, autores como Corpas (2002), Sánchez (2004) o, en el terreno de la traducción económica, Gallego (2012) han propuesto protocolos de compilación de corpus ad hoc, cuya fase de recuperación de textos emplea directamente los motores de búsqueda que suelen emplear los traductores y que permiten unas opciones de filtrado más adecuadas a sus necesidades.

Por lo que se refiere a la explotación de corpus con fines terminográficos, podemos hablar de dos técnicas que permiten identificar la terminología en los textos: la detección y la extracción. La primera consiste básicamente en identificar la terminología aparecida en un corpus a partir de un listado de términos o glosario previamente elaborado. La segunda consiste en extraer de manera automática, sobre la base de una serie de algoritmos o criterios previamente definidos, un listado de candidatos a término.

Las investigaciones y desarrollos que se están llevando a cabo en la creación de recursos terminográficos parecen centrarse más en la extracción automática de terminología, y tienen como objetivo la optimización de los sistemas de extracción automática de terminología que proporcionan a sus usuarios listados de candidatos a términos extraídos de corpus.

Los primeros sistemas de extracción automática de términos que aparecieron a finales del siglo pasado se fundamentaban en criterios lingüísticos o estadísticos. Ahora bien, los problemas que suele presentar la extracción basada en este tipo de criterios tiene que ver con la generación tanto de ruido, entendido como aquellos candidatos a términos que no son pertinentes para el proyecto terminológico, como de silencio, entendido como aquellos candidatos que el sistema debería recuperar en determinado proyecto, pero que no consigue proponer como candidatos a términos (Estopà 1999).

Afortunadamente, el estado actual de este tipo de sistemas parece estar bastante desarrollado, al menos en lo que se refiere a la extracción monolingüe, y se han ido desarrollando nuevos sistemas específicos que ya no parecen generar tantos problemas. Entre estos sistemas, podemos encontrar YATE (Vivaldi 2003) o Terminal (Nazar y Cabré 2011), ahora incluido en Terminus. Ambos van más allá de la mera extracción terminológica por frecuencia o por criterios lingüísticos. El primero permite extraer terminología de textos pequeños combinando estrategias heterogéneas e información semántica. El segundo permite extraer terminología de corpus empleando técnicas de análisis estadístico de textos, así como un algoritmo que permite al sistema aprender a distinguir nuevos términos. Por supuesto, existen otras herramientas, como Termostat (Drouin 2003) e incluso algunas de las aplicaciones anteriores que asisten en el proceso de compilación también permiten detectar terminología comparando los corpus con glosarios previamente elaborados, así como extraer terminología. Jaguar, por ejemplo, permite extraer candidatos a término sobre la base de criterios estadísticos (frecuencia).

En cualquier caso, parece bastante complicado que este tipo de sistemas pueda, tal como afirma Estopà (1999: 278), “adecuarse a las necesidades reales de todos sus usuarios”, pues “cada actividad profesional requiere un tipo de unidades de significación especializada específicas”.

3. Metodología para la confección del glosario

Generar un glosario de utilidad en el ámbito docente que previsiblemente satisfaga las necesidades discentes expuestas con anterioridad implica, a nuestro entender, compilar un corpus de textos representativos, aunque sea parcialmente, de la actualidad económica de España, para después proceder a extraer la terminología.

Entendemos que una buena fuente de terminología básica económica puede ser la prensa española generalista, usuaria mediadora del vocabulario especializado. Para llevar a cabo la compilación del corpus seguimos la metodología expuesta en Gallego (2012: 298-317), centrada precisamente en la recuperación y descarga de textos alojados en una serie de sitios concretos. Optamos por este tipo de metodología y no por otras que automaticen la totalidad de los pasos en la compilación del corpus, porque, a la hora de recuperar los textos con el motor de búsqueda Google, podíamos optimizar el lenguaje de interrogación desde el punto de vista tanto de la actualidad de los textos que pretendíamos recuperar como de la estructura de sus URL.

En concreto, recuperamos con Google textos de cinco sitios de prensa de diferentes ideologías mediante las siguientes ecuaciones:

  • site:http://economia.elpais.com/economia/2012/
  • site:http://www.elmundo.es/elmundo/2012/ inurl:"economia"
  • site:http://www.abc.es inurl:"economia" (marcando la opción último año)
  • site:http://www.lavanguardia.com/economia (marcando la opción último año)
  • site:http://www.publico.es/dinero (marcando la opción último año)

Nótese que, mientras que en el caso de la recuperación de textos del diario El País la estructura del servidor permite recuperar textos sobre economía del año 2012 exclusivamente con el operador site, en el caso del periódico El Mundo, la estructura requirió combinar este operador con inurl, de modo que los URL de los textos estuvieran alojados en sus correspondientes carpetas sobre economía, pues dicho directorio aparece en el URL justo después de la fecha completa en la que se publicó la noticia (por ejemplo, http://www.elmundo.es/elmundo/2012/01/23/economia/1327301635.html o http://www.elmundo.es/elmundo/2012/02/14/economia/1329229093.html). En cuanto a la recuperación de textos dentro de los periódicos ABC, La Vanguardia y Público, dado que la estructura de sus correspondientes sitios no permite identificar, tal como ocurre en los casos anteriores, la fecha de publicación de los textos, tuvimos que indicar al motor de búsqueda que recuperase textos del último año, es decir, 2012.

Una vez recuperada la totalidad de los textos que Google devolvía en respuesta a cada ecuación, procedimos a descargarlos con el volcador WinHTrack, a convertirlos a TXT por medio de la aplicación HTMLAsText, y a limpiar el ruido de cada periódico con el programa Search and Replace (todas ellas aplicaciones gratuitas).

La siguiente tabla muestra los resultados de este proceso. En la primera columna hacemos referencia a cada periódico, la segunda muestra el número total de archivos descargados y la tercera columna muestra el número aproximado de palabras que, en su conjunto, tienen los archivos TXT de cada sitio:

FUENTES ARCHIVOS PALABRAS
ELP 547 361910
ELM 490 261710
ABC 544 320311
LAV 536 262326
PUB 510 292838
 

Tabla 1: contenido del corpus

La siguiente selección de palabras frecuentes representativas del corpus muestra que efectivamente este tiene que ver con el campo de especialidad de la economía española actual:

6014 millones 1788 mercado 1364 empleo
4207 España 1589 empresas 1301 ministro
4203 gobierno 1559 déficit 1288 Madrid
4002 euros 1536 sector 1285 crecimiento
2275 deuda 1530 pasado 1234 medidas
2175 economía 1500 reforma 1213 euro
2123 crisis 1490 presidente 1211 meses
1933 país 1442 Europa 1207 Grecia
1914 parte 1422 público 1205 estado
1903 banco 1396 española 1176 laboral
 

Tabla 2: palabras representativas del corpus

Compilado el corpus, procedimos a extraer terminología empleando las dos técnicas reseñadas anteriormente, es decir, la detección y la extracción de términos, con el fin de combinar (al tiempo que contrastar) los resultados de cada una y hacer una propuesta didáctica a partir del glosario resultante.

La detección de terminología implica necesariamente la elaboración previa de un glosario de términos. Para elaborar dicho glosario, partimos de los siguientes glosarios y diccionarios especializados esencialmente en el ámbito de la economía:

FUENTE URL ENTRADAS
Instituto de Crédito Oficial http://www.ico.es/webcomercial/portal/menu_comun/glosario/ 26
Comisión Nacional de la Competencia http://www.cncompetencia.es/Inicio/FAQ/Glosario/tabid/101/Default.aspx 48
Comisión Nacional del Mercado de Valores (Diccionario de fondos de inversión) http://www.cnmv.es/PortalInversor/glosario.aspx 52
Tesoro público http://www.tesoro.es/sp/deuda/glosario.asp 73
Ministerio de Economía y Competitividad (Departamento General de Seguros y Fondos de Pensiones) http://www.dgsfp.meh.es/Gaspar/NEOglosario.asp 265
Comisión Nacional del Mercado de Valores (Glosario Financiero) http://www.cnmv.es/PortalInversor/glosario.aspx 449
Banco de España http://www.bde.es/bde/es/utiles/glosario/glosarioGen 517
Diccionario de términos económicos y financieros http://portal.lacaixa.es/docs/diccionario/A_es.html 3675
Diccionario Alkona de Economía http://www.diclib.com 6461

Tabla 3: origen del glosario para la detección terminológica

La elección de estos productos se debe fundamentalmente a criterios de fiabilidad y cobertura: por un lado, la mayor parte de ellos se encuentran en sitios enlazados desde el sitio web del Ministerio de Economía y Competitividad, y por otro lado, el diccionario Alkona y el de términos económicos y financieros de La Caixa contienen un elevado número de entradas.

Tras combinar las entradas de estos recursos terminográficos y suprimir los registros duplicados, el glosario quedó con un total de 9915 entradas. Para detectar dichas entradas en el corpus, empleamos la aplicación Wordsmith y tuvimos que llevar a cabo el proceso en dos ocasiones: en primer lugar para palabras clave, en relación con los términos monoléxicos, y, en segundo lugar, para grupos de palabras o clusters, en relación con los términos pluriléxicos. En total, detectamos 2182 términos monoléxicos, y 1114 términos pluriléxicos, de los cuales, respectivamente, 269 y 368 aparecían una sola vez en el corpus.

Por su parte, la extracción de terminología implica la utilización de un sistema informático que, tal como hemos reseñado, extraiga una serie de candidatos a término en función de tal o cual criterio. En nuestro caso, empleamos la aplicación Terminal (Nazar y Cabré 2011), que permite cargar el corpus previamente compilado y etiquetarlo automáticamente. El sistema devolvió un total de 80427 candidatos a término.

Los resultados de cada una de las técnicas no fueron, en absoluto, los mismos. La siguiente tabla compara, por una parte, los cincuenta primeros resultados de extraer y detectar candidatos y términos monoléxicos, y, por otra parte, los cincuenta primeros resultados de extraer y detectar candidatos y términos pluriléxicos. Todos ellos, acompañados de la posición en la que aparecían originalmente en los resultados de ambas técnicas:

TERMINOLOGÍA MONOLÉXICA TERMINOLOGÍA POLILÉXICA
EXTRACCIÓN DETECCIÓN EXTRACCIÓN DETECCIÓN
1 deuda 1 año 7 deuda pública 1 reforma laboral
2 riesgo 2 deuda 43 gasto público 2 banco de españa
3 cobro 3 economía 53 fondo monetario 3 banco central
4 valor 4 parte 54 moneda única 4 unión europea
5 gasto 5 banco 62 deuda española 5 prima de riesgo
6 coste 6 mercado 63 población activa 6 comisión europea
8 nivel 7 déficit 88 sistema financiero 7 seguridad social
9 cierre 8 sector 90 saldo negativo 8 huelga general
10 precio 9 reforma 104 activos tóxicos 9 banco central europeo
11 venta 10 presidente 109 cuentas públicas 10 deuda pública
12 negocio 11 público 122 saldo positivo 11 comunidades autónomas
13 cuenta 12 empleo 135 producto interior 12 consejo de ministros
14 entidad 13 empresa 139 sector financiero 13 tasa de paro
15 ratio 14 ministro 149 entidades financieras 14 fondo monetario internacional
16 compra 15 euro 168 contrato único 15 déficit público
17 riesgos 16 estado 178 marketing on 16 ley de
18 dato 17 caso 180 sector bancario 17 largo plazo
19 agencia 18 trabajo 190 deuda soberana 18 wall street
20 fondo 19 paro 193 saldo neto 19 sistema financiero
21 producto 20 acuerdo 196 banca cívica 20 administraciones públicas
22 cuota 21 compañía 197 valor real 21 crisis económica
23 moneda 22 pib 204 negociación colectiva 22 corto plazo
24 banco 23 día 206 sistema bancario 23 sector financiero
25 coeficiente 24 ejecutivo 209 contabilidad pública 24 secretario general
26 ingresos 25 frente 213 agencia tributaria 25 consejero delegado
27 ventas 26 riesgo 217 activos inmobiliarios 26 crecimiento económico
28 sistema 27 grupo 218 servicios mínimos 27 a la baja
29 cobertura 28 tanto 221 tarifa eléctrica 28 sector público
30 liquidez 29 forma 224 déficit comercial 29 director general
31 empresa 30 datos 235 banco central 30 fondo de rescate
32 margen 31 hecho 239 déficit estructural 31 sector privado
33 tarifa 32 plan 244 interés marginal 32 a corto plazo
34 entidades 33 bce 245 reforma laboral 33 población activa
35 productos 34 capital 249 renta básica 34 zona del euro
36 flujo 35 comisión 261 moneda común 35 mercado de trabajo
37 costes 36 dinero 266 base imponible 36 gasto público
38 banca 37 fondo 267 saldo vivo 37 secretario de estado
39 datos 38 huelga 58 crisis de deuda 38 producto interior bruto
40 ajuste 39 cuenta 59 mercado de valores 39 consejo de administración
41 beneficio 40 plazo 65 rueda de prensa 40 reformas estructurales
42 norma 41 primera 81 compra de deuda 41 tipo de interés
44 renta 42 objetivo 96 cuota de mercado 42 actividad económica
45 cet 43 tiempo 98 encuesta de población 43 mercado de valores
46 precios 44 política 103 fondo de rescate 44 proyecto de ley
47 efecto 45 banca 112 títulos de deuda 45 fin de semana
48 fin 46 rescate 114 agencia de calificación 46 medio plazo
49 letra 47 tasa 138 ratio de deuda 47 moneda única
50 cuentas 48 sistema 141 términos de contabilidad 48 agencia tributaria
51 balance 49 precios 144 objetivo de déficit 49 comisión nacional del mercado de valores
52 bolsa 50 embargo 145 déficit de tarifa 50 mercados financieros

Tabla 4: resultados de la extracción y detección de términos

La tabla muestra diferencias en ambas técnicas relacionadas no solo con la selección distinta de unidades, sino también con su ordenación. También llama la atención que, en el caso de la extracción terminología, el sistema solo devolvió dos candidatos a término poliléxicos dentro de los primeros cincuenta resultados: deuda pública y gasto público. Por lo que se refiere a la terminología monoléxica, apreciamos que son pocos los candidatos y términos que aparecen en ambas técnicas: deuda, riesgo, precio, cuenta, dato, fondo, banco, sistema, empresa y banca, de los cuales, tan solo deuda se sitúa prácticamente en el mismo orden. En cuanto a la terminología poliléxica, vemos que son más las unidades coincidentes (deuda pública, gasto público, fondo monetario, moneda única, población activa, sistema financiero, producto interior, sector financiero, agencia tributaria, banco central, reforma laboral, mercado de valores y fondo de rescate), si bien su ordenación tampoco coincide. Ambos tipos de unidades pueden relacionarse con diferentes campos o temas económicos, como la macroeconomía, las finanzas, el mercado laboral o simplemente la crisis.

Una vez detectada la terminología y extraídos los candidatos a términos, el problema que se nos presentó consistió en la selección de aquellas unidades que formarían parte de las actividades didácticas. Tal como quedó reseñado anteriormente, tanto una técnica como otra no tienen en cuenta las necesidades específicas de, en nuestro caso, los estudiantes de traducción económica, financiera y comercial. En este sentido, no nos quedó más remedio que decidir, de manera intuitiva, qué términos podrían resultar problemáticos o interesantes para nuestros estudiantes, y más aun teniendo en cuenta que el número total de términos y candidatos a término identificados a partir de ambas técnicas resultó ser bastante elevado. En esencia, nos decantamos por unidades que potencialmente pudieran ser problemáticas desde el punto de vista de la traducción o simplemente ser opacas, que presentaran variación terminológica, además de siglas, eufemismos y metáforas que suelen escucharse en los medios. 

La siguiente tabla muestra las unidades que finalmente seleccionamos para crear las actividades que presentamos en el apartado siguiente. La tabla también compara dicha selección con la posición en la que cada unidad aparecía en los resultados de ambas técnicas. La primera columna contiene la unidad en cuestión. La segunda, el tipo de actividades (véase el apartado siguiente) en la que incluimos cada unidad. La tercera columna hace alusión a la posición en la que el sistema de extracción automática de candidatos a términos colocó cada unidad (en caso de que la unidad no hubiera sido extraída, aparece no extraído). Por último, la cuarta columna hace lo propio con la detección de términos (en caso de que la unidad no hubiera sido detectada, aparece no detectado):

UNIDAD ACTIVIDAD EXTRACCIÓN DETECCIÓN
a corto plazo traducción 46471 31
activos variación denominativa|colocaciones 2465 751
activos adjudicados colocaciones 20808 no detectado
activos bancarios colocaciones 1845 352
activos dañados colocaciones 4092 no detectado
activos de riesgo colocaciones 177 no detectado
activos del ladrillo colocaciones 38917 no detectado
activos dudosos colocaciones 7178 574
activos estratégicos colocaciones 5806 no detectado
activos financieros colocaciones 1053 no detectado
activos inmobiliarios variación denominativa|colocaciones 217 no detectado
activos intangibles colocaciones 24527 no detectado
activos materiales colocaciones 61673 no detectado
activos problemáticos colocaciones 748 no detectado
activos tóxicos colocaciones 104 no detectado
alimentar metáforas 73258 1126
amnistía fiscal conceptos 497 55
amortización variación conceptual 2487 786
anclados metáforas 23959 495
año fiscal variación denominativa 4480 353
apetito metáforas 16715 582
arbitraje conceptos 77 421
ataca metáforas 11376 1131
aumento de capital conceptos 5560 74
balanza comercial conceptos 2161 220
balanza de pagos conceptos|traducción 1954 200
banca privada variación conceptual 5392 152
BCE siglas 24286 33
bolsa variación denominativa 52 59
boyante metáforas 52173 397
caja variación conceptual 994 162
capital variación conceptual 6520 34
CEOE siglas 543 196
CNMV siglas 47641 357
cobertura conceptos 29 361
colocar traducción 59693 523
concurso de acreedores conceptos 68696 91
contribuyente traducción 47846 577
crecimiento cero eufemismos 68297 1495
crecimiento negativo eufemismos 2314 26
crédito hipotecario conceptos 2446 368
cuota traducción 22 250
dación en pago conceptos|traducción 332 73
deducción fiscal conceptos|variación denominativa 3904 330
demanda nacional traducción 49909 124
desgravación variación denominativa 9010 1362
desgravación fiscal traducción 10604 no detectado
deuda conceptos 1 2
deuda pública conceptos|variación denominativa 7 10
deuda soberana variación denominativa 190 no detectado
deuda tributaria traducción 4994 301
devaluación competitiva eufemismos 34000 798
economía sumergida conceptos 31943 70
ejercicio fiscal conceptos|variación denominativa 4193 170
enemigo metáforas 50416 1796
euro variación denominativa 1007 15
evasión de impuestos variación denominativa 4011 904
evasión fiscal conceptos|variación denominativa 1744 130
expediente de regulación de empleo eufemismos 8589 109
FED siglas 1123 644
FGD siglas 492 652
flexibilidad eufemismos 6362 293
FMI siglas 283 73
fondo de rescate traducción 103 30
fondos variación conceptual 83 335
fraude fiscal traducción 3192 82
fuga de cerebros conceptos 14131 384
gasto público conceptos 43 37
gastos colocaciones 55 651
gastos (aumentar) colocaciones 6837 no detectado
gastos (controlar) colocaciones 20044 no detectado
gastos (cortar) colocaciones no extraído no detectado
gastos (elevar) colocaciones no extraído no detectado
gastos (frontar) colocaciones no extraído no detectado
gastos (limitar) colocaciones 45470 no detectado
gastos (racionalizar) colocaciones 46066 no detectado
gastos (recortar) colocaciones 534 no detectado
gastos (reducir) colocaciones 945 no detectado
gastos (restar) colocaciones no extraído no detectado
hacienda traducción 11882 100
hogar traducción 16865 719
ICO siglas 37938 670
impacto metáforas 9412 173
indemnización por despido traducción 8490 100
índice de precios al consumo conceptos 15216 440
INE siglas 62536 346
intervenir variación conceptual 69108 631
IPC siglas 36873 431
IRPF siglas 60943 226
IVA siglas 349 167
jubilación variación conceptual 1947 461
ladrillo variación denominativa|traducción 7943 88
liquidación variación conceptual 1922 561
liquidez conceptos 30 142
mano de obra traducción 5079 126
mercado bursátil variación denominativa 5623 392
mercado de la vivienda variación denominativa 29527 238
mercado de trabajo variación denominativa 228 35
mercado de valores variación denominativa 59 43
mercado inmobiliario variación denominativa 751 533
mercado laboral variación denominativa 278 211
moderación salarial eufemismos 10975 262
moneda única variación denominativa 54 47
navegar metáforas 78752 578
nivel de vida traducción 862 263
novación conceptos 16224 1852
números rojos conceptos 2502 61
OCDE siglas 1489 503
oferta variación conceptual 89 171
paquete de medidas eufemismos 471 127
paraíso fiscal conceptos 4474 454
parqué variación denominativa 1774 99
participación variación conceptual 3639 174
PIB siglas 236 22
plan de ajuste eufemismos 214 32
pleno empleo conceptos 41325 282
población activa conceptos 63 33
política económica conceptos 45517 52
prevención metáforas 14708 1186
prima de riesgo conceptos 46214 5
producto interior bruto conceptos 1819 38
puerto metáforas 35551 75
puesto de trabajo traducción 870 86
querella conceptos 38305 671
quiebra conceptos 67915 229
quita de deuda griega traducción 10594 256
ratio conceptos 15 621
recesión traducción 378 70
recuperación traducción 1607 137
recurso de casación conceptos 8540 714
recurso de reposición conceptos 8470 715
reformas estructurales eufemismos 2160 40
refugio metáforas 37838 40
rendimiento variación conceptual|traducción 392 493
renta fija conceptos 308 102
renta variable conceptos 300 83
retribución traducción 993 430
riesgo conceptos 2 26
riesgos colocaciones 17 320
riesgos (afrontar) colocaciones no extraído no detectado
riesgos (asumir) colocaciones no extraído no detectado
riesgos (conllevar) colocaciones no extraído no detectado
riesgos (correr) colocaciones no extraído no detectado
riesgos (cubrir) colocaciones no extraído no detectado
riesgos (disminuir) colocaciones no extraído no detectado
riesgos (diversificar) colocaciones no extraído no detectado
riesgos (minimizar) colocaciones no extraído no detectado
rumbo metáforas 34773 1264
salario variación denominativa 131 221
salario mínimo traducción 43808 56
saldo variación conceptual 4603 466
saneadas metáforas 30210 467
saneamiento traducción 199 341
seguro de desempleo conceptos 295 230
solvencia conceptos 94 324
subrogación conceptos 18875 1899
sueldo variación denominativa 106 218
superávit traducción 2215 393
suscribir variación conceptual 77420 1473
suspensión de pagos conceptos 302 51
tasa variación conceptual 437 47
tasa de actividad conceptos 1983 267
tasa de desempleo variación denominativa 293 60
tasa de paro variación denominativa|traducción 359 13
tipo de interés conceptos 922 41
tipo impositivo traducción 18705 290
tipo variable traducción 1820 737
títulos variación denominativa 669 579
turbulencias metáforas 12907 870
valor colocaciones 4 62
valor absoluto colocaciones 8261 62
valor añadido colocaciones 1014 115
valor bancario colocaciones 39333 115
valor bursátil colocaciones 1256 471
valor catastral colocaciones 1158 135
valor contable colocaciones 513 293
valor de adquisición colocaciones 971 no detectado
valor de tasación colocaciones 452 244
valor negociable colocaciones 58139 570
valor nominal colocaciones 851 199
valor patrimonial colocaciones 1463 199
valor real colocaciones 197 136
valor total colocaciones 842 140
vencimiento traducción 225 494
ventas colocaciones 27 83
ventas (aumentar) colocaciones 3612 no detectado
ventas (bajar) colocaciones 3666 no detectado
ventas (caer) colocaciones 351 no detectado
ventas (crecer) colocaciones 24022 no detectado
ventas (descender) colocaciones 3737 no detectado
ventas (repuntar) colocaciones no extraído no detectado
ventas (subir) colocaciones no extraído no detectado

Tabla 5: unidades seleccionadas para la elaboración del glosario

Como se desprende de la tabla, las unidades que escogimos aparecen, en su mayoría, en los resultados que obtuvimos tanto de la extracción como de la detección terminológica. Ahora bien, también seleccionamos diversas unidades (colocaciones, básicamente) que no aparecían en estos resultados y que nosotros mismos identificamos explotando el corpus mediante la extracción de concordancias a partir de diversos términos. En cuanto a los resultados de la extracción de candidatos a término, si bien seleccionamos diferentes unidades de las cincuenta primeras, como deuda, riesgo, valor, deuda pública, ratio, riesgos, cuota, ventas, cobertura, liquidez y gasto público, lo cierto es que también escogimos unidades situadas bastante más por debajo, como alimentar, suscribir o navegar. Ocurre algo similar en el caso de los resultados de la detección de términos: dentro de los cincuenta primeros resultados escogimos unas cuantas unidades de más: deuda, prima de riesgo, deuda pública, tasa de paro, euro, PIB, riesgo, crecimiento negativo, fondo de rescate, a corto plazo, plan de ajuste, población activa, BCE, capital, mercado de trabajo, gasto público, producto interior bruto, reformas estructurales, refugio, tipo de interés, mercado de valores, moneda única, tasa. Sin embargo, también seleccionamos unidades ordenadas mucho más abajo, como subrogación, novación, enemigo o crecimiento cero.

La posición media que ocupan las unidades seleccionadas es, en el caso de la extracción, de 13348, lo que supone aproximadamente un 17 dentro de una escala de uno a cien. Por lo que se refiere a la detección, la posición media, en el caso de los términos monoléxicos, es de 457, y, en el caso de los pluriléxicos, de 242, lo que supone, dentro de una escala de uno a cien, un 21 y un 22, respectivamente:

TÉCNICA/UNIDADES TOTAL POSICIÓN MEDIA ESCALA 1:100
Detección de términos monoléxicos 2182 457 21
Detección de términos pluriléxicos 1114 242 22
Extracción de candidatos a término 80427 13348 17

 

Tabla 6: comparación de los resultados de las técnicas empleadas

A pesar de la simplicidad del cálculo estadístico llevado a cabo para valorar la relación de unidades seleccionadas en relación con las dos técnicas empleadas, las cifras parecen indicar que, si bien no se sitúan en las primeras posiciones, sí que lo hacen dentro del primer 25% de unidades, lo que, a nuestro parecer, da cuenta de la utilidad de ambas técnicas para nuestros propósitos.

4. Actividades

Presentada la metodología que seguimos para identificar la terminología, proponemos a continuación una serie de actividades que, con el propósito de aproximar a los estudiantes al mundo de la economía actual a través de su terminología, puede presentarse en el aula. La concepción de las actividades gira fundamentalmente en torno a la terminología: los conceptos, las denominaciones y las variaciones que ambas pueden sufrir, si bien también tenemos en cuenta otros aspectos, como los relacionados con la formación de términos, su funcionamiento en el discurso y, por supuesto, su traducción. Todos los contextos utilizados fueron extraídos del corpus compilado. Veamos algunos ejemplos de actividades.

En la siguiente captura de pantalla presentamos una tarea relacionada con la terminología desde un punto de vista conceptual. Proponemos a los estudiantes una serie de términos relacionados con distintos temas (finanzas, macroeconomía, crisis, mercado laboral, etc.), así como sus respectivas definiciones. Los estudiantes deben relacionar cada definición con su término correspondiente:

Figura 1

Figura 1: actividad de conceptos

Esta otra actividad tiene que ver igualmente con los conceptos, si bien el foco de atención se centra en la variación que desde este punto de vista sufren los términos. En este ejemplo, presentamos a los estudiantes varios pares de oraciones que contienen en cursiva una misma denominación terminológica. Se trata de que identifiquen los diferentes conceptos a los que hace referencia cada una:

Figure 2

Figura 2: actividad de variación conceptual

Esta otra actividad tiene que ver igualmente con la variación terminológica, aunque, en esta ocasión, con la variación denominativa. En el ejemplo presentamos a los estudiantes diferentes oraciones que contienen todas ellas un hueco. Los estudiantes deben proponer más de una denominación que case con el sentido de la oración:

Figura 3

Figura 3: actividad de variación denominativa

La siguiente actividad, si bien da pie a comentar en el aula igualmente el interés cognitivo de cada unidad, se centra más concretamente en las colocaciones. En este ejemplo presentamos una serie de unidades que pueden asociarse a un término concreto. Los estudiantes deben identificar de qué término se trata en cada caso:

Figura 4

Figura 4: actividad de colocaciones

Esta otra tarea presenta la terminología a partir de un tema algo peliagudo: los eufemismos. A partir de una serie de oraciones que supuestamente contienen un eufemismo, los estudiantes han de proponer un término o una explicación más transparente que ayude al lector a entender el alcance cognitivo de cada expresión:

Figura 5

Figura 5: actividad de eufemismos

Es una realidad que las metáforas están presentes en la prensa económica. Por ello la siguiente actividad pretende introducir al estudiante en el lenguaje metafórico invitándole no solo a identificar en cada una de las oraciones presentadas alguna expresión metafórica, sino también a intentar explicarla neutralizando el lenguaje metafórico:

Figura 6

Figura 6: actividad de metáforas

El siguiente ejercicio está relacionado con las siglas económicas. Aunque de manera descontextualizada, los estudiantes deben identificar los referentes de cada una de ellas:

Figura 7

Figura 7: actividad de siglas

Esta última actividad tiene que ver directamente con la traducción de terminología. Presentamos a los estudiantes una serie de oraciones relacionadas con diferentes ámbitos. Se trata de que traduzcan a la lengua extranjera la terminología que aparece en cursiva:

Figura 8

Figura 8: actividad de traducción

5. A modo de conclusión

Este trabajo ha girado en torno a una de las necesidades que tienen nuestros estudiantes de traducción económica, financiera y comercial: comprender la terminología que, en la actualidad, pueden leer o escuchar en los medios de comunicación españoles. En este sentido, el trabajo ha tenido dos objetivos: por una parte, presentar una metodología que nos sirviera para identificar la terminología económica en cuestión, y, por otra parte, proponer una serie de actividades generadas a partir de dicha terminología que permitiera a nuestros estudiantes, aunque sea de manera parcial, satisfacer sus necesidades.

Por lo que se refiere a este primer objetivo, y más concretamente con la compilación de corpus, la metodología puede emplearse de manera sistemática cada cierto periodo de tiempo con el fin de actualizar los glosarios teniendo en cuenta la evolución no solo de la economía, sino también de su terminología. También puede emplearse para llevar a cabo trabajos comparativos bilingües en otros idiomas. En cuanto a la confección del glosario terminológico a partir de la explotación del corpus, las dos técnicas empleadas, complementarias entre sí, han resultado ser de utilidad, si bien los resultados que ofrecen ambas no pueden satisfacer por completo nuestras necesidades como docentes en la medida en que no están adaptadas a nuestra actividad profesional. En cualquier caso, nuestra selección final de terminología ha respondido a criterios subjetivos, por lo que quizá quepa, en futuros trabajos, conocer por medio de encuestas o de análisis de errores cuál es la terminología que precisan nuestros estudiantes.

Respecto del segundo objetivo, las actividades propuestas pueden variar en forma y contenido según no solo la selección de los términos del glosario o los aspectos terminológicos en los que se desee poner énfasis, sino también según las consideraciones que estime oportunas el profesorado. También pueden complementarse con otro tipo de tareas que contemplen, por ejemplo, el análisis, el resumen o la traducción de textos, y no tienen por qué ser de utilidad exclusivamente para traductores e intérpretes, sino también para estudiantes de economía, estudiantes de español para fines específicos, etc. Asimismo, puede ser conveniente llevar a cabo una investigación futura que explore empíricamente la efectividad de la propuesta docente.

Bibliografía

Baroni, Marco y Silvia Bernardini (2003) “The BootCaT Toolkit. Simple Utilities for Bootstrapping Corpora and Terms from the Web”, http://sslmit.unibo.it/~baroni/Readme.BootCaT-0.1.2.

Cabré, Teresa (2002) “Traducción científico-técnica y terminología: análisis textual y terminología, factores de activación de la competencia cognitiva en la traducción”, in Amparo Alcina y Silvia Gamero (eds.), La traducción científico-técnica y la terminología en la sociedad de la información, 87-105.

Cabré, Teresa (2005) La terminología: representación y comunicación: elementos para una teoría de base comunicativa y otros artículos, Barcelona, Universitat Pompeu Fabra, primera edición de 1999.

Cabré, Teresa; Montané, Amor; Nazar, Rogelio y Gabriel Reus (2010) “Estació Terminus: a Web Application for Terminology and Corpus Management”, Proceedings of TKE 2010 Conference (Terminology and Knowledge Engineering), Dublin, August 12-13.

Campos, Nicolás; Cantera, Jesús; García, Antonio; Espinosa, M.ª Dolores y Ortega, Emilio (2005) Diccionario jurídico-económico: francés-español, español-francés, Granada, Comares.

Chapron, Jean y Pierre Gerboin (2005) Dictionnaire de l’espagnol économique commercial et financier (espagnol-français/français-espagnol), Paris, Presses Pocket.

Corpas, Gloria (2002) “Traducir con corpus: de la teoría a la práctica”, in García Palacios, J. y M.ª T. Fuentes Morán (eds.), Texto, terminología y traducción, Salamanca, Almar: 189-226.

Drouin, Patrick (2003) “Term extraction using nontechnical corpora as a point of leverage”, Terminology, 9, no. 1: 99-115.

Elosua, Marcelino (dir.) (2007) Diccionario LID empresa y economía, Madrid, LID.

Estopà, Rosa (1999) “Eficiencia en la extracción automática de terminología”, Perspectives: Studies in Translatology, 7, no. 2: 277-286.

Ferraresi, Adriano (2009) “Google and Beyond: Web-As-Corpus Methodologies for Translators”, Tradumàtica, 7, http://www.fti.uab.es/tradumatica/revista.

Fuertes, Pedro Antonio (2003) “La relevancia de la labor de documentación en la traducción económica”, in Castaño Miñambres, P. et al. (eds.), La traducción y la interpretación en un entorno global, Villaviciosa de Odón, Universidad Europea de Madrid, CD-ROM.

Gallego, Daniel (2012) Traducción económica y corpus: del concepto a la concordancia. Aplicación al francés y al español, Alicante, Servicio de Publicaciones de la Universidad de Alicante.

Gallego, Daniel; Albaladejo, Juan Antonio; De Las Nieves, David; Delorgne, Nathalie; García, Francisco; Martinez, Patrick; Masseau, Paola; Tolosa, Miguel y Vargas, Chelo (2013) “Reflexiones sobre la formación de traductores e intérpretes en el ámbito económico e institucional”, in Álvarez, J. D. y Tortosa, M. T. y Pellín, N. (coords.), Diseño de acciones de investigación en docencia universitaria, Alicante, Editorial ICE/Vicerrectorado de Estudios e Innovación Educativa, Universidad de Alicante: 1583-1594.

Garnot, Pierre (1987) Diccionario de economía y comercio: francés-español, español-francés, Paraninfo.

Kilgarriff, Adam; Pavel Smrz, Pavel Rychly y David Tugwell (2004) “The Sketch Engine”, Proc Euralex, Lorient, http://trac.sketchengine.co.uk/raw-attachment/wiki/SkE/DocsIndex/sketch-engine-elx04.pdf.

Le Poder, Marie-Evelyne (2012) La crise immobilière en Espagne - Lexique pratique espagnol-français et français-espagnol, Aix-en-Provence, Université de Provence.

Martín, Francisco (2003) Aspectos del léxico económico-empresarial (español-francés; francés-español), Murcia, Universidad.

Nazar, Rogelio y Teresa Cabré (2011) “Un experimento de extracción de terminología utilizando algoritmos estadísticos supervisados”, Debate Terminológico, 7: 36-55.

Nazar, Rogelio; Vivaldi, Jorge y Teresa Cabré (2008) “A Suite to Compile and Analyze an LSP Corpus”, Proceedings of the 6th edition of the Language Resources and Evaluation Conference, http://melot.upf.edu/lrec2008/Nazar_Vivaldi_Cabre_LREC2008.pdf.

Sánchez, Pilar (2003) “¿És la web pública la nova biblioteca del traductor?”, Revista tradumàtica, 2, http://www.fti.uab.es/tradumatica/revista.

Sánchez, Pilar (2004) L’ús de corpus en la traducció especialitzada: compilació de corpus ad hoc i extracció de recursos terminològics, Barcelona, Universitat Pompeu Fabra.

Scott, Mike (2010) “WordSmith Tools 5.0. Software for finding word patterns”, http://www.lexically.net/.

Trybisz, Miroslaw (2002) “Apprendre à comprendre pour apprendre à traduire: cas du langage économique”, in Lewandowska-Tomaszczyk, B. y M. Thelen (eds.), Translation and Meaning 6, Maastricht, Hogeschool Zuyd: 387-393.

Vangehuchten, Lieve (2005) El léxico del discurso económico empresarial: identificación, selección y enseñanza en Español como lengua extranjera con fines específicos, Madrid, Iberoamericana.

Vivaldi, Jorge (2003) Sistema de extracción de candidatos a término YATE: manual de utilización, Barcelona, Universitat Pompeu Fabra.

Zanettin, Federico (2002) “DIY Corpora: the WWW and the Translator”, in Maia, B. et al. (eds.), Training the Language Services Provider for the New Millennium, Porto, Faculdade de Letras da Universidade do Porto: 239-248.

About the author(s)

Daniel Gallego-Hernández is a lecturer in the Faculty of Arts of the University of Alicante in Spain. His research interests include corpus linguistics applied to translation, business translation and translation teaching. His PhD was entitled “Traducción económica y textos paralelos en internet “. He teaches business translation between French and Spanish as well as terminology at his faculty. His publications as an individual include various papers and a book entitled “Traducción económica y corpus”.

Email: [please login or register to view author's email address]

©inTRAlinea & Daniel Gallego-Hernández (2014).
"Elaboración de glosarios económicos con fines docentes:"
inTRAlinea Special Issue: Translation & Lexicography
Edited by: María Sánchez, María Porciel & Iris Serrat
This article can be freely reproduced under Creative Commons License.
Permanent URL: http://www.intralinea.org/specials/article/2033

Go to top of page