miércoles, 5 de enero de 2011

Corpus de textos: parece más complicado de lo que es

¡Hola a tod@s!


En esta nueva entrada me gustaría destacar el papel de los corpus de textos en la labor de traducción, y es que a veces tratamos con ellos sin darnos cuenta.


Los corpus son colecciones de textos recogidos según unos criterios determinados para ser utilizados con unos propósitos específicos, y en un formato legible por el ordenador (cuando hablamos de herramientas de traducción asistida o automática). Su principal utilidad es que ayudan a establecer la frecuencia de los términos en textos y así decidir si el uso de un término concreto en un contexto dado es pertinente o no. Citando a Austermühl (2001), Internet es en sí mismo un megacorpus que todos hemos utilizado alguna vez para conocer la frecuencia de una palabra y para saber cómo usarla.


Si bien existen páginas como el CREA y el CORDE, que abarcan la lengua de forma general, otras como EUR-Lex nos facilitan el acceso y la búsqueda en las páginas oficiales de la UE. Es más, con la herramienta de visualización bilingüe podemos ver de forma simultánea un texto oficial (sentencias, acuerdos, normativas,...) en dos idiomas.


Para el que disponga de algo de presupuesto, existen herramientas como Multiconcord, un programa que establece concordancias entre textos de diferentes idiomas, para así permitir la búsqueda de palabras o frases en grandes cuerpos de texto, además de detectar y analizar las palabras de los ítems seleccionados.

No hay comentarios:

Publicar un comentario