traduccion

Introducción

La idea de utilizar ordenadores para traducir lenguajes naturales se propuso por primera vez en la década de 1940 y las primeras investigaciones comenzaron hacia la de 1950. Los traductores humanos han considerado este desarrollo bien con desprecio, o bien con miedo. Han rechazado la idea de que cualquiera podría creer que la traducción podría ser mecanizada, o han temido que las maquinas releven totalmente su profesión.

Hoy en día, se usan mucho los programas de ordenador para automatizar el proceso de traducción. Aunque se ha progresado bastante en el mundo de la traducción por máquinas, las traducciones completamente automáticas están muy lejos de ser perfectas. Sin embargo, hay países en continuo gasto de millones de dólares en variados programas de traducción automática. El desarrollo de los sistemas de traducción automática han motivado a realizar un gran número de investigaciones, impulsando, de esta manera, a muchos investigadores a buscar métodos fiables para la calidad de la evaluación de traducciones automáticas.

La traducción es un reto intelectual, y, por lo tanto, es muy normal el escepticismo acerca de la posibilidad de usar un ordenador para la traducción automática. Sin embargo, los creadores de los sistemas de traducciones automáticas se han encargado de dotar sus sistemas de técnicas de comprensión, y las máquinas traductoras ahora pertenecen a la clase de programas de inteligencia artificial.

La traducción automática

En las últimas décadas, los lingüistas, traductores y otros científicos llevaron a cabo investigaciones en torno a las posibilidades de la traducción automática –el término traducción automática significa la traducción de textos de una lengua a otra con la ayuda de ordenadores y editores de texto sin la intervención del factor humano, obviamente, la inserción de texto se hace mediante asistencia humana pero el proceso de traducir se hace únicamente mediante ordenador – y este estudio sistemática llevó a la creación de sistemas de máquinas de traducción. Sin embargo, los esfuerzos que hicieron los científicos con respecto a los resultados del uso de la máquina de traducción no son absolutos. Es cierto que se ha realizado progreso en este campo pero no se efectuaba al ritmo que esperaban. Los resultados de la máquina de traducción son escasos en calidad, nivel de precisión e inteligencia.

Historia de la traducción automática

Aunque las primeras ideas de la traducción automática se encontraron en textos científicos del siglo XVII, las primeras propuestas prácticas se hicieron en el siglo XX y más específicamente en 1933, cuando apareció a la vez en Francia y Rusia patentes para la fabricación de diccionarios mecánicos. Más tarde, en 1947 científicos de la criptografía, como Booth y Weaver, propusieron la utilización de ordenadores, que se habían inventado recientemente, para la traducción automática entre dos lenguas (Hutchins 1997). De hecho, Weaver en el mismo año como directos de la Fundación Rockefeller grabó en un memorándum sus propuestas para la eliminación de la ambigüedad, utilizando su conocimiento en criptografía, en estadísticas y lógica. El memorándum de Weaver (1949) fue en Estados Unidos los comienzos de la investigación en traducción automática. El desarrollo y la implantación de los primeros sistemas comenzaron a mediados de los 50. Desde entonces, el sondeo para la traducción automática mostró muchas variaciones y dividió a la historia en cuatro periodos (Kubler 2007).

1950-60:

Los estudios de los 50 se caracterizaron por un gran optimismo ante resultados esperados (Hutchins 1986, 1997). La primera generación de sistemas de traducción fueron aproximaciones de traducción directa, sistemas ausentes de cualquier tipo de proceso intermediario. Inicialmente el texto de la lengua de origen se somete a un simple análisis morfológico y luego se lleva a cabo una búsqueda en un diccionario normal bilingüe para los equivalentes de traducción de cada palabra. El texto final en la lengua de destino aparece a través de la aplicación de la reorganización de algunas leyes regionales que coloca las palabras en el orden correcto. El primer sistema de traducción automática lo presentó IBM en Estados Unidos en 1954 y atrajo la atención de investigadores. Para este experimento, se tradujo una minuciosa muestra selecta de 49 propuestas en ruso al inglés, con el uso limitado de un diccionario de 250 palabras 6 normas gramaticales. Aunque el sistema tenía poco valor científico, el resultado de la traducción fue bastante sorprendente para promover la financiación en los Estados Unidos. A causa de la guerra fría, los esfuerzos en los años siguientes se centraron en la traducción del par de idiomas Ruso-Inglés con textos, principalmente, científicos y técnicos. La calidad de las traducciones generadas podían no ser suficiente para la comprensión del texto, pero sí suficientes para identificar si fue importante enviar un traductor para la traducción.

1966:

A mediados de los 60 este ambiente positive cambia drásticamente. La traducción automática se convierte en el centro de muchas críticas y constante cuestionamiento. Esto se debe principalmente a un informe de evaluación que redactaron el comité de expertos ALPAC (Comité Asesor de Procesamiento de Lengua Automatizada) en 1966, establecido por la Academia Nacional de Ciencias de Estados unidos. Según el informe, las grandes cantidades que gastó el gobierno estadounidense no produjo los resultados deseados, porque los sistemas creados fueron lentos y generaron traducciones de baja calidad. La razón por la que fallaron se resume a las grandes expectativas que habían creado, a pesar de que no había antecedentes teóricos básicos e infraestructura técnica adecuada. El informe concluye que la búsqueda debería centrarse en la edición del lenguaje natural (Procesamiento de Lenguaje Natural (NLP)) y separarse de aplicaciones relacionadas exclusivamente con la traducción. El informe de ALPAC ha reducido los fondos de la investigación en el campo de la traducción automática en Estados Unidos y en otros países durante al menos una década, pero a la vez aumentó el esfuerzo en campos como la lingüística computacional y la inteligencia artificial, áreas que formaron la bases teoréticas para sistemas modernos. Uno de los pocos sistemas de traducción automática que sobrevivió a la crisis provocado por el informe fue el Systran (1970), que se desarrolló por la compañía trabajadora para la Fuerza Aérea de Estados Unidos, para traducir grandes cantidades de documentos científicos y técnicos rusos durante la Guerra Fría. Las traducciones solían aproximarse, pero suficientes para una dura comprensión del contenido. El éxito del sistema llevó a la Comisión Europea a comprar una versión Anglo-francesa del sistema, que permitió a los sistemas la traducción de más pares de lenguas de la Unión Europea.

1970-80:

Principalmente después de 1970, el uso de los sistemas de traducción automática para las organizaciones internacionales y empresas privadas estaba muy extendido, mientras que en los años 80 creció la búsqueda de la traducción automática, sobretodo en Canadá y Estados Unidos, a partir de la necesidad de la traducción por la existencia de muchas lenguas oficiales. Los nuevos esfuerzos, influenciados por el informe de ALPAC, provoca el estudio de nuevas técnicas que exploten las teorías lingüísticas que se crearon de las herramientas computacionales y de tiempo. La debilidad de los sistemas de traducción directa para usar el léxico correcto y las opciones sintácticas, como se refleja en el informe de ALPAC, llevó a la búsqueda de aproximaciones indirectas. Los sistemas de esta nueva generación de sistemas que pertenecieron a la clase general de sistemas que se basaban en normas siguió una estrategia de proceso de edición en tres fases: análisis, transporte y producción. Uno de los primeros sistemas de transferencia que tuvo éxito se desarrolló en Montreal. El sistema de traducción de informes meteorológicos Météo, que usaba un vocabulario limitado y normas sintácticas, operando con éxito desde 1976 hasta hoy. Además, ahora el interés es más directo en el estudio del análisis y síntesis lingüístico y para la traducción automática con asistencia humana (HAMT).

1990-nuestros días:

En los años 90, las características técnicas de los ordenadores personales mejoró teniendo como resultado paquetes de software en la oficina para integrar sistemas de traducción automática personal, mientras muchas compañías (Trados, IBM) desarrollaron sistemas integrados de puestos de traductor, que combinaba software de procesamiento de texto sofisticado y software de publicación con sistemas de gestión de la terminología y teniendo en cuenta ya textos traducidos. Al mismo tiempo, se desarrolló Internet y aparecieron sistemas de traducción automática, empezando por Systran 1998. En la era moderna prevalece la traducción humana con apoyo online (MAHT), con principal característica el aumento en el uso de la traducción automática y herramientas de traducción.

Es un hecho que se considere ahora la traducción como un paso necesario e intermedio en el proceso de transferencia de la información de una lengua a otra, por todo el planeta. Los usuarios de organizaciones de traducción automática pública y privada ya no son exclusivamente grandes empresas multinacionales que gestionan y producen millones de páginas cada año teniendo instalado sistemas de traducción automática a un ordenador central (servidor). Hoy en día, está disponible la traducción automática para el público general a través de planes de textos y páginas web de traducción automática que están disponibles online. La investigación se centra en desarrollar herramientas que soporten varias lenguas, sistemas de traducción de voz (Alemán, Japonés, Inglés), y la utilización de cantidades de datos textuales de Internet.

Una manera muy común de representar los diferentes sistemas de arquitectura de traducción automática es la traducción triángulo Vauquois (1975).

direct_translation_and_transfer_translation_pyramid_opt

Imagen 1. La representación del triángulo de traducción Vauquois expone varias arquitecturas para la traducción automática (Fuente: Wikipedia).

En conclusión el progreso que se ha realizado desde mediados de los 60 (sistemas de primera generación) es innegable, sin embargo, desde comienzos de los 80 hasta hoy el desarrollo se puede considerar incierto. Es digno de atención que algunos de los principales problemas de la traducción automática quedan sin resolver; determinadas ambigüedades, decisión incorrecta de las palabras de la lengua de llegada, evaluación comparativa, género de pronombres y selección de artículos, quedando las formas estructurales de términos de acuerdo de la lengua de origen de la propuesta, problemas sugerentes que contienen frases subordinadas, etc. De hecho, es extraño como tras 50 años de búsqueda en el área de la traducción automática los sistemas comerciales todavía producen morfología incorrecta, propuestas no adecuadas o coloca verbos al comienzo o final. Es un hecho que hoy una variedad de factores han llevado la tarducción automática a un segundo periodo de prosperidad, que se puede resumir como a continuación (Babouris Triantafyllopoulou & 2012):

Situaciones.

  • El número insuficiente de traductores para el mercado global.
  • La necesidad de rescatar lenguas en peligro.
  • Temas de soberanía relacionados principalmente con el espionaje y guerra contra el terrorismo internacional.
  •  Temas de política migracional relacionada principalmente con la gestión de inmigrantes.
  • La necesidad de lanzamiento simultáneo de un Nuevo product a lo largo t¡y ancho del mercado global.
  • El uso de lenguas controladas mediante editor de textos técnicos.
  • La necesidad de reducir el coste de la traducción.
  • La necesidad de búsquedas en la Web en varios idiomas.
  • La necesidad de compartir información a tiempo real.

Traducción humana

Aunque existen máquinas que pueden hacer traducciones, la traducción humana todavía es la mejor manera de traducir cualquier documento escrito, ya sea libros, documentos legales, manuales, información del producto, páginas web, documentos personales, revistas, cartas y anuncios. Esto quiere decir que los traductores humanos llevan a cabo todo el proceso relacionado con la traducción de texto escrito.

La traducción es un proceso complejo que solo los humanos pueden hacer, porque no es un cálculo científico o una ecuación matemática que se podría programar en una máquina inteligente. El proceso implica el trabajo de un traductor/lingüista profesional, normalmente un hablante nativo o alguien que ha estudiado la lengua de llegada en profundidad. El traductor traducirá el texto original a una versión que recoja el significado y sentido del original utilizando el tono correcto y estilo adecuado para el lector de llega del texto traducido. Por lo tanto, el lenguaje humano no se parece a las ecuaciones matemáticas. El lenguaje humano implica expresiones y en traducción, el contexto con significado y el sentido de las frases tiene que considerarse al escribirlas en otro idioma. No hay tal cosa como un único formato de traducción para un documento. Es responsabilidad del traductor tomar la decisión que asegure la precisión de la traducción, que siempre debe estar sujeta a consideración y revisión profesional y experta, lo que significa control de calidad.

Comparación entre la traducción automática y humana

En este sondeo debería ser aparente que la aplicación de ordenadores para la tarea de traducir lenguaje natural no ha sido y es improbable que sea una amenaza para el medio de vida de los traductores profesionales. Aquellas características con las que el traductor humano puede contribuir siempre seguirán en demanda.  No hay posibilidad, por ejemplo, de que la traducción automática pudiera alcanzar la traducción de textos literarios y legales. Por el contrario para la traducción no natural de textos electrónicos en Internet no hay rivalidad para la traducción automática – los traductores humanos no pueden competir en términos de velocidad, incluso  aunque estuvieran preparados para someterse a traducciones de poca calidad de material efímero.

Por lo que respecta al cuando, es una cuestión de traducir un texto en concreto en un único campo (bien sea científico, técnico, médico, legal o literario). La traducción automática exige la inversión costosa del mantenimiento de un diccionario antigua, la actualización y la cara implicación de una post-edición. Esto se puede justificar solo cuando se traducen grandes cantidades de documentos dentro de un área concreta. Es incluso más justificable si la traducción es a más de una lengua de destino y cuando hay bastantes repeticiones. Para estas tareas, el traductor humano estaría agobiado por la cantidad de trabajo, por la aburrida repetitividad y por la necesidad de mantener una consistencia terminológica. En cambio, el ordenador puede manejar grandes cantidades y mantener consistencia automáticamente. En resumen la traducción automática es perfecta para grandes escalas y traducciones rápidas de documentos técnicos, manuales de localización de software y traducción a tiempo real de informes del tiempo atmosférico. El traductor humano no es (ni será) rival para los textos repetitivos sofisticados lingüísticamente. Además, para el intercambio de información, podrá ser un papel para el traductor humano en la traducción de correspondencia de negocios. Pero para la traducción de cartas personales, los sistemas de traducción automática es más probable que aumente el uso, y, para el correo electrónico y para la extracción de información de páginas web y servicios de información basados en ordenadores, la traducción automática es la única solución viable. Sin embargo, para la traducción oral, en cambio, habrá un mercado constante para el traductor humano. Con toda seguridad no hay posibilidad de que la traducción automática reemplace el intercambio diplomático y de negocios. Aunque hay investigaciones en la traducción a ordenador de consultas telefónicas dentro de campos limitados, y la implantación en el futuro se puede concebir en este campo, para la mayor parte de comunicación telefónica no es probable que se sustituya la traducción humana. Un ser humano puede traducir contexto, humor, ironía, y expresiones idiomáticas, en cambio una máquina no. El resultado es una traducción de gran calidad y lista para la publicación. El contenido que tiene como objetivo cierto público necesita más comprensión del mensaje. Los seres humanos comprenden cuando debe ser literal y cuando adaptar lo que traducen a cierta región, no como las máquinas.

En último lugar, los sistemas de traducción automática están abriendo nuevos campos donde la traducción humana nunca ha llegado: la producción de versiones en borrador para autores que escriben en un idioma extranjero y que necesitan ayuda en la producción de un texto original; la traducción online de subtítulos de televisión, la traducción de información de bases de datos; y sin duda, nuevas aplicaciones que aparecerán en el futuro. En estos campos, como en otros mencionados, no hay amenaza para el traductor humano. No hay duda de que las traducciones automáticas y la traducción humana pueden y podrá coexistir en armonía y sin conflicto.

Traducción a máquina del mercado por sector

aaeaaqaaaaaaaauiaaaajdewmzc1zdyylwjmymqtndcyzi04ntfiltuwyjg5zthmnzcwmq_opt

El gráfico anterior de GrandViewResearch.com destaca los diferentes sectores de Mercado que utilizan la traducción automática en diferentes niveles. El gráfico muestra el crecimiento de usuarios en traducción automática. Los siguientes son los sectores con el uso más alto de traducción automática en cuanto a la cantidad:

  • Automovilístico: Partes cruciales de la comunicación deben traducirse rápidamente y con precisión para los clientes.
  • Informática: El vocabulario y terminología específicos deben aplicarse constantemente a través de todos los canales.
  • Ejército y defensa: Documentos urgentes y traducción precisa es fundamental para los esfuerzos militares y de defensa.
  • Salud: Los físicos necesitan complementos de comunicación para llegar con eficacia a los pacientes y el estudio.
  • Electrónica: La traducción eficiente y económica necesita rapidez para el Mercado.

En conclusión, es muy fácil ver la diferencia entre la traducción automática y la traducción humana y por qué la última es muy importante. Mientras que la traducción automática es más barata que la traducción humana, la traducción automática no es capaz de recoger el verdadero significado del documento. No puede expresar el sentimiento, y la cultura inculcada que expresada por el escritor original y la complejidad de hacer que la traducción se adapte a otra cultura. Esto depende de muchas variables, no solo en cuanto a lenguas y gramáticas sino también en cuanto a tabús, tradiciones, costumbres y creencias que solo un traductor humanos experto y profesional entendería.

Fuentes

  1. W.J.Hutchins: Machine translation: past, present, future. Chichester (UK): Ellis Horwood, 1986.
  2. W.J.Hutchins: ‘Research methods and system designs in machine translation: a ten-year review, 1984-1994’, in: Machine Translation Ten Years On, international conference, 12-14 November 1994, Cranfield University.
  3. Flanagan, M. (1996): “Two years online: experiences, challenges, and trends.” In: AMTA (1996), 192-197.
  4. Arnold, D., Balkan, L., Meijer, S., Humphreys, R.L. & Sadler, L. (1994). Machine Translation: An Introductory Guide. London: NCC Blackwell.
  5. Hutchins, J. (2001). History of MT in a nutshell. A two-page sketch, from the beginnings to the present. [Written 2000-2001, revised November 2005] <http://www.hutchinsweb.me.uk/Nutshell-2005.pdf >
  6. ALPAC (1966). Languages and machines: computers in translation and linguistics. A report by the Automatic Language Processing Advisory Committee, Division of Behavioral Sciences, National Academy of Sciences, National Research Council. Washington, D.C.: National Academy of Sciences, National Research Council, 1966. (Publication 1416.) 124pp.

Fuentes griegas

  1. Σταύρου, Μ. & Τζεβελέκου, Μ. (Επιμ.) (2000). Η μηχανική μετάφραση και η ελληνική γλώσσα. Αθήνα: Καστανιώτης.