SISTEMAS DE TRADUÇÃO POR MÁQUINA:
FERRAMENTAS DE AUXÍLIO À TRADUÇÃO

 

Carolina Alfaro [1] e Maria Carmelita P. Dias [2]

 

Resumo: Este trabalho apresenta um breve histórico da evolução da tradução automática, mostrando como a mudança de escopo do texto a ser traduzido por máquina alterou também o tipo de interação e o potencial de auxílio de tais sistemas para a tradução técnica profissional.

Palavras-chave: tradução automática, lingüística computacional, ferramentas de auxílio à tradução, técnicas.

 

Introdução - Breve história e evolução - A tradução por máquina no panorama atual
Ferramentas de auxílio à tradução - Estratégias e exemplos
Um caso prático - Conclusão - Bibliografia

 

 

1. Introdução


Há mais de 50 anos, vêm sendo desenvolvidos sistemas de tradução por máquina. A princípio, esses sistemas eram restritos a entidades de pesquisa ou a empresas e órgãos que os financiavam e usavam em caráter restrito. Como o custo desses sistemas era considerável, poucos usuários fora desse círculo tinham acesso a eles. Além disso, no início do desenvolvimento desses sistemas, os pressupostos e metas estavam muito distantes das capacidades reais das aplicações produzidas, tendo que ser posteriormente repensados.

Nos dias de hoje, a disseminação de informações através da Internet e a comercialização de inúmeros produtos de informática a preços cada vez mais acessíveis fomentou o uso de tais sistemas por usuários leigos. Há usuários das mais variadas línguas que têm acesso rápido a um volume enorme de informações. Não possuindo o conhecimento e a habilidade para verter os textos informativos para seus idiomas, encontram nesses sistemas acesso fácil, velocidade e aparente comodidade.

Acostumados a ler textos traduzidos - e geralmente bem traduzidos - por pessoas experientes, os usuários colocaram sua expectativa diante de tais programas no mesmo patamar. Esperavam textos claros e corretos em suas próprias línguas, com a vantagem adicional da rapidez, pois desta vez a tarefa seria cumprida por uma máquina eficiente. Essas (falsas) expectativas podem ter sido guiadas tanto pelas primeiras idéias que fomentaram a pesquisa e o desenvolvimento dos sistemas de tradução por máquina, nos anos 40, quanto pela divulgação dos sistemas atuais junto ao público leigo. O que se vê, no entanto, é um conjunto de textos que poucas vezes se assemelham àqueles escritos por falantes do idioma. Como conseqüência, a expectativa é totalmente frustrada, visto que não se pode esperar perfeição de um sistema que não é perfeito. De fato, para o usuário leigo, um sistema de tradução automática serve apenas para que ele perceba o assunto do texto na língua estrangeira - nada mais que isso. Contudo, para o usuário que também é tradutor, um sistema de tradução por máquina é uma ferramenta válida e confiável, que pode lhe fazer ganhar tempo e eficiência. Neste artigo, mostraremos como um tradutor humano pode se beneficiar do computador.

topo

 

2. Breve história e evolução


Na década de 40, a tradução automática teria sido a primeira aplicação não numérica proposta para a nova área da ciência da computação [Nirenburg, 1987]. Ela ganhou um grande impulso com o início da guerra fria, sendo patrocinada pelos governos americano e inglês com o objetivo praticamente único de obter informações da inteligência soviética à distância e da maneira mais rápida possível.

De modo geral, partia-se da idéia de que seria fácil calcar o processo computacional em uma técnica humana aparentemente simples [Nirenburg, 1987]. Ambos os pressupostos estavam equivocados: nem a técnica de traduzir é simples nem a sua simulação em um sistema computacional é fácil.

Apesar dos desenvolvimentos feitos nas décadas de 50 e 60, muitos dos quais foram moldando as técnicas de lingüística computacional e inteligência artificial que conhecemos hoje [Mateus et al., 1995], os resultados obtidos continuavam muito aquém das expectativas e a lingüística formal não era capaz de explicar uma série de problemas. Em 1966 foi publicado o relatório ALPAC, da Academia de Ciências Americana, desacreditando a tradução automática e provocando um corte geral de verbas governamentais [Slocum, 1985]. Seguiu-se uma lacuna de 10 anos em que quase todas as pesquisas nessa área foram desativadas.

Os anos 80 trouxeram vários fatores que revitalizaram o interesse pela tradução por máquina: a explosão da informatização, o desenvolvimento e estabelecimento de teorias no âmbito da lingüística formal (principalmente a gramática gerativa) e de teorias com ênfase na investigação semântica e a criação da Comunidade Econômica Européia.

Na área computacional, já muito desenvolvida e evoluindo em progressão geométrica, diversos recursos computacionais deixaram de representar obstáculos à implementação de certos procedimentos básicos. Progredia a inteligência artificial, na qual está incluída a lingüística computacional, dedicada ao processamento informatizado de línguas naturais com base em gramáticas formais de análise e de geração de textos.

Somados a isso, novos conceitos sobre o processo da tradução humana, o surgimento da tradução como disciplina teórica, a especialização dos tradutores, a necessidade de um maior volume de traduções, provocado em grande parte pela Comunidade Econômica Européia, entre outros fatores, abriram um novo espaço para pesquisas em tradução por máquina, que passaram a ser financiadas pela indústria privada e a ser desenvolvidas em paralelo em um grande número de países, principalmente na Europa, com menor destaque nos Estados Unidos e, posteriormente e com grande ênfase, no Japão [Slocum, 1985].

É importante frisar que a cooperação entre máquinas e tradutores humanos partiu também de uma mudança de atitude com relação à tradução humana. Essa alteração gerou parâmetros que servem de base até hoje para desenvolvimentos ligados à tradução na área da lingüística computacional. Por exemplo, quanto mais focalizado e especializado o trabalho de um tradutor, maior o grau de precisão e eficiência que ele tende a atingir. Além disso, recomenda-se que todas as traduções passem por uma revisão posterior, feita por alguém com autoridade para tal, principalmente se a tradução visa à publicação (divulgação de informações). Com relação ao processo tradutório, recentemente passaram a ser altamente valorizados os estágios de decodificação da língua-fonte e de reconstrução do texto na língua-alvo, em vez de pensar-se na tradução primordialmente como a mera transferência de palavras de uma língua para outra.

topo

 

3. A tradução por máquina no panorama atual


Nos dias de hoje, a tradução por máquina se enquadra dentro da área da lingüística computacional, que pode ser definida como uma sub-área da inteligência artificial combinada com a aplicação da lingüística formal (em especial a gramática gerativa de Chomsky). Assim, no que concerne à tradução por máquina, podemos nos basear no quadro abaixo:

Inteligência artificial

+

Lingüística formal
(gramática gerativa)

=

Lingüística
computacional

è

Tradução por máquina
â â â

simulação de processos da inteligência humana por máquinas, incluindo aprendizado, raciocínio, aplicação de conhecimentos adquiridos e auto-correção

número finito de regras/princípios lingüísticos capazes de gerar um número infinito de frases em uma língua e de eliminar um número infinito de frases agramaticais

técnicas computacionais ligadas à análise e geração automática de textos em linguagem natural

Todos os conceitos relacionados a essas áreas constituem alguns dos pressupostos básicos para a pesquisa e o desenvolvimento de sistemas de tradução por máquina. Idealmente, se fosse possível, através de técnicas de inteligência artificial, dotar um computador da capacidade de decodificar um texto em uma linguagem natural, de produzir textos em outra linguagem natural e, simultaneamente, de fazer uso de dicionários e gramáticas abrangentes, ele poderia tornar-se capaz de "traduzir" textos [Santos, 1995]. É claro que essa condição ideal está muito longe de ser alcançada, na grande maioria dos casos sequer constituindo um objetivo concreto, embora muito possa se aproveitar dos sistemas existentes.

A principal dificuldade prática atual reside na dificuldade de implementar em um sistema computacional certos aspectos textuais e discursivos mais complexos ou abrangentes, como ambigüidades, referências anafóricas, etc., não tanto devido às capacidades computacionais (ao menos em termos teóricos) quanto por uma questão de custo-benefício, segundo parâmetros que serão vistos a seguir. Ocorre que, em um grande número de casos, a inserção de uma quantidade de dados (processos, consultas a gramáticas ou a outras fontes de informações, recursos complexos) suficiente para que o sistema desempenhe análises em níveis mais complexos, devidamente esquematizadas pela gramática formal, torna o sistema inviável sob os aspectos de custos para o desenvolvimento dessa aplicação, esforço computacional, tempo de execução, margem de erros, etc. [Santos, 1995].

Atualmente, um sistema de alta qualidade é aquele que produz um texto que permita uma revisão sem grandes problemas e cuja operação completa (desde o seu desenvolvimento e/ou adaptação ao uso até a interação humana e a revisão posterior) ofereça uma boa relação custo-benefício segundo parâmetros ligados a:

Todos esses fatores restringem consideravelmente as pretensões de sistemas de tradução por máquina que visam atingir resultados práticos viáveis. Por exemplo, um sistema pode ser muito rápido e flexível, porém gerar um número de erros tal que a revisão posterior, feita por revisores/tradutores altamente especializados, consuma tanto tempo que o emprego do sistema deixe de valer a pena; por outro lado, um sistema pode fazer uso de recursos altamente complexos, porém seu custo computacional (custo de implementação, requisitos mínimos, tempo gasto, etc.) pode desanimar investidores; ou, ainda, um sistema pode buscar minimizar o índice de revisão posterior empregando restrições nos textos de entrada ou um alto grau de interação humana durante o processo da tradução, o que pode deixar de representar uma economia significativa de tempo ou de esforço pessoal dos tradutores humanos. Um índice de correções considerado aceitável é de 20% de correções (ou seja, 1 correção a cada 5 palavras, na revisão posterior) [Slocum, 1985].

É claro que, quanto maior a interação humana, melhores os resultados qualitativos obtidos, porém maior é o tempo gasto, enquanto que as principais vantagens do computador são a velocidade e a consistência terminológica. Assim, as inúmeras ferramentas de auxílio à tradução existentes buscam atingir a melhor combinação das capacidades humanas e computacionais, de acordo com os objetivos específicos da aplicação.

topo

 

4. Ferramentas de auxílio à tradução


São muitas as ferramentas de auxílio à escrita e à tradução, várias das quais já são comumente utilizadas por grande parte dos profissionais da área de letras ou usuários de computadores, como os corretores ortográficos e gramaticais e dicionários e glossários on-line. Assim como um profissional de letras hoje em dia produz de maneira mais eficiente com o auxílio desses utilitários, muitos tradutores profissionais (principalmente no caso da tradução técnica) que passarem a fazer uso eficiente de ferramentas de auxílio à tradução podem destacar-se com relação aos que ainda realizarem um alto índice de trabalho braçal. O esquema abaixo apresenta diversos tipos de ferramentas de auxílio à escrita e à tradução, em ordem crescente de automação (menor intervenção humana):

(menor automação)
  • corretores ortográficos
  • corretores gramaticais
  • dicionários e glossários on-line
  • bancos de dados terminológicos
  • bancos de dados de estruturas e frases traduzidas
  • bancos de dados temáticos
  • MAHT - Machine-Aided Human Translation (tradução humana assistida por máquina)
  • HAMT - Human-Aided Machine Translation (tradução por máquina com intervenção humana)
  • MT - Machine Translation (tradução por máquina ou tradução automática)
â
(maior automação)

Como já foi dito, quanto maior a automação, maior a velocidade de processamento, porém mais imperfeito o resultado final tende a ser. Como contraponto, há uma ampla gama de ferramentas que não visam desempenhar todo o processo tradutório, mas sim oferecer ao tradutor humano vantagens computacionais. É o caso dos bancos de dados e dos sistemas de tradução humana assistida por computador. As grandes vantagens dessas aplicações são a facilidade e velocidade das consultas e sua possibilidade de atualização [Slocum, 1985; Nirenburg, 1987]. Como exemplo, podemos citar o Déjà Vu, que se constitui basicamente de um grande banco de dados associado a uma interface com o usuário e utilidades de programas da Microsoft, desenvolvido no âmbito da indústria de software e voltado para ela. Ele registra frases traduzidas, estruturando seus componentes, e as recupera quando surgem novas frases semelhantes - ideal para a tradução de novas versões de programas, por exemplo [Translation Journal, 25/12/1997; homepage da Atril].

Os sistemas de tradução que prevêem interação humana em maior ou menor grau (as inúmeras variações de MAHT e HAMT) são hoje os que provavelmente alcançam os melhores resultados, pois permitem a resolução de problemas complexos, como a ambigüidade referencial, além de facilitar a implementação de melhorias no sistema utilizado. Logicamente, é difícil chegar-se a uma solução ideal, existindo uma ampla variedade desses sistemas, cada um buscando chegar à combinação mais eficiente entre as capacidades e vantagens humanas e as computacionais, tendo sempre em vista as aplicações práticas e a relação custo-benefício já abordada.

topo

 

5. Estratégias e exemplos de sistemas de tradução por máquina


Na busca pela eficiência e praticidade dos vários sistemas de tradução por máquina, são empregadas diversas técnicas de lingüística computacional. Abordaremos aqui, rapidamente, a tradução direta e indireta, a existência de um módulo de transferência ou de uma interlíngua e a sublíngua [Slocum, 1985; Tucker, 1987].

A tradução direta é realizada por programas desenvolvidos especificamente para traduzir de uma língua A para uma língua B em um único sentido. Todas as operações são direcionadas para esse par específico de línguas (como a busca de soluções para ambigüidades e peculiaridades da tradução dessas línguas, por exemplo) e baseiam-se sobretudo na análise morfossintática e na consulta a dicionários. Se a sua atuação for devidamente restrita, esses sistemas podem ser bastante práticos e produzir textos com uma margem de erros pequena. Um exemplo de sistema que realiza a tradução direta é o Globalink (com o qual fizemos testes que serão vistos adiante), desenvolvido nos Estados Unidos [Homepage do Globalink]. Ele realiza a tradução totalmente automática ou de maneira interativa (o tradutor humano pode fazer escolhas lingüísticas frase por frase) e é bastante flexível, aceitando inserções em dicionários e gramáticas. Exige revisão posterior e sugere uma preparação do texto de entrada para obter melhores resultados, pois realiza tradução direta e local, ou seja, bastante literal e limitada. Contudo, como será visto, mesmo um programa simples pode ser bastante útil para tradutores profissionais, se devidamente aplicados, economizando um tempo considerável de tradução e consulta a dicionários.

No caso da tradução indireta, a análise da língua-fonte e a geração da língua-alvo constituem processos independentes. Os problemas e peculiaridades de uma língua devem ser resolvidos no âmbito dessa mesma língua, pois ela pode ser a língua-fonte ou alvo de virtualmente qualquer língua. Um sistema que utiliza a tradução indireta deve fazer uso de um módulo de transferência ou de uma interlíngua.

Os sistemas que empregam um módulo de transferência (ou mais de um) geram uma representação estrutural das unidades gramaticais da língua de origem e, a seguir, uma representação correspondente para a língua-alvo, a partir da qual será gerado o texto de saída. O módulo de transferência é específico e uni-direcional para cada par de línguas; porém, por lidar com estruturas gramaticais abstratas de cada língua, pode fazer uso de teorias lingüísticas e abordagens mais abrangentes, às vezes buscando abranger diferentes níveis lingüísticos (como a análise semântica, por exemplo), ao contrário do que ocorre nos sistemas que realizam a tradução direta. O Systran é um sistema que utiliza módulos de transferência, e é um dos mais bem-sucedidos atualmente [Slocum, 1985; Tucker, 1987]. Nos anos 70, a Comissão das Comunidades Européias adquiriu e passou a desenvolver o Systran para a disseminação de informações, para poupar seus sobrecarregados tradutores. Atualmente vários tradutores da Comissão utilizam o sistema em trabalhos de rotina. Seu sucesso baseia-se no uso de dicionários abrangentes porém muito especializados, referentes a um número restrito de áreas técnicas, além de uma seleção rigorosa dos textos a serem traduzidos com o programa. Ele também exige revisão posterior especializada. Além de várias outras aplicações específicas, no final de 1997 o Systran uniu-se ao programa de busca na Internet AltaVista, visando a aquisição de informações em 6 línguas, mantendo todas as funcionalidades do HTML. O serviço pode ser bastante útil, mesmo para o usuário leigo, guardadas as devidas proporções, já que ele deve ser acima de tudo rápido e traduzir todos os tipos de textos, o que impede um aperfeiçoamento em áreas específicas.

Outro recurso para a tradução indireta é a interlíngua, conceito desenvolvido e amplamente utilizado na área da inteligência artificial, baseado em princípios de uma representação conceitual universal, independente de qualquer língua específica. É feita uma representação principalmente semântica da língua de origem através da qual pode-se gerar um texto de saída em qualquer língua. Atualmente está se enfatizando bastante a pesquisa de interlínguas, com o objetivo principal de permitir o desenvolvimento de sistemas realmente multilíngües sem a necessidade da criação de dezenas de módulos de transferência, já que os lingüistas podem se dedicar ao desenvolvimento de módulos de análise e geração na sua língua específica e de codificação e decodificação da interlíngua. Um sistema com altas pretensões que está sendo desenvolvido empregando uma interlíngua é o Eurotra, iniciado na década de 80, financiado por vários países e desenvolvido por lingüistas e especialistas de computação da Comunidade Econômica Européia. Como o interesse é abranger todas as línguas da Comunidade, optou-se por uma interlíngua e suas potencialidades [Slocum, 1985; Tucker, 1987].

Com relação à sublíngua, trata-se de uma linguagem restrita, adaptada às capacidades específicas do sistema; ou seja, o texto de entrada precisa ser preparado para minimizar o trabalho sobre o texto de saída. O uso de uma sublíngua tem como objetivo reduzir o volume de revisão posterior ou mesmo eliminá-la por completo. Logicamente, essa estratégia demanda uma especialização dos profissionais que redigem ou adaptam o texto na língua-fonte para que seja bem sucedida. A vantagem é que, se tanto o assunto quanto as estruturas lingüísticas necessárias forem realmente restritas, faz-se possível um sistema autônomo e automatizado. Poucos sistemas de tradução efetivamente alcançam esse objetivo, sem precisar de alguma intervenção humana. É o caso do TAUM-Méteo, desenvolvido no Canadá, que converte informações meteorológicas do inglês para o francês e vice-versa. Nesse caso, é utilizada uma sublíngua extremamente específica e restrita, sem sequer variações verbais, e o sistema lida perfeitamente com as frases de entrada, enviando a tradução pronta diretamente pela rede [Slocum, 1985; Tucker, 1987].

topo

 

6. Ferramentas de auxílio à tradução: um caso prático


Como foi detalhado ao longo deste trabalho, o uso de programas de tradução automática stricto sensu, para uma revisão posterior ou simultânea do texto traduzido, pode ser altamente benéfico em termos de rapidez e eficiência. A seguir, será apresentado um exemplo de interação entre usuário humano (tradutor) e sistema.

O teste foi feito no programa Globalink, apresentado anteriormente. Foi selecionado um relatório técnico de uma página (cerca de uma lauda literária), em português, na área de informática. A tradução manual foi feita por uma pessoa inglesa, com experiência em versões. Os termos mais técnicos (não existentes em dicionários gerais) foram dispensados, já que o sistema também não possui esses termos e, para fins deste teste, não foram feitas inserções no dicionário ou na gramática, o que leva um tempo considerável e exige um grau razoável de familiaridade com o programa [Alfaro, 1997].

Eis os resultados obtidos com relação ao tempo:

  1. Tradução manual (com uso de editor de texto): 35 minutos + 5 minutos para breve leitura inicial.
  2. Tradução totalmente automática, sem preparação do texto de entrada ou interação humana: entre 40 e 45 segundos. O texto produzido apresentou diversos problemas, de naturezas variadas. Revisão: entre 25 e 30 minutos.
  3. Tradução interativa: entre 15 e 20 minutos. O resultado foi sensivelmente melhor. Revisão: entre 10 e 15 minutos.

Pode-se observar que, ainda que a diferença de tempo entre a tradução humana e a tradução com auxílio do programa não seja radical, nos dois casos de emprego do sistema o tempo de tradução foi ligeiramente reduzido. Vale notar dois pontos importantes: em primeiro lugar, uma familiaridade maior com o sistema, com suas capacidades e com o tipo de texto de saída gerado certamente reduziria o tempo necessário para a revisão, além de permitir a adaptação do texto de entrada, visando solucionar de antemão algumas dificuldades do sistemas. Em segundo lugar, um aumento no volume da tradução acentuaria a economia de tempo. Vejamos:

Considerando o caso da tradução totalmente automática, ela levou, incluindo a tradução e a revisão, entre 25:40 minutos e 30:45 minutos. Esses valores representam, respectivamente, uma economia de 37,5% e 25% com relação ao tempo gasto para a tradução manual. Isso significa que, se o texto contivesse 100 páginas, a tradução manual seria feita em cerca de 66 horas - mais de 8 dias de trabalho -, enquanto que a tradução automática seguida de revisão desempenharia o trabalho entre 43 horas, na melhor das hipóteses, e pouco mais de 50 horas, no pior dos casos, o que representa uma economia de 16 a 23 horas de trabalho - entre dois e três dias.

topo

 

7. Conclusão


Queremos, em resumo, deixar em destaque dois pontos neste trabalho. Em primeiro lugar, a tradução por máquina traz grandes vantagens ao dinâmico, mas sempre custoso, processo de tradução. A decepção que se pode ter diante de um texto traduzido automaticamente decorre de uma expectativa gerada por leigos ou até pelos próprios fabricantes e pesquisadores. Em segundo lugar, em momento algum a necessidade dos tradutores foi questionada. Pelo contrário: desde a adaptação das expectativas com relação à tradução por máquina, ela foi pensada como um auxílio aos tradutores profissionais. A tradução por máquina, principalmente aquela voltada primordialmente para textos técnicos, auxilia o tradutor, não o substitui, visto que esse tipo de tradução, em que predominam um grande rigor vocabular e uma estrutura textual rígida, ainda que em detrimento do estilo, exige grande esforço e especialização dos tradutores humanos, enquanto um computador pode realizar de maneira bastante eficiente a parte mais árdua do trabalho.

De qualquer forma, assim como os tradutores humanos, os sistemas de tradução por máquina buscam resultados mais eficientes através da especialização, da restrição de contextos de trabalho e muitas vezes da própria língua com que se trabalha; exigem revisão humana, seja antes, durante ou após a tradução, não dispensando algum tipo de interação humana especializada em hipótese alguma; e dedicam cada vez mais esforço computacional às questões de análise e geração lingüística. E, cada vez mais, tornam-se fortes aliados dos tradutores profissionais.

topo

 

Referências bibliográficas


Alfaro, C., 1997. Descobrindo, compreendendo e analisando a tradução automática. Monografia de fim de curso, PUC-Rio. http://www.tecgraf.puc-rio.br/~carolina/monografia/

AltaVista Translation Service/SYSTRAN. http://babelfish.altavista.digital.com/cgi-bin/translate

Mateus, M. H. M., 1995. Tradução automática: um pouco de história, in Engenharia da Linguagem. Org. Maria Helena M. Mateus e António Horta Branco. Lisboa, Edições Colibri, 115-120.

Nirenburg, S., 1987. Knowledge and Choices in Machine Translation, in Machine Translation. Org. Sergei Nirenburg. Cambridge, Cambridge University Press, 1-15.

Santos, P., 1995. Tradução automática, in Engenharia da Linguagem. Org. Maria Helena M. Mateus e António Horta Branco. Lisboa, Edições Colibri, 121-128.

Slocum, J., 1985. A Survey of Machine Translation: Its History, Current Status, and Future Prospects, in Machine Translation Systems. Org. Jonathan Slocum. Cambridge, Cambridge University Press, 1-41.

Translation Journal. 25/12/1997. http://accurapid.com/journal/03TM1.htm

Tucker, A. B., 1987. Current Strategies in Machine Translation Research and Development, in Machine Translation. Org. Sergei Nirenburg. Cambridge, Cambridge University Press, 22-41.

Homepage da Atril/Déjà Vu. http://www.atril.com/

Homepage do SYSTRAN. http://www.systransoft.com/

Homepage do Globalink. http://www.globalink.com/

 

topo

 


 

[1] Carolina Alfaro: Tecgraf/PUC-Rio http://www.tecgraf.puc-rio.br/~carolina/; carolina@tecgraf.puc-rio.br; alfaro@uninet.com.br

[2] Maria Carmelita P. Dias: Departamento de Letras, PUC-Rio; mcdias@let.puc-rio.br

 

 


ID: M78853