Criado algoritmo inspirado na Bíblia para revolucionar a tradução automática

A Bíblia é o livro mais lido do mundo e seus preceitos orientam a vida de milhões de pessoas. Mas pesquisadores da Universidade de Dartmouth, em New Hampshire, nos Estados Unidos, colocaram a importância da Bíblia em outro patamar.

Criação do algoritmo

Eles recorreram ao livro mais traduzido da história para criar um algoritmo que pode revolucionar o processo de tradução automática dos computadores.

O algoritmo criado é treinado em várias versões dos textos da Bíblia e pode converter trabalhos escritos em diferentes estilos para diferentes públicos. Em um mundo cada vez mais globalizado, utilizar ferramentas de tradução automática é uma prática comum, principalmente entre idiomas como o inglês e o espanhol.

Entretanto, os textos criados a partir desses sistemas são por vezes imprecisos e trazem construções gramaticais equivocadas.

Esses equívocos acontecem porque há uma grande dificuldade em criar tradutores que mantenham o texto na mesma língua, mas que permitam a transformação do estilo de linguagem.

Por esse motivo, a Bíblia é perfeita para o projeto, já que cada versão dela contém mais de 31 mil versos que os pesquisadores usaram para produzir mais de 1,5 milhão de pares únicos de versículos de origem e de destino, para conjuntos de treinamento de aprendizado de máquina.

A Bíblia, linguagem de todos

O estudo destaca que este não é primeiro conjunto de dados criados para tradução de estilo, mas é a primeira vez que a Bíblia é utilizada.

Nas outras situações foram usados desde textos de Shakespeare até verbetes da Wikipédia, mas o conjunto de dados obtido nem sempre é tão adequado na tarefa da tradução dos estilos.

Em documento publicado pela Universidade de Darthmouth, Keith Carlson, estudante de doutorado e principal autor do estudo explicou que “a Bíblia em inglês tem muitos estilos de escrita diferentes, o que torna o texto fonte perfeito para trabalhar com tradução de estilo”.

De acordo com o estudo, “a redação diferente pode transmitir diferentes níveis de polidez ou familiaridade com o leitor e ser mais fácil de entender para certas populações”.

Processo de pesquisa

A equipe de estudos usou 34 versões da Bíblia, com estilos distintos e variando sua complexidade linguística, desde a “King James Version” até a “Bible in Basic English”.

E os textos foram separados em dois algoritmos: um sistema de tradução automática estatística apelidado de “Moisés” e uma rede neural que é comumente usada em tradução automática, chamada de “Seq2Seq”.

Os resultados da primeira fase do estudo foram publicados na revista científica Royal Society Open Science.

Agora, o próximo passo é a construção de modelos que consigam fazer as traduções e adaptações de modo tão rápido quanto o famoso Google Tradutor.

Segundo fonte de Sempre Família

Login

Welcome! Login in to your account

Remember me Lost your password?

Lost Password