Google vol reduir les barreres idiomàtiques

En els darrers dies alguns mitjans (Washington Post, Yahoo News, etc) s'han fet ressò dels esforços que està duent Google en l'àmbit de la traducció automàtica.

Els principals sistemes de traducció en producció avui en dia són els basats en anàlisis gramatical i en transferència morfològica. Els d'anàlisis gramatical acostumen a ser cars i complexos de produir, incloent-hi la codificació completa de gramàtiques, i lents d'execució. De traductors que usin aquest mètode tenim per exemple el de Translendium (abans Comprendium). Els sistemes de transferència morfològica són més senzills i barats de produir (no fan anàlisis gramatical) i acostumen a ser molt més ràpids, però en general, donen resultats més modestos. Tenim per exemple el traductor del Periòdico, l'Internostrum o el lliure d'Apertium. Cal dir que la majoria d'aquests traductors combinen en menor o major grau mètodes dels altres sistemes.

Google està apostant per un sistema basat en anàlisis estadístic donant un enfocament matemàtic al problema. No es requereixen gramàtiques ni diccionaris però són necessaris corpus molts grans de textos traduïts per tal de poder construir el sistema. Google utilitza un corpus format per milers de documents traduïts en diverses llengües de la Unió Europea i les Nacions Unides. El sistema de Google sembla estar donant molt bons resultats per parells de llengües com l'àrab i l'anglès. A dia d'avui Google ofereix traducció automàtica basada en sistemes estadístics a través de la seva web per el xinès, el rus i l'àrab. La resta de llengües que ofereixen és mitjançant la tecnologia llicenciada a Systrans.

Serà fantàstic que Google integri sistemes de traducció automàtic d'alta qualitat i esperem tingui en compte, com sovint fa, les llengües minoritzades. Però, fins que no hi hagi un gran avanç a la ciència, res podrà reemplaçar una traducció feta per una persona.

jordi Tuesday 03 April 2007 - 1:57 pm | | Default

No comments

(optional field)
(optional field)

Remember personal info?
Small print: All html tags except <b> and <i> will be removed from your comment. You can make links by just typing the url or mail-address.