Nous models neuronals amb OpenNMT 2.0

Durant 2018 vam publicar i explicar amb detall els nostres models de traducció automàtica basada en xarxes neuronals. Després de temps aprenent, usant els models i provant-los publiquem una nova versió del model fet a partir de les memòries de traducció de Softcatalà. Teniu tota la informació al dipòsit nmt-softcatala de Github.

Novetats principals:

1. La qualitat del nou model (model-sc) mesurada en BLEU ha passat de 30,50 a 42,80. És una salt molt important en qualitat usant exactament els mateixos corpus d'entrenament. La clau ha estat en utilitzar nous models d'entrenament i millors paràmetres. Aquí per exemple teniu un fitxer traduït amb aquest nou model. Cal dir que el model mai ha vist aquesta traducció abans ja que no existeix en català.

2. He simplificat molt les instruccions de com executar els models usant Docker baixant la barrera d'entrada per aquells que els voleu feu servir.

3. Fem servir ja OpenMNT 2.0 i TensorFlow 2.0 (deixant enrere les versions 1.0)

Continuem

jordi | Sunday 08 March 2020 - 1:45 pm | ΒΆ | Default