Novetats a recursos: extracció terminlògica i millores en les memòries de traducció

En els últims mesos he continuat treballant en la automatització de recursos lingüístics de projectes lliures. El que tenim fet té una nova llar: http://www.softcatala.org/recursos/. Es troba en fase de proves.

He continuant treballant en les memòries de traducció. Com a novetats:

  • Es poden cercar cadenes pel terme anglès i català
  • Hem augmentat el nombre de projectes que baixem i processem (un total de 59 projectes)
  • La cerca ignora les tecles de drecera (p. ex.: _Fitxer)

Quan estic traduint, trobo molt útil poder fer cerques a les memòries en 59 projectes per entendre com altres traductors han traduït frases semblants o com en un projecte traduïm cert terme.

La part on he estat treballant més en l'extracció automàtica de terminològica. L'objectiu és deixar de publicar el Recull de Termes i generar-ho de forma automàtica. Tenim ja publicada l'extracció actual per tots els projectes que baixem i pel subconjunt de Softcatalà. He integrat la terminologia oberta del TERMCAT el que ens permet a més indicar quines formes són les recomanades (color verd) pel TERMCAT.

A part de ser un recull de termes, l'extracció automàtica ens està ajudant a detectar errades de traducció i inconsistències terminològiques en diferents projectes que hem anat esmenant.

Si teniu cap suggeriment o comentari us podeu passar per la llista recursos on coordinem el desenvolupament. Tot el codi font el teniu al projecte translation-memory-tools del Github.

jordi | Saturday 03 May 2014 - 1:41 pm | | Default