Novetats a recursos: extracció terminlògica i millores en les memòries de traducció
En els últims mesos he continuat treballant en la automatització de recursos lingüístics de projectes lliures. El que tenim fet té una nova llar: http://www.softcatala.org/recursos/. Es troba en fase de proves.
He continuant treballant en les memòries de traducció. Com a novetats:
- Es poden cercar cadenes pel terme anglès i català
- Hem augmentat el nombre de projectes que baixem i processem (un total de 59 projectes)
- La cerca ignora les tecles de drecera (p. ex.: _Fitxer)
Quan estic traduint, trobo molt útil poder fer cerques a les memòries en 59 projectes per entendre com altres traductors han traduït frases semblants o com en un projecte traduïm cert terme.
La part on he estat treballant més en l'extracció automàtica de terminològica. L'objectiu és deixar de publicar el Recull de Termes i generar-ho de forma automàtica. Tenim ja publicada l'extracció actual per tots els projectes que baixem i pel subconjunt de Softcatalà. He integrat la terminologia oberta del TERMCAT el que ens permet a més indicar quines formes són les recomanades (color verd) pel TERMCAT.
A part de ser un recull de termes, l'extracció automàtica ens està ajudant a detectar errades de traducció i inconsistències terminològiques en diferents projectes que hem anat esmenant.
Si teniu cap suggeriment o comentari us podeu passar per la llista recursos on coordinem el desenvolupament. Tot el codi font el teniu al projecte translation-memory-tools del Github.