Memòries de traducció: informes de qualitat automatitzats

Durant els darrers mesos hem continuat treballant en millorar el servei de memòries de traducció. Ara mateix tenim 82 projectes amb un corpus de 5,1 milions de paraules.

En les darreres setmanes ens hem centrat amb la generació d'informes de qualitat de forma automàtica. L'enfocament actual és:

  • LanguageTool com a motor de correcció ortogràfica i gramatical.
  • Pology per qualsevol cosa que requereixi tenir en compte l'original, principalment terminologia incorrecta i falsos amics.

El LanguageTool té actualment més de 1.800 regles per detectar errors gramaticals, més els errors ortogràfics. Del Pology estem usant les regles de detecció de falsos amics creades per l'equip de KDE fa uns anys.

Podeu veure per exemple l'informe de qualitat pel VLC

Respecte als informes de qualitat és important tenir en compte dos aspectes:

  • El seu contingut és orientatiu i cal que useu el vostre propi criteri alhora d'aplicar les esmenes que considereu adients.
  • Hi ha i continuarà havent-hi falsos positius.
    • Alguns inherents al nostre camp i són inevitables ja que moltes de frases són molt tècniques (frases com noms de fitxers, frases molt curtes amb etiquetes XML, etc). 
    • Altres són falsos positius de les eines que convé anar esmenant. En aquest sentit per exemple he anat recollint possibles errades i millores al LanguageTool perquè en Jaume Ortolà pugui considerar esmenar-les.

Primers exemples d'ús

Hem començat a utilitzar aquests informes per millorar la qualitat d'alguns projectes de traducció, aquí teniu alguns exemples:

  • En Cubells i en Xavi han estat usant aquests informes per enllestir la traducció de la darrera versió del WordPress i el connector de SEO de Yoast (en Xavi parla al seu bloc)
  • Per la meva part he usat els informes per millorar les traduccions al català de l'Inkscape i de totes les aplicacions del GNOME (he introduït més de 250 esmenes).
  • En Robert Antoni Buj ha usat els informes per millorar la qualitat de la darrera versió de la traducció de Fedora.
  • En Josep Ma. Ferrer ha començat a implementar algunes esmenes al projecte KDE. Trigarà un temps ja que hi ha un bon grapat de fitxers.

Aquesta setmana he compartit a les llistes de Fedora i LibreOffice els informes de qualitat.

Com podeu usar aquests informes?

Si participeu en un projecte de traducció és probable que ja estem produint de forma automàtica els informes de qualitat (els generem per 82 projectes). Si encara no ho fem, podeu demanar-los que afegim el vostre projecte i l'inclourem a la pàgina. Podeu comenar a la llista recursos qualsevol experiència que tingueu amb els informes.

jordi | Wednesday 20 May 2015 - 06:20 am | | Default

Problemes amb el corrector català i l'OS X versió Yosemite

Durant el procés de proves del Catalanitzador de Softcatalà pel Mac OS X amb les darreres versions beta de Yosemite vam observar un problema amb el corrector català que va ser introduir per Apple amb Yosemite.

Problema

A partir de l'OS X versió Yosemite els noms de fitxers dels diccionaris no poden tenir accents.

Si teniu instal·lat un diccionari el qual usi accents als noms de fitxers  i modifiqueu les preferències del sistema a Ortografia el sistema es penja. Ni tan sols funciona reiniciant el Mac.

Solucions

Si voleu instal·lar el corrector en català amb Yosemite:

1. Si useu el Catalanitzador de Softcatalà per a Mac OS X aquest instal·la correctament els correctors.

2. Si l'instal·leu manualment, assegureu-vos que els noms de fitxers dels diccionaris (Català.aff i Català.dic) no porten accent i els instal·leu com a Catala.aff i Catala.dic

Si heu instal·lat els diccionaris amb accents i el sistema que no es pot usar:

1. Recupereu el sistema des d'una còpia de seguretat del Time Machine si el teniu activat.

2. Iniciar el Mac en mode single-user (Command+s al arrancar).

Un cop allà, cal canviar el sistema de fitxers en mode lectura i escriptura introduint les següents comandes:
fsck -yf
mount -uw /

Un cop fet això, cal anar a la carpeta de preferències del sistema i esborrar el fitxer .GlobalPreferences.plist:
cd /Users/EL_TEU_USUARI/Library/Preferences/
rm .GlobalPreferences.plist

Després, per assegurar que no torni a passar, es pot esborrar els diccionaris:
cd /Library/Spelling
rm *.aff
rm *.dic

Reiniciar l'ordinador:
reboot

Si teniu cap informació addicional podeu fer-me-la arribar a jmas@softcatala.org.

Moltes gràcies al Pau Sellés i Garcia, Imanol Muñoz Pandiella iTomas Manzanares Balsells per ajudar-nos a documentar el problema i les solucions.

jordi | Friday 08 May 2015 - 10:13 am | | Default