Torna a la pàgina principal

15 Set. '07 - 560 W, 1 ICotig: el corrector ortogràfic i gramatical lliure en català

Al novembre del 2005 vaig fer-me ressò des d'aquest bloc que la Generalitat de Catalunya havia licitat un servei per al desenvolupament i implantació d’un corrector gramatical i ortogràfic per a la llengua catalana amb un pressupost màxim de 270.000 euros. El desenvolupament s'hauria de finalitzar com a màxim 11 mesos després de la formalització del contracte. El plec de clàusules contenen detalls tècnics i administratius.

Al febrer del 2006 Josep Bargalló ho anunciava públicament en roda de premsa indicant que el projecte havia estat adjudicat a la Universitat Pompeu Fabra. Finalment, el projecte s'ha desenvolupat des de el GLiCom, el Grup de Lingüística Computacional de la UPF.

Passats els 11 mesos no es va saber res i de fet la Generalitat, fins el que jo sé almenys, no ha fet cap anunci públic. Al juny d'aquest any vaig preguntar també a la llista admpub de Softcatalà però les meves paraules van caure en el buit més absolut.

Tafanejant aquests dies he trobat que el corrector està publicat de fa temps a LaFarga. Podeu descarregar el codi del dipòsit Subversion o bé descarregar un fitxer comprimit amb la imatge. El dipòsit té 176 revisions, que són molt poques per un projecte d'aquesta mida, el que indica que el projecte es va pujar un cop ja estava força desenvolupat.

Aquest és un llistat dels directoris des de l'arrel del subdirectori source al Subversion:
conversormodelTag    CotigForms     CotigTest            evaluaciócotigchooser
CorrectorWeb CotigGram CotigTypo ExecCotigChooser
CorrectorWebService CotigLabeler CotigVersionControl Grammars
CotigBreaker CotigMain CotigWeb InstallerLinux
CotigChooser CotigMozilla CotigWebService InstallerMac
CotigChooser2 CotigMSOffice CotigWin InstallerWin
CotigConfig CotigMulti CotigXML Misc
CotigDict CotigOOo DebugCotigChooser NGenCorrector
CotigEditor CotigServer Dictionaries parserHTML
CotigEmacs CotigShared Docu
CotigEval CotigSpell EditorPerl

El corrector està preparat per a funcionar com a servei web i disposa de scripts per a construir instal·ladors per a Mac, Windows i Linux. S'han desenvolupat les extensions perquè funcioni amb Mozilla, Microsoft Office i OpenOffice.org, tal com es demanava als plecs tècnics de la licitació

Al subdirectori Docu de la distribució hi ha un bon grapat de documents tècnics, lingüístics i de coordinació de l'equip de treball de desenvolupament que ajudar a entendre una mica millor aquest sistema.

El servidor i les parts principals han estat desenvolupades amb C# i Microsoft .Net. De fet, hi ha els fitxers de projecte de Visual Studio 2005 (els fitxers amb extensió sln). Sota Linux cal Mono per tal de poder-lo executar. Jo no ho he aconseguit. Em temo que requereix una versió anterior de Mono a la meva i no tinc temps per desmuntar tot l'entorn de desenvolupament de Mono per fer les proves. Amb Windows finalment he aconseguit provar-ho usant l'extensió per a Firefox i iniciant el servidor:


Caldrà veure si la Generalitat ho presenta públicament i explica una mica els plans de futur que té per aquesta eina, especialment en quant a continuar-ne el desenvolupament i millorar la instal·lació i documentació actuals. Si es deixa el desenvolupament en aquest punt, caldrà invertir-hi força hores per entendre tota aquesta infraestructura i per empaquetar-la d'una forma raonable per a usuaris finals.


Si feu proves o us baralleu amb aquest codi feu-me saber els vostres avanços.

Notes: La UPF té una pàgina pel corrector. Veure http://parles.upf.es/corrector/. En Marc Belzunces també en parla.

Traducción automática | Traduce este apunte del catalán al castellano
Serà una bona notícia que puguem disposar d’un corrector lliure gramatical. El programari lliure és ideal, però projectes d’aquesta envergadura és difícil imaginar-los sense algú que faci una gran aposta inicial.

Pandinosauria - 16 Setembre '07 - 00:09

Que dolent que és.
Escrius “habia” i et proposa “avia”. Es que no coneix la forma verbal “havia” ?.
No corregeix els proms febles.

jp - 22 Setembre '07 - 15:56

Si escrius “de debò”, no reconeix “debò”

Enric I. Canela (Email) - 23 Setembre '07 - 23:36

Em sembla molt bé que corregeixi errades de concordança, per exemple, cosa que no fa el corrector d’Open Office. Algú sap si en principi és el mateix, si s’ha de treure primer el d’OOo o quin seria el procediment – i si realment és millor que el que ja hi és integrat?

Quim - 24 Setembre '07 - 14:40

vull provar-ho amb aquest text,.

joan (Email) - 25 Setembre '07 - 23:17

Problemes a l’hora de desinstal·lar-lo: Els vincles a OpenOffice i MS Word no es treuen, la icona del Corrector encara hi apareix tot i ser desinstal·lat. A més no corregeix molts errors ortogràfics i proposa correccions absurdes en comptes de les opcions lingüísticament més properes.

Quim - 26 Setembre '07 - 18:05

Heu probat textos llargs? en linux i una maquina petita li costa un xic.
En linux i mono 2.2.1 em funciona correctament.
Heu trobat en algun lloc com especifiquen les regles gramaticals??

Marc (Email) - 17 Octubre '07 - 12:57

  
Recodar la informació personal?

Emoticons / Textile
  (Registrar nom d'usuari / Entra)

Notifica:
Hide email:

Small print: All html tags except <b> and <i> will be removed from your comment. You can make links by just typing the url or mail-address.