Teknologia albisteak
8

Opentrad: Gaztelaniatik euskararako itzulpen automatikoa sarean

Erabiltzailearen aurpegia
Sustatu
2006-05-26 : 10:05

Sarean dago jada euskararekin funtzionatzen duen lehen itzultzaile automatikoaren demo edo probetako bertsioa: Opentrad. Gaztelania lotzen du galiziera, katalana eta euskararekin, baina besteetan ez bezala, euskararen kasuan norabide bakarrean, gaztelaniatik euskarara.

Maiatzaren 30an aurkeztuko da, Bartzelonan, itzulpen automatikoko Opentrad proiektua. Kataluniako Unibertsitate Politeknikoan izango da aurkezpena, goizeko 11:30ean. Transferentzia sintaktikoko sistema da Opentrad, kode irekikoa, gaztelania, katalana/valentziera, galegoa eta euskerarekin erabiltzeko balio duena.

Web orrian duzue ikusgai Opentraden funtzionamendua: testuak, dokumentuak (HTML, RTF eta TXT) eta web orriak itzul ditzakezue. SourceForgeren bidez banatzen dira programa eta datu horiek. Eleka Ingeniaritza Linguistikoa izan da proiektuaren buru, eta beste bi enpresa eta lau unibertsitate hauekin elkarlanean jardun du: : Elhuyar Fundazioa, imaxin|software, Euskal Herriko Unibertsitatea, Vigoko Unibertsitatea, Alacanteko Unibertsitatea eta Kataluniako Unibertsitate Politeknikoarekin. Espainiako Industria, Turismo eta Merkataritza Ministerioaren laguntza izan du proiektuak.

Itzulpen automatikoko proiektua da Opentrad, transferentzia sintaktikoan oinarritua eta kode irekikoa. Gaztelania, katalana/valentziera, galiziera eta euskararekin erabiltzeko balio du. Testuak edo dokumentuak itzultzen ditu Opentradek, baita web orrien edukia ere, haietan nabigatzen ari garela. Hizkuntza-pare hauek badute dagoeneko jarduera-prototipoa:

  • Gaztelania (es) « » Katalana (ca).
  • Gaztelania (es) « » Galegoa (gl)
  • Gaztelania (es) » Euskara (eu) (gaztelaniatik euskarara itzultzen du sistemak, baina ez alderantziz).

Abiadura handiko bi itzultze-motor ditu sistemak, C++-en programatuak biak: transferentzia sintaktiko partzialekoa da bata (Apertium), elkarrengandik hurbilekoak diren hizkuntza-bikoteetarakoa (es-ca, es-gl); bestea, berriz (Matxin), transferentzia sintaktiko osokoa da, elkarrengandik hurbilekoak ez diren hizkuntzetarako egina(es-eu).XMLn gordetzen dira sistemako hizkuntza guztietako datu linguistiko elebakar eta eleaniztunak, modulu-diseinu batekin. Diseinu horri esker, errazagoa da datuen elkarreragiketa eta programa-fluxura integratzea. Kode irekian egina da sistema; hori dela eta, softwarea garatzen duen enpresa orok sartu ahal du Opentrad bere sistemetan. Horixe da, hain justu ere, helburua: zenbait programa eta ingurunetara hedatzea itzulpen automatikoaren erabilera.

Hiru enpresak eta lau unibertsitatek hartu dute parte proiektu honetan, Eleka Ingeniaritza Linguistikoa S.L. buru zela. Elekaz gain Elhuyar Fundazioa eta Galiziako imaxin|software enpresa jardun dira.. Unibertsitateei dagokienez, berriz, Euskal Herriko Unibertsitatea, Alacanteko Unibertsitatea (Valentzia), Kataluniako Unibertsitate Politeknikoa eta Vigoko Unibertsitatea aritu dira Opentrad proiektuan.

2004an ekin zion lanari enpresa- eta unibertsitate-partzuergoak, eta 2006ko lehen hiruhilekoan iritsi dira lehenbiziko emaitzak. Maiatzaren 30ean, asteartea, goizeko 11:30ean, emango da emaitza horien berri, Bartzelonan, Kataluniako Unibertsitate Politeknikoko Aula Master aretoan.

Espainiako Industria, Turismo eta Merkataritza Ministerioak finantzatu du Opentraden zati bat, PROFIT programaren bidez.

Erantzunak

Sustatu
2006-05-26 : 11:18

ItzuL zerrendan testu labur batzuk eman dizkiote jaten makinari, eta emaitzak komentatu ditu batek jada.


Iñaki
2006-05-26 : 12:14

Euskarara ez du ongi itzultzen. Adibide xinpleak:



me gustan las cerezas: gereziak atsegin dituzte



¿si el cielo es azul, por qué la tierra no?



Zerua bada urdina, lurra ez zer?

Joxe Rojas
2006-05-26 : 15:47

Tira, tira, ez gaitezen urduritu! Eman aukeratxo bat sistemari! Kontuan izan beta bertsioan baino ez dagoela, eta ez dela bat ere lan erraza. Ingelesa Tira, tira, ez gaitezen urduritu! Eman aukeratxo bat sistemari! Kontuan izan beta bertsioan baino ez dagoela, eta ez dela bat ere lan erraza. Ingelesa


Joxe Rojas
2006-05-26 : 15:48

Tira, tira, ez gaitezen urduritu! Eman aukeratxo bat sistemari! Kontuan izan beta bertsioan baino ez dagoela, eta ez dela bat ere lan erraza. Ingelesa-Gaztelera itzulpenak egiteko sistemak ere ez dabiltza batere fin, eta urteak dira garatzen hasi zirela!


Elhuyar aldizkariak apirileko 219. zenbakian atera zuen OpenTradi buruzko erreportaia luze eta mamitsua. Bertan, egileek Matxinen erronkak eta hutsuneak aitortzen zituzten, eta etorkizunean, sistema osatzeko itzultzaile automatikoa itzulpen memoria batekin uztartzeko aukera ere aipatzen zuten. Zatitxo bat behintzat hemen irakur daiteke.


Euxebe Portugal
2006-05-30 : 13:31

Esaldi xinple honek, "El día más lluvioso del mes", honatx zein erantzun jaso duen: "Hilaren areago egun euritsuan".

Egia esan, ez dago urduritzeko arrazoirik.

bedilan
2006-05-31 : 14:24

Momentu honetan, opentrad itxita deukie hainbeste bisita direla eta.



Ikaragarria!

Joseba Abaitua
2006-06-01 : 21:29

Zorionak egindako prototiopoagatik eta mila esker kodea irekia uzteagatik.


Emaitzak eskasak izan arren gaurko bertsioan, ez da merezimendua horregatik galtzen. Transfer sintaktikokoa estrategiaren isla da, oso zaila baita egitura sintaktikoa hain urrun duten bi hizkuntzen arteko transferentziak egitea (euskara eta gaztelaniaren artean alegia). Estrategia mistoak beharko dira jarduera suspertzeko, eta hala egingo dute: itzulpen memoriak erantsiko dutela esan dute, estatistika ere aplikatu beharko da, eskura dauden arma guztiak, azken batez.


Gauza jakina da itzulpen automatikoa erronka handia dela teknologiarako, are gehiago tipologikoki oso desberdina diren hizkuntzen artean egiten bada. Baina inportanteena da saioak egiten ari direla ikustea (gogoratu orain dela lau urte beste saio baten berri izan genuela, nahiko emaitz itxaropentsuekin gainera). Prototipo bat egin zen eta teknologiaren bideragarritasuna frogatua geratu zen, orduan.


Oraingo prototipoarekin, nire ustez, teknologia osatu behar dela nabarian geratu da, baina haren bideragarritasuna ere nabarmenki antzematen da. Estaldura lexikala oso zabala dela ziurtatu dute, oinarrizko baliabidek ere prest daudela ikusten da: morfologia, transfer lexikala, transfer sintaktikoa, desanbiguazio semantikoa, etab. Artilleria astuna ondo garatu du IXAk. Orain behar da lehen aipatutako osagarriak gehitzea.


Matxin, OpenTrad eta beste proiektuak ere (ATS, AMETRA ...) ea aurrera eraman ditzagun!


Iñaki Arantzabal (Eleka)
2006-06-02 : 14:45

Sistema egokitzen ari gara eskaera kopuru handiari kalitatez aurre egiteko. Izan ere, eskertu behar dizuegu interesa, asko izan baitzarete Opentradeko euskarazko atala erabiltzeko ahalegina egin duzuenok.

Lanean ari gara, eta aurki jarriko dugu abian berriro gaztelaniatik euskarara automatikoki itzultzeko aukera.



Barkatu eragozpenak, eta mila esker berriro!

Erantzun

Sartu