Teknologia albisteak

Euskararen corpus publikoak, denontzako, libre eta doan

Erabiltzailearen aurpegia
Luistxo Fernandez - Code & Syntax
2002-10-25 : 10:10

Harrikada txiki bat bota nahi dut. Euskal terminologia datutegien publikotasunaren aldeko aldarri bat, erreibindikazio lotsagarri bat. Hor doa: euskararen corpus publikoak, denontzako, libreki eta doan.

Hizkuntza-corpusen inguruko jardunaldiak izaten ari dira egun hauetan Donostian, UZEIk antolatuta. Horren harira, harrikada bat bota nahi nuen, duela hilabete EHUko Euskararen Institutuaren Terminologia Jardunaldietan bota nuena, Euskal terminologia datutegien publikotasunaren aldeko aldarri bat, erreibindikazio lotsagarri bat.

Orduan aurkeztu nuena errepikatuko dut hemen.

Euskal terminologia datutegien publikotasuna

Luis Fernandez, Code & Syntax

Leioa, 2002ko irailaren 18a

1. Hiztegietatik korpus elektronikoetara: Tentsioak

Hiztegiak, terminologia kontsultatzeko oinarrizko tresna hori, ezinbestekoak zaizkigu neurri batean edo bestean euskaraz lan egin behar dugunoi. Normalizatze bidean (edo bide-asmoan) dagoen hizkuntza baten kasuan, era bateko edo besteko hiztegi berezituak eta orotarikoak beharrezkoak dira.

Euskararen kasua hori izanik, beharbada ez da harritzekoa zenbat hiztegi argitaratu izan diren Euskal Herrian azken 20 urteotan, eta argitaratzeaz gain, zenbat saldu diren. Elhuyarren hiztegiak, Sarasolarenak, Kintanarenak... Kopuru zehatzetan ez dakit inork zenbatuta ote dituen, baina azken bi hamarkadetako liburu salduenen artean behar dute seguruenik ale horiek. Arrakasta editorialak ez dira errazak euskal argitaletxeentzat, eta hortaz, hiztegiak balore seguru-samar gutxienetakoak izan dira eta dira askorentzat.

Hiztegien garrantzi editorialarekin lotuta, hiztegi batuaren edo hizkera berezituen finkotasun faltak tentsio moduko batzuk eragin ditu. Terminologiaren esparrua ez dago polemiketatik libre, eta ezagutzen ditugu horietako batzuk.

Tentsio horietako batzuk, gure egoera zein den ezagututa, logikoak dira. Hiztegi batean aukera ortografiko bat (beharbada beste edozein bezain zilegi) inprimatuta utzi duenak, ez du nahi izan beste aldaera ortografiko bat hobets zedin, ez zedin bere hiztegia aldez aurretik zaharkitua geratu. Era berean, hiztegigintzara eta terminologia lanetara dedikatu direnak izan dira beharbada Euskaltzaindiari finkotasuna eskatzeko orduan presa gehien sartu dutenak: ikusi izan dutelako liburuetan finkatzen zituzten formak akaso hurrengo edizioetarako zuzendu behar zirela... Edizio berriak egin eta liburu gehiago saltzeko aukera, bai, baina edizio berrietarako lan ikaragarria inbertitu beharra, beste alde batetik (horra tentsioetako bat).

Tentsio horien beste adibide bat: Terminologiara dedikatzen direnek pozik hartu dute Euskaltzaindiak "ordenagailu" forma finkatu izana, baina era berean, frustrazio latz samarra da ikustea hiztegigintzan edo informatikaren zirkulu euskaldunetan nahiko sistematikoki erabili izan den "ordenadore" forma zeukaten glosario eta lan guztiak bat-batean zaharkituta (beharbada "okertuta"?) geratu direla ikustea.

Teknologia berrien ezarpenak terminologiarekin lan egiteko modua zeharo aldatu du dagoeneko. Paperezko hiztegigintzarekin gertatzen ziren tentsio horiek, beste tentsio eta arazo desberdin batzuekin ordezkatzeko trantzean dira. Nik tentsio horietako batzuk astindu nahi ditut gaur, gatazka edo eztabaidatik akaso ideia, mugimendu edo ezer onuragarririk sortuko delakoan, materialismo dialektikoaren tradizioan...

Askorentzat, gaur egunean, hiztegia kontsultatzea da Euskalterm-en webgunea bisitatzea. Edo ItzuL zerrendan galdera botatzea. Errazagoa ere bada, askotan, hori egitea gure aulkitik jaiki eta apalera liburu baten bila joatea baino.

Joera hau areagotu egingo da, erreferentziazko obrentzako kokapen ezin naturalagoa delako Internet. Merkataritza elektronikorako asmatu zutela pentsatu zuten batzuek, eta ez dakit asmatu zuten. Baina hiztegi bat Interneten ondo moldatua badago zein baliagarria den jakin badakigu. Interfaz batean edo bestean bilaketak eginez zenbat aurreratzen den konturatuak gaude asko.

Hortaz, paperezko hiztegiek ze etorkizun dute kontestu honetan? Horra tentsiogune berrietako bat... Ikusiko da, baina testuliburu gisa hiztegiek eskolan salmenta ugariak izango dituztela dudarik ez dut egiten. Epe luzera, batek daki.

2. Korpusen erabilera integrala eta itzulpen-memoriak

Edozein modutan ere, hizkuntzarekin lana egiteko orduan, Internet bidez kontsultak egiteko ahalmen eta erraztasun ikaragarri horren ondoan, beste faktore teknologiko are garrantzitsuago bat hartu behar dugu kontuan, nere ustez: korpus osoen erabilera integrala.

Arretaz aztertzen badugu, paperezko hiztegia kontsultatzea edo Internetekoan bilaketa egitea, ez dira eragiketa hain desberdinak: une jakin batean, termino jakin bat bilatzen dugu (edo termino sorta bat, banan-banan). Kontsultatzea da egiten duguna. Korpus osoak daude Interneten, baina banan-banan kontsultatzen ditugu, orain termino bat, gero beste bat...

Terminoz terminoko kontsulta hori ondo etortzen da, eta hemendik aurrera ere erabiliko dugu, paperean eta, batez ere, Interneten. Baina nik esaten dudan korpusen erabilera integrala beste zerbait da, eta testu-produkzio eta itzulpen automatizazioarekin du zerikusia. Bereziki, itzulpen-memorien teknologiarekin du zerikusia. Itzulpen-memoria testu produkzioan eta itzulpenean ikaragarrizko tresna indartsua da. Itzulpen automatikoa ez bezala, ez da jolas bat edo epe luzerako utopia bat, baizik eta errealitate guztiz funtzional bat edozein ordenagailutan erabil dezakeguna. Eta ez da euskara bazterrean utzi duen tresna bat, baizik eta hizkuntza zehatzen parametroetatik kanpo, edozein hizkuntza-bikoterekin funtziona dezakeen teknologia.

Itzulpen-memoriaren oinarria datubaseen memoria ahaltsua da. Funtsean zera da koxka: inoiz ezer itzuli badugu, memorian gordetzen da (datubasean), eta berriro testu bera (edo bertsua) agertzen bazaigu, memoriatik proposamena sortuko zaigu pantailan orduan itzulitakoa berriz ez itzultzeko beharrik ez edukitzeko. Datubasean gordetzen den memoria artxibo digitala da, funtsean, eta hortaz, trukatu, kopiatu, partekatu egin daiteke. Diputazioko langileek sortutako itzulpen memoria neure ordenagailu eta programan ezartzen badut, haiek egindako itzulpen guztien indarra neureganatu egin dut: haien terminologia, aukera ondo pentsatuak eta abarrak neureak dira jada, eta are gehiago, haiek behin egin zuten lana ez dut berriro egin behar.

Itzulpen-memoriako sistemak, normalean, esaldi edo hitz-kateetan zatikatutako itzulpen-unitatez osatuta daude, baina berekin dituzte terminologia manejatzeko sistemak ere. Terminologia kudeatzeko ere, azken batean, artxibo digitalak erabiltzen dituzte, eta memoriekin bezala, beste batzuek egindako lana gure itzulpen eta lanketa prozesuan erabili dezakegu haiek emandako artxiboa integratzen badugu ordenagailuan.

Testua modu honetan itzuli edo ekoizteko, bolumena da koxka. Memoria korpus zenbat eta handiagoa, lan gehiago aurreratzen duzu. Korpus handiak behar dira, ez berba solteak, baizik eta itzulpen-unitate parekatu asko eta asko, eta terminologia zerrenda konpletoak.

Eta hortaz, teknologia berri hauekin hizkuntzaren ondarea, terminologia eta korpusak, erabili behar baditugu, ez zaigu nahikoa berbaz berbako kontsulta ahalbidetzen digun interfaze bat edo hiztegi bat eskura edukitzea: korpus handiak, edo osoak behar ditugu, edo bestela ez digute balio.

Korpus horiek hor daude, eginak daude, esistitzen dira. Publikoak dira, asko, izatez. HAEE-IVAP-en idazki ofizialak itzultzen sortuta duten itzulpen memoriak, berez, testu publikoak dira. Ondare publiko bihurtu beharko lirateke. Terminologiako lan asko, diru publikoz enkargatu eta egin dira, eta publikoak beharko lukete osorik, ez berbaz berbako kontsultarako bakarrik, erabilera integralerako baizik.

Euskalterm jabetza publikokoa da orain. Ba, erabilera integral publikokoa izan beharko luke, ez kontsulta soilekoa bakarrik. Erakundeek bildutako gainerako korpusak ere, berdin.

3. Erreibindikazio lotsabako bat

Nire erreibindikazioa da: Korpus publikoak, denontzako, libreki eta doan.

Norbaitek galdetuko du akaso:

Zer ari da lotsabako hau eskatzen, besteek egindako lana berak doan aurpegi guztiarekin erabiltzeko eskubide librea?

Eta erantzuna da: Bai, jakina!

Zein da, bada, bestela, terminologiaren funtsa? Ez ote da batek (dagokionak) finkatu duena besteeok (ahal bada hiztun komunitateko guztiok) berdin erabiltzea?

A, baina, horretarako, dagokion horrek egindako lana, akaso beste guztion artean ordaindu beharko da, ezta? Ba bai, eta izatez, hala gertatzen da, terminologia lan asko eta asko laguntza eta finantziazio publiko ia osoarekin ordaintzen direlako. Hortaz, guztion diruarekin.

4. Erabilera librearen oinarriak: merkatuaren legeak eta herri-ondarea

Batzuek kontrakoa pentsa dezaketen arren, ni ez naiz hemen ari aldarrikatzen propietatearen ezabaketa, sexu librea eta utopia komunista. Alderantziz, propietatearen printzipio zorrotza, eta logika enpresariala ari naiz defenditzen. Bezeroak hornitzaileari produktu jakin bat enkargatu badio, produktu amaitua bezeroaren jabetzekoa da, ez hornitzailearen jabetzakoa; eta produktuaren planoak eta espezifikazioak ere (eraikuntza baten kasuan adibidez) bezeroaren jabetzakoak izan behar dira, ez hornitzailearen propietatekoak. Hala ere, hornitzaileak egindako lanaren planoak gordetzea ere zilegitzat jo behar da: ikerketa eta garapen gisa bezeroaren produktuan inbertitutako orduak hurrengo proiektuetan, beste bezero batzuetan, aprobetxatzeko eskubidea aitortu behar zaio hornitzaileari, produktuaren ezaugarrien ondorioz, hori debekatzen duen klausularik ez baldin badago kontratuan.

Terminologia lanen publikotasuna aldarrikatzen dudanean, nik era horretan ulertzen dut. Bezero eta hornitzaileen harreman enpresarialaren plano horretan. Terminologia lanak enkargatzen baditu bezeroak, emaitza bezeroarena da.

Etxe komertzial batek itzulpen lan batzuk enkargatzen badizkio itzultzaile bulego bati, hornitzaileak bezeroari ematen dion lan bukatuan, itzulitako testua bezeroarena da. Eta ez hori bakarrik, lokalizazioaren eta internazionalizazioaren eremuan, edo multinazionalen itzulpen proiektuetan, testuez gain, bezeroek esijitu egiten dute gaur egunean testu itzuliekin batera, egindako terminologia hustuketa ematea eta sortutako itzulpen-memoriak ere entregatzea. Etxeaz gain, etxearen planoak ematea, nolabait.

Hortaz, bezeroa publikoa denean, zer? Herri-administrazioa denean itzulpen edo terminologia lanak enkargatu dituenak, norenak dira lanok, norenak haiekin lotutako terminologia glosarioak eta itzulpen-memoriak? Herri-administrazioenak, ez hornitzailearenak.

Honekin batera, propietatearen eta harreman komertzialen ikuspegi kapitalista honez gain, badut nik herri-administrazioaren halako irudi bukoliko bat. Herri-administrazioa herriarena dela sinesten dut, nire inozentzian, herri-lanak, lan publikoak, horixe dira, publikoak. Eta herri-administrazioaren enkarguz egindako terminologia lan publikoak ere publikoak dira. Nireak dira. Besteak beste, neuk ordaindut ditudalako.

Herri-ondarea, jabetza publikoa, erabiltzeko eskubidea badaukadala badakit. Hortaz, Euskalterm publikoa bada, Euskalterm nirea ere bada, eta Euskalterm erabiltzeko eskubidea daukat.

Printzipioz, bai, baina ez edozein modutan ordea. Lorategi publikoak erabiltzeko eskubidea daukat neure hirian, baina ez edozein modutan. Parke bat badago baina gauez itxi egiten dute. Ezin dut gauez erabili. Egunez libreki bisitatu dezaket, baina begoniak zapalduz ezin naiteke edozein bazterretan etzan. Badaude mugak neure jabetzakoa ere baden herri-ondare hori ustiatzeko, eta, oro har, pentsatzen dut muga hori dela denok ustiatzeko moduan jarraitu behar duela ondare horrek, neure erabilera ezin dela neuk nahi edo ahal bezain librea izan, ganora barik erabili ezkero ondarea hondatuko dudalako eta beste batzuei, nere herrikideei, lapurtu diedalako berena ere baden gauza bat.

Jabetza intelektualarekin ere badaude mugak, lorategiekin bezala. Herritarrok badugu liburutegi publikotik liburuak atera eta irakurtzeko eskubidea, baina itzuli egin behar ditugu, eta osorik itzuli. Eta itzulketan berandutzen bazara, hirugarrenekoan, liburutegiko txartela ere kenduko dizute akaso. Logikoa da, zeure erabilera okerragatik beste batzuen erabiltze-eskubidea murriztu duzulako.

5. Kopia digitalen ezaugarri bihurriak

Hortaz, ez ote da bada zilegi, terminologia ondare publikoen erabileran ere antzeko murriztapen eta betebeharrak ezartzea, lorategiekin edo liburutegiko aleekin egiten dugun bezala? Euskalterm hitzez hitz kontsultatzeko Interneteko leiho bat irekitzea, bale, baina Euskalterm datubasearen kopia osoak banatzea, akaso hori murrizteko arrazoiak egon daitezke.

Ba ez. Lorategiekin, eta liburutegiko liburu ale fisikoekin alderatuta, oso bestelako materiala da terminologia 21. mende honetan. Terminologia eta hizkuntza-korpusak, oro har, ez dira euskarri fisikoetan oinarritzen, ez dira paperezkoak liburuak bezala, ez dira karbonoan oinarritutako forma organiko bizidunak begoniak bezala. Material digitala dira, inmateriala nolabait, 0 eta 1 zifren konbinazio amaitezina osatzen duten bit mordoa erreskadan... hori da terminologiaren euskarria gaur egunean.

Material inmaterial horrek ezaugarri oso prezisoak ditu. Kopiak egitea, funtsean, ez da apenas dirurik kostatzen. Kopia egiteak ez du orijinala gastatzen, eta kopiak perfektuak dira, orijinalaren baliokideak zentzu guztietan (horren ondorioak aski ebidenteak ari zaizkigu egiten musikagintzan). Euskalterm ez da gastatuko edo hondatuko edo balioz gutxituko nik gaur kopia bat etxera eraman, eta han nire kopiarekin errito satanikoak egiten baditut. Euskalterm akaso, bihar eguneratuko dute, eta nire kopia zaharkituta egongo da, baina bueno, gaur behar nuenerako balio izan dit, eta bihar edo etzi berriro haren premia baldin badaukat, aukeratuko dut zer egin: nire kopia zaharkitua berriro erabili, edo kopia berria egin Euskalterm eguneratuari.

Kopia libreak, bestalde, jakintzaren banaketa modu errazena suposatzen du. Herri-erakundeek liburuak dibulgazio asmoz ateratzen dituztenean, nekez irabazten dute dirua. Dirua galdu egiten dute. Garesti irteten zaie herritarrei herri-administrazioaren paper-gastua. Eta hala ere, gastuok murrizteko, berriz ordaindu behar ditu herritarrak liburuok etxera ale bat eraman eta han gordetzen den jakintza erabiltzeko.

Material digitalaren banaketarako, ez du herri-administrazioak berezko gasturik egin behar, mekanismo merkeekin prestatu daitekeelako kopiak egiteko sistema bat. Hori bai, kopia bakoitzaren gastu murritz hori, erabiltzaile edo herritar bakoitzak ordaintzen du. Gutxieneko litzateke eskatzea grabatzeko CDa norberak eramatea. Gutxienekoa, eta gehienezkoa ere bai, jakina: beste gasturik ez dago trantsakzio horretan.

Eta doako banaketa eta zabalkundea da, era berean, dibulgaziorako modu zuzenena. Eta gure esparru honetan, are gehiago, hori delako terminologiaren funts logikoa bere bururaino eramateko bide labur eta zuzenena. Lehenago esan dudan bezala, terminologiaren funtsa zera delako: batek (dagokionak) finkatu duena, beste guztiok erabil dezagun. Ez bada terminologia horretarako, zertarako da? Eta batek finkatu duena, besteok erabiltzeko gogoz baldin bagaude, eta erabiltzeko modu zuzen bat badaukagu, zertarako traba gehiago?

6. Erabilerari mugak: lizentzia libreak

Berriz, deabruaren abokatu lanetan jarriko naiz:

Doako banaketa, bai, baina zertarako? Euskalterm-en kopiak banatu edozeinek edozer egin dezan haiekin? Libertadearekin hasten gara, eta libertinajearekin amaitzen dugu. Ez, ez. Zertarako erabili behar diren gauzak kontrolatu beharko dugu, gero. Zertarako behar du mutil honek Euskaltermen kopia bat? zer egiteko?

Horra nire erantzuna: lehen esan dudan bezala, terminologia datubase horrekin errito satanikoak egingo ditut.

Ez ote dut horretarako eskubiderik? Baltasar Garzon epailearen autoren batean debekatu ote du? Ertzaintzak zaindu behar ote du zer egiten dudan nik horrekin?

Bueno, txantxa da hori. Nik Euskalterm ez dut Satanas gurtzeko erabiliko, besteak beste software librearekin lan egiten dugunontzat Bill Gates delako Satanas, eta hura dugulako gure Etsai nagusia.

Nik erabili nahi dut Euskalterm ganorazko testuak ekoizteko, terminologia bateratu eta txukunena egiteko, euskara zuzena, finkatua eta ona erabiltzeko 21. mende honetan, geure enpresaren jardunean eta geure enpresaren bezero izan daitezkeenen produktuetan.

Era berean, eskatzen dudan erabilera jator hori ezin izango zen guztiz librea izan. Goraxeago esan dudanaren kontra egingo dut orain. Euskalterm benetan libre eta publiko egiten badugu, eta libreki eta publikoki erabili nahi badugu, denetarako erabiltzeko gaitasuna behar dugu, salbu eta gauza baterako: publiko dena pribatu bihurtzeko. Horrek ez du esan nahi, erabilera pribatua, ezta negozio aukera pribatuak, galerazi beharko liratekeenik,baizik eta negozio pribatu horien emaitzak aurrekoak bezain libre eta publiko izan beharko lukeela.

Nik Euskalterm gaur kopiatu eta gehikuntzatxo batzuekin bihar CD batean saltzeko eskubidea eskatzen dut. Merkatuak ikusiko du, nire gehikuntzak CDan jarritako prezioa balio duen, ala bestela Jaurlaritzaren Euskalterm irekia doan lortzea hobe zaion. Hori bai, nik CDan jarritako Euskalterm 2.0 hori hobetuak prezioa izango du akaso, baina funtsean librea izan beharko da, nik ere publikoki eta libreki jaso dudalako: kopiak derrigor baimenduak egon beharko dira, eta erosleak, halaber, eduki berriz hobetu, eta berriz Euskalterm 3.0 beste CD batean ateratzeko aukera izango du....

Sistema fantastiko samar hau bere azken detaileraino azaltzeak luze joko luke. Baina ez da fantasia bat. Software librearen munduak, Linux sistemaren munduak, softwarea banatzeko darabilen GPL lizentziaren (GNU Public License) haritik eduki intelektualentzako ere lizentzia ireki bat sortu da: GDL, GNU Documentation License.

GDL lizentziarekin liburuak idatzi, argitaratu eta saldu ere egiten dira. Baina beste orri batzuetan copyright oharrak eta debeku zerrenda luze eta triste bat ("debekatua dago eduki hau ezein medio elektromagnetiko etab etab...") irakurtzen ditugun tokian, espreski liburua kopiatu egin daitekeela esaten da.

7. Euskara guztiona da, ala ez da?

Nik ez dut, egia esan, eskaera hauek aurrera egingo duten esperantza handirik. Herri-erakundeek osoki ordaindu dituzten lanak, azken batean, ez dakit nola, herri honetan ez dira suertatzen herriaren jabetzakoak, baizik eta enkargua jaso duen erakundearenak, bezero publikoak kontratatu duen hornitzailearen jabetzakoak gertatzen dira produktu amaituak.

Euskalterm, azkenean, publikoa da, baina erabat librea ote den ez dakit.

Nik gaurko agerraldi honetan Euskalterm erabili dut behin eta berriro nire adibideetan, terminologia lan mardulena delako, eta oso ondo adierazten duelako teknologiaren indarrak ekar dezakeena adibide konkretu batean.

Hortaz, nik ez dut fijazio berezirik Euskalterm-ekin, zaudete lasai. Nik edo nik lan egiten dudan lantegiak ez lioke Euskalterm digital oso bati etekin berezirik aterako. Hori baino gehiago eskertuko genuke, geure kasu konkretuan, erakunde publikoetako itzulpen zerbitzuek sortutako korpus elebidunak, dela memoria formatuan, dela beste era bateko dokumentu alineatuen eran, eskainiko balira denon erabilpenerako. Alde horretatik, EIZIEk Gipuzkoako Diputazioaren korpus batzuk sarean jartzeko ahalegina bereziki txalogarria iruditzen zait.

Terminologia lanak egitera, langintza honetara, dedikatu diren erakundeek euskararen alde, normalkuntzaren alde, zein lan egin duten esan beharrik ez dago. Hau idazten duenak botatzen dituen purrustaden aldean, erakunde horien lana hor dago, eta ez dago konparaziorako neurririk.

Zelakoak dira erakunde horien merituak. Eta horien ondoan, nolakoak dira neureak, edo Jose Marirenak, edo Arantxa Mallabikoarenak.

Baina herri-lanak herriarenak badira, eta erosleak enkargatu eta ordaindutako produktuak eroslearenak baldin badira eta ez hornitzailearenak, eskubidea dugu, eskubide osoa, gure merituak ezgauza badira ere, geurea dena eskatzeko.

Hori, herritar garen aldetik, zergak ordaintzearen truke eskubide batzuk ditugun aldetik.

Hizkuntza moderno baten erabiltzaile garen aldetik, eskubidea dugu (eta, zergatik ez, betebeharra ere badugu) terminologia normalizatua ezagutzeko eta erabiltzeko.

Eta euskaldun garen aldetik... Euskara guztiona da... ezta?

Ez bada guztiona, nola erabiliko dugu? Nola iraungo du?

Luis Fernandez
Leioa, 2002.09

Erreferentzia batzuk:

Erantzun

Sartu