Teknologia albisteak
7

Euskara hutsezko bilatzailea Sustatun

Erabiltzailearen aurpegia
Sustatu
2006-10-25 : 16:10

Sustaturen eskumako zutabeko bilaketa-lehiatilan bilatuz, edo bilatzailearen orria erabiliz, euskara hutsezko edukien bilatzaile baten emaitzekin egingo duzu topo. Google Co-Op zerbitzuaren aukera berri bat baliatu dugu hau egiteko.

Euskarazko bilatzaile honek euskara hutsezko zenbait eduki arakatzen ditu. Adibidez:

Euskarazko informazio duen webguneren bat arakaturikoen artean sartzea komeni dela uste baduzu, jarri kontaktuan gurekin. Printzipioz, euskara hutsezko edukiak nahi ditugu. Hortaz, hizkuntza desberdinetakoetan, baloratu behar dugu ea URL edo helbideen bitartez erdarazkoak diskriminatu daitezkeen.

Adibidez: eibar.org nagusiki euskaraz da, baina erdarazko edukiak dituzte blogari batzuek. Hala ere, eduki horien URL-ak detektatu daitezke eta emaitzetatik ezabatu

  • www.eibar.org/blogak/erral/es
  • www.eibar.org/blogak/prospektiba/es
  • www.eibar.org/blogak/luistxo/en

Helbide horiek ezabatu daitezkeenez, ez dugu hango edukietan bilatuko. Erabili kontaktu-orria webgune jakin bat hemen azaldu nahi baduzu.

Bilaketa sistema honek Google Co-op zerbitzuaren baliabide bat erabiltzen du: Google Custom Search. Funtsean, Googleren emaitzak arakatzen ditu, baina zuk zehaztutako domeinu eta azpi-domeinu batzuetara mugaturik, filtro eraginkor bat eginez. Horrez gain, bilaketaren emaitza zure webgunean integratzen uzten dizu, publizitatearen truke, baina publizitate horretan klik eginez gero, argitaratzaileak ere bere partea eramango du, Adsense programarekin gertatzen den bezala. Hortaz, Sustatuko euskarazko bilatzailearen emaitzetan klik bat gertatuz gero, bost zentimo Googlerentzat, hamar zentimo Sustaturentzat (kopuruak aldakorrak dira, proportzioa hori da, hala ere).

Uste dugu euskara hutsezko bilaketa hau praktikoa izan daitekeela. Batetik, bizi-bizi dauden webguneen edukiak arakatuko nahi genituzke gehienbat (euskara hutsezko hedabideak, blog komunitateak...). Bestetik, izen propio bat edo nazioarteko termino bat bilatuz gero, euskara hutsezko edukiak hobeto aurkitzen lagundu dezake halaber. Esate baterako, Ubuntu edo Albert Einstein bilatuz, Googleren bilaketa arruntean euskaraz aurkituko ez duguna topatuko dugu hemen.

Bilaketaren emaitza orrian Sustaturen diseinu apur bat bortxatua ageri da: finduko dugu, Google Custom Search zerbitzua bart iluntzean iragarri zuen Googlek, eta azkar samar asmatu dugu integrazio hau. Emaitzen interfazean ingelesa agertzea, berriz, ez dago gure esku, Googlerenean baizik (oraingoz).

Egin zure aprobak, erabili Sustaturen euskara hutsezko bilatzailea

Erantzunak

Hey_neken
2006-10-25 : 21:29

Interesgarria. Ala ere, euskera zer den eta zer ez den aztertzeko formula bat erabiltzea egokiagoa litzateke zerrenda zuri/beltzak erabili beharrean. Ea noizbait lortzen dugun formula hori!



Bitartean... euskerazko gune garrantzitsu bat jartzea pasa zaizue: eu.wikipedia.org

Sustatu
2006-10-26 : 17:34

Huts potoloa Wikipediarena, baina zuzendu dugu. Eskerrik asko. Itxura aldetik ere integratuago ageri da bilatzaile gaur.


Jabi Zabala
2006-10-30 : 11:31

Banengoen bada, ez dituela nire webgunekoak indexatzen... Orduan ez da berez bere baitan indexatuta duen guztiaren artean euskarazko edukia ezberdintzen duela, baizik eta bakarrik norberak zehazteutako webgune jakin batzuk hartzen dituela bilaketa egiteko, ezta?

Sustatu
2006-10-30 : 13:55

Horrela da, eskuz sartu behar dira bilatzailean arakatu nahi dituzun webguneak. Izan ere, tresna hau ez da hizkuntza zehatzetako bilatzaileak sortzeko, bilatzaile espezifikoak sortzeko baizik.



Gure kasuan euskarazko webguneen (webgune batzuen) bilatzailea antolatzen dihardugu, baina berdin-berdin egin daiteke kirol webguneetan bakarrik bilatzen duen bilatzailea, edo gastronomiakoa, edo artearen ingurukoa...



Gutxika gutxika ari gara webgune berriak gehitzen, eta Sarean.com ere badago orain.



Beste webgune batzuk ere etorriko dira, eta zuen iradokizunak bidali nahi badituzue, gustura jasoko ditugu.



Gari Araolaza
2006-10-30 : 14:01

Hori da Jabi. Eskuz egin beharreko lana da, baina hori artikuluan garbi utzi da, ez?


Nik idatzi nuen zerbait gai honen inguruan: Euskara hutsezko bilaketak Googlen


Jabi
2006-10-31 : 11:19

Interesgarria litzateke googlek euskarazko edukiak automatikoki ezberdintzea (da, du eta dira edo antzekoak dituztelako edo ez dakit nola), norberak euskarazko webguneen zerrenda bat sortu beharrean edo, zure blogeko testuan diozunez, lang=eu zehaztu beharrean. Ez dut uste gaztelaniazko web guztietan "es" zehaztuta izango dutenik.

Gari Araolaza
2006-10-31 : 12:40

Noski baietz, hori litzateke onena, eta gainera ez "du, da, eta" eta horrelakoak detektatuta. Nahiko sistema txapuzeroa da hori, jakinik gainera hizkuntza identifikatzeko algoritmo aurreratuagoak badaudela asmatuta.


Baina nire artikuluan diodan moduan, ez da arazo teknikoa, Google behar horretaz jabetzea baizik. Horretarako Vicent Partalen esanak balio dute, BISIBILITATEA behar duela euskarak sarean, eta hori nik aipatutako moduekin lor daiteke.


Erantzun

Sartu