2007-04-04

Permalink 14:06:55, Atalak: matxin teknologia, 116 hitz  

OpenTrad-Matxin askoren ahotan

Blog ahaztu samar izan dugu baina proiektuak aurrera darrai.

Egin diren azken aurrerapenak hauek izan dira:

Matxin hobetu da hainbat arlotan:
  • hiztegiak aberastu eta errepasatu dira
  • koordinazioari irtenbide ahaltsuagoa eman zaio
  • trantsitibo/intrantsitibo bereizketa hobetu da aditzetan
  • deklinabidearen itzulpena neurri estatistikoekin aberastu da
EJn aurkeztu gara (Elekak liderauta) egin duten deialdian. Ataza zaila jarri zuten ebaluatzeko eta, sistema hobeto zebilela nabaritu zen arren, zaila zen itzulpen txukunak sortzea esaldi luze horietarako.

Sistema estatistiko bat (SMT) jarri dugu martxan. Probetan dago oraindik.
Horretarako hainbat corpus eskuratu eta parekatu egin dira

Zerbitzua (es-eu) berreskaintzen da sistema hobetuarekin.

Sustatun komentatu da

Laster sourceforgera-ra igoko dugu Matxin1.0 hor egongo da!
Berrian erreportaje zabala atera zen EHren deialdiaz.
PPk ere erabili omen du modu desegokian

2006-11-02

Permalink 16:50:07, Atalak: orokorra, 122 hitz  

OpenTrad-Matxin aurrera

Azken hilean oso berri onak izan ditugu OpenTrad proiektuan
gabiltzanok, bai Madrilgo Industria ministeritzan baita Madrilgo
Hezkuntzan ere aurkeztutako proiektuak onartu baitizkigute.

Bi proiketuak lotuta daude baina independenteak dira.

Industriakoak EurOpenTrad du izena eta aurrekoaren jarraipena da. Hasierako asmoa hiru arlotan banatzen zen euskarari dagokionean:

  • oraingo sistema hobetzea
  • itzulpen-sistema estatistiko batekin konbinatzea domeinu zehatz batean kalitatea modu nabarmenean igotzeko
  • ingelesa-euskara itzulpena aurrera eramatea
Proiektua 2006 eta 2007rako zen baina, oraingoz, 2006ko zatia baino ez digute onartu, beraz, helburu guztiak ezin izango dira gauzatu aurten.

Hezkuntzakoa hiru urteetarako da eta ez da hain aplikatua, ikerkuntza egin behar da hainbat aspekturen inguruan, itzulpen-paradigmen konbinazioa eta desanbiguazio semantiko/lexikoa lirateke nagusiak, ingelesaren erabilerarekin batera.

Beraz, badugu zereginik! Ea epe ez oso luze batean emaitza berrien berri eman dezakegun.

2006-06-20

Permalink 15:52:32, Atalak: prentsan, 62 hitz  

OpenTrad multimedia

Lasai! Ez gara hasi ahots bidezko itzulpen sistema garatzen! Baina OpenTrad-ek prentsan izandako oihartzunak, telebista eta irratian ere izan du bere zatitxoa. Hona hemen lotura interesgarri batzuek:

2006-06-16

Permalink 15:00:21, Atalak: opentrad zerbitzaria, 17 hitz  

Itzulpen eskaerak

Hor doa aste honetako itzulpen-eskaeren taula, ikusten denez azken egunetan gazteleratik katalanerara da gehien eskatzen den itzulpen-norantza.

2006-06-13

Permalink 10:27:26, Atalak: adibideak eta arazo linguistikoak, 229 hitz  

Opentrad es-eu: ezaugarriak eta mugak (2)

2. Opentrad es-eu itzultzaile automatikoak duen bigarren muga handia adiera-desanbiguazioa ez egitea da.

Adibidez, "ha pasado por delante de casa" "etxearen aurretik atzean utzi du" itzultzen du.

Tresnak Elhuyar-en agertzen den lehen adierako lehen hitza hartzen du eta hori erabiltzen du itzulpen gisa. "pasar" aditzak hainbat balizko itzulpen ditu, baina lehenengoa "atzean utzi" da.

Halakoak detektatzen baditugu, itzulpenean dauden hitzen ordena aldatu egiten dugu tartean orokorrago bat dagoela iruditzen bazaigu.

Adibidez, Elhuyar Hiztegian "tráfico"ren lehen ordaina "salerosketa" da. "salerosketa" ez zaigu testuetan askotan agertzen, eta, orokorragoa den "trafiko"ren alde egin dugu. Oraintxe indarrean dagoen tresnak "tráfico" "trafiko" gisa itzultzen du. Badakigu zenbaitetan maileguetara jotzen ari garela, baina ez dugu uste tresnak duen akats larriena hori denik. Itzulpenak egiterakoan halakorik detektatuz gero, guri komunikatzea eskertuko dugu.

Hala ere, ez dugu esango inolako adiera-desanbiguaziorik egiten ez dugunik. Preposizioen kasuan badugu zenbait informazio interesgarri (hala nola izenen biziduntasuna, aditzen azpikategorizazioa,...) eta informazio hori erabiltzen saiatu gara.

Adibidez, bi esaldi hauek itzultzera bidaliz gero, "sobre" preposizioak itzulpen ezberdinak ditu: "el libro está sobre la mesa" eta "los aviones volaron sobre la muchedumbre". Hauek dira itzulpenak: "liburua maihaiaren gainean dago" eta "Hegazkinek jendetzaren gainetik hegan egin zuten".

:: Hurrengo orrialdea >> Azken erantzunak

Kudeaketa

opentrad-matxin

es-eu itzulpen automatikoa egiten duen lehen prototipoa sortu da opentrad proiektuaren barruan. www.opentrad.org helbidean itzulpenak egin daitezke doan. matxin.sourceforge.net helbidean teknologia eskura dezakezu.

| Hurrengoak >

Maiatza 2013
Ast Ast Ast Ost Ost Lar Iga
<<  <   >  >>
    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31    

Bilaketa

Blog hau sindikatu XML

Zer da hau?

Zure bloga eraman

  1. Bloga esportatu eta txt moduan gorde.
  2. blogariak.com-era joan Tresnak > Inportatu bidez zure blog berria informazioa ekarri.
Elurnet Informatika Zebitzuek eskaintzen duten zerbitzua
Ikastaroak, garapena, zerbitzu informatikoak, blogak

powered by
b2evolution