Lasai! Ez gara hasi ahots bidezko itzulpen sistema garatzen! Baina OpenTrad-ek prentsan izandako oihartzunak, telebista eta irratian ere izan du bere zatitxoa. Hona hemen lotura interesgarri batzuek:
Hor doa aste honetako itzulpen-eskaeren taula, ikusten denez azken egunetan gazteleratik katalanerara da gehien eskatzen den itzulpen-norantza.
2. Opentrad es-eu itzultzaile automatikoak duen bigarren muga handia adiera-desanbiguazioa ez egitea da.
Adibidez, "ha pasado por delante de casa" "etxearen aurretik atzean utzi du" itzultzen du.
Tresnak Elhuyar-en agertzen den lehen adierako lehen hitza hartzen du eta hori erabiltzen du itzulpen gisa. "pasar" aditzak hainbat balizko itzulpen ditu, baina lehenengoa "atzean utzi" da.
Halakoak detektatzen baditugu, itzulpenean dauden hitzen ordena aldatu egiten dugu tartean orokorrago bat dagoela iruditzen bazaigu.
Adibidez, Elhuyar Hiztegian "tráfico"ren lehen ordaina "salerosketa" da. "salerosketa" ez zaigu testuetan askotan agertzen, eta, orokorragoa den "trafiko"ren alde egin dugu. Oraintxe indarrean dagoen tresnak "tráfico" "trafiko" gisa itzultzen du. Badakigu zenbaitetan maileguetara jotzen ari garela, baina ez dugu uste tresnak duen akats larriena hori denik. Itzulpenak egiterakoan halakorik detektatuz gero, guri komunikatzea eskertuko dugu.
Hala ere, ez dugu esango inolako adiera-desanbiguaziorik egiten ez dugunik. Preposizioen kasuan badugu zenbait informazio interesgarri (hala nola izenen biziduntasuna, aditzen azpikategorizazioa,...) eta informazio hori erabiltzen saiatu gara.
Adibidez, bi esaldi hauek itzultzera bidaliz gero, "sobre" preposizioak itzulpen ezberdinak ditu: "el libro está sobre la mesa" eta "los aviones volaron sobre la muchedumbre". Hauek dira itzulpenak: "liburua maihaiaren gainean dago" eta "Hegazkinek jendetzaren gainetik hegan egin zuten".
Aurreko astean Opentrad-ek izan zuen oihartzuna zela eta trafiko oso handia jasan behar zuen zerbitzariak. Bi egunetan 9.000 bisitaritik gora izan genituen eta eskaera horri zerbitzu ona emateko Matxin ezgaitu egin behar izan genuen.
OpenTrad-en ezaugarri nagusia abiadura da. Web-orri osoak itzultzen ditu, dokumentu osoak itzultzen ditu, ... eta hau ez da gauerdiko ahuntzaren eztula.
Baina --eta kontuan izanik 'beta' bertsioan dagoen tresna dela-- bere muga jakinak ditu:
1. Itzulpena egiteko espainieraz dagoen testuaren analisi sintaktiko osoan oinarritzen da. Analisi sintaktiko oso honek kategoria, morfologia, dependentzia sintaktikoak, etab. ditu eta itzulpena analisi horretan oinarritzen da. Beraz, analisi hori gaizki egina baldin badago, itzulpena txarra izango da.
Adibidez: Itzul-en ezaguna egin den adibide honetan "Miren lleva sus manzanas en un cesto" hau dugu itzulpena: "Haren sagarrak zaramazte saski batean begira bezate".
"Miren" --> aginterako adizki gisa analizatzen du, 3. pertsona plurala. Hortik sortu du "begira bezate".
Bestetik, aditz nagusia "Miren" dela agertzen da, eta horregatik beste elementu guztiak bere azpian zintzilikatzen ditu. Aditz nagusi izate horrek "begira bezate" hori azken lekuan agertzea dakar.
Erroreen tipologia aztertu dugu eta espainierazko esaldiaren analisiak eragindako erroreak %42,76 dira.
Bide batez esan esaldi honetan dagoen beste errore handia "lleva" "zaramazte" gisa itzultzea dela, eta hau datu base lexikoan dugun errore batek eragindako akatsa da.
OpenTrad-en aurkezpena Bartzelonan egin eta berehala, espero ez genuen modukoa izan da prentsan izandako oihartzuna. Euskal prentsaz gain, estatu mailakoa eta baita prentsa espezializatuan ere.
Ikus OpenTrad-en prentsa erreferentzien atala.
Blog-etan ere espero baino ikusmin handiagoa sortu du. Ikus honakoak:
2006ko maiatzaren 30ean Opentrad proiektuaren emaitzak aurkeztu ziren Bartzelonan.
Proiektuaren inguruko informazio ofiziala hemen dago.
Proiektu honetan sortu dira estatu espainiarreko hizkuntza nagusien bikote gehienetarako kode irekiko itzulpen automatikoko sistemak.
Proiektuan abiadura handiko eta kode irekiko itzulpen automatikoko bi teknologia garatu dira: apertium eta matxin.
Lehena hizkuntza ahaideko bikoteentzat da, transferentzia sintaktiko partziala eginez.
Matxin-ek, berriz, transferentzia sintaktiko oso burutzen du, elkarrengandik urrutiago dauden hizkuntz bikoteentzat egokiagoa izanik.
Azken erantzunak
es-eu itzulpen automatikoa egiten duen lehen prototipoa sortu da opentrad proiektuaren barruan. www.opentrad.org helbidean itzulpenak egin daitezke doan. matxin.sourceforge.net helbidean teknologia eskura dezakezu.
| Ast | Ast | Ast | Ost | Ost | Lar | Iga |
|---|---|---|---|---|---|---|
| << < | > >> | |||||
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 12 | 13 | 14 | 15 | 16 | 17 | 18 |
| 19 | 20 | 21 | 22 | 23 | 24 | 25 |
| 26 | 27 | 28 | 29 | 30 | ||