Nire ikerketa-lana, nagusiki, Hizkuntzaren Prozesamenduaren (HP) arloan kokatzen da
Nire ikerketa-lana Hizkuntza Naturalaren Prozesamendua (HP), Adimen Artifiziala (AA) eta Ikasketa Automatikoa (ML) uztartzen dituen gurutzagunean kokatzen da, eta arreta berezia eskaintzen diot antzekotasun semantikoa ulertu eta modelatzeari, hau da, makinek nola interpretatzen duten hitzen, esaldien eta testuen esanahia. iXa ikerketa-unitateko eta HiTZ Hizkuntza Teknologiaren Zentroko kide gisa, Euskal Herriko Unibertsitatean (UPV/EHU), hizkuntza-teknologiaren garapenean lan egiten dut. Nire helburu abstraktua sistema adimendun, etiko eta hizkuntzaz jabe direnak sortzea da.
Esperientzia zabala testuaren antzekotasun semantikoan (STS)
Nire ibilbide akademikoa hizkuntzaren prozesamendu konputazionalaren jakin-minetik eman zen, eta horrek HPn master bat eta doktorego bat egitera eraman ninduen. Ordutik, nire ikerketa antzekotasun lexiko eta semantikoan, testuen ulermenean eta esanahiaren adierazpenean oinarritu da; hau da, makinek hizkuntza benetan ulertzeko erronka nagusietan. Kontzeptu horiek aplikatu ditut hainbat zereginetan, esaterako: esaldien parekotasunaren detekzioa, esaldien lerrokatzea, testuaren antzekotasun semantikoa (STS) eta hizkuntza inferentzia naturala (NLI).
Azken lanak
Azkenaldian, hizkuntzaren adierazpenerako deep learning ereduak diseinatu eta ebaluatzeko lanetan aritu naiz, PyTorch, TensorFlow eta Keras bezalako framework-ak erabiliz. Interes berezia dut transfer learningean eta aurreentrenatutako hizkuntza ereduetan (BERT, Llama, GPT), batez ere, baliabide gutxiko hizkuntzetara (hala nola euskara) egokitzeko eta domeinu espezifikoko arazoei aurre egiteko gaitasunean.
Garapen teorikotik harago, uste dut ikerketak mundu errealeko arazoei konponbideak emateko balio behar duela. Orohar, adimen artifizial aplikatuko proiektuetan parte hartu dut, hala nola garraioa, logistika edo industria 4.0 bezalako sektoreetan, non hizkuntza naturaleko interfazeek eta bilaketa semantikoak erabiltzailearen esperientzia eta erabakiak hartzea hobetzen duten.
Software librea
Adimen artifizialeko tresna ireki eta berrerabilgarrien aldeko apustua egiten dut, eta ikerketa erreproduzigarria bultzatzen dut. Horretarako, softwarea maiz argitaratzen dut githuben, baita hainbat baliabide komunitate zientifikoari laguntzeko asmoz.
Iragana, oraina eta etorkizuna
45 artikulu zientifiko baino gehiago eta 3.000 bat aipamenekin, nire lanak kongresu eta aldizkari nagusietan aurkeztuak izan dira. HP arloko aldizkari eta kongresuetan epaimahaikide naiz, eta ikasle eta ikertzaile gazteen mentoring-a ere egiten dut aktiboki.
Etorkizunera begira, HP multilinguala, AA azalgarriagoa eta testu-ulermena hobetzeko ikuspegi neuronalak sakondu nahi ditut, eta hizkuntzalaritza, datu-zientzia eta hezkuntzaren arteko elkargunean ikertzen jarraitu. Nire pasioetako bat da HP baliatzea informazio-sistema adimentsuagoak, bidezkoagoak eta irisgarriagoak sortzeko, sistema horiek hizkuntza benetan uler dezaten helburuarekin.
Proiektu bakoitzean, hizkuntzalaritzaren intuizioa, gaitasun konputazionala eta kontzientzia etikoa uztartzen saiatzen naiz, hizkuntza-teknologiak zer lor dezakeen are gehiago esploratzeko.