Mi investigación se centra principalmente en PLN
Mi trabajo de investigación se sitúa en la intersección entre el Procesamiento del Lenguaje Natural (PLN), la Inteligencia Artificial (IA) y el Aprendizaje Automático (ML), con un enfoque especial en el estudio y modelado de la similitud semántica, es decir, cómo las máquinas interpretan el significado de palabras, frases y oraciones. Como miembro de la unidad de investigación iXa y del Centro HiTZ de Tecnologías del Lenguaje, en la Universidad del País Vasco (UPV/EHU), trabajo para avanzar en el campo de las tecnologías del lenguaje humano, con el objetivo de construir sistemas más inteligentes, éticos y conscientes del lenguaje.
Amplia experiencia en el ámbito de la Similitud Semántica Textual (STS)
Mi trayectoria académica comenzó con una gran curiosidad por el funcionamiento del lenguaje, que más adelante se materializó en un máster y un doctorado en PLN. Desde entonces, mi investigación se ha centrado en la similitud léxica y semántica, la comprensión de textos y la representación del significado — desafíos clave para lograr que las máquinas comprendan realmente el lenguaje humano. He aplicado estos conceptos a tareas como la detección de paráfrasis, la alineación de oraciones, la similitud semántica textual (STS) y la inferencia de lenguaje natural (NLI).
Líneas de trabajo recientes
Buena parte de mi trabajo reciente se enfoca en el diseño y evaluación de modelos de deep learning para la representación del lenguaje, utilizando frameworks como PyTorch, TensorFlow y Keras. Me interesa especialmente el aprendizaje por transferencia (transfer learning) y los modelos preentrenados tipo BERT, Llama y GPT, tanto por su capacidad de adaptación a lenguas con pocos recursos como el euskera, como por su potencial para resolver problemas específicos de dominio.
Más allá del desarrollo teórico, considero que la investigación debe contribuir a resolver problemas del mundo real. He colaborado en proyectos de PLN aplicados a sectores como el transporte, la logística y la industria 4.0, donde las interfaces en lenguaje natural y la búsqueda semántica mejoran la experiencia de usuario y la toma de decisiones.
Herramientas open source
Mantengo un interés activo por las herramientas de PLN de código abierto y por la investigación reproducible, publicando regularmente código y recursos para apoyar a la comunidad científica.
Trabajo pasado, presente y futuro
Con más de 45 publicaciones revisadas por pares y cerca de 3.000 citas, mi trabajo ha sido presentado en congresos y revistas de referencia internacional. También participo como revisor en revistas académicas y congresos especializados en PLN, y dedico parte de mi tiempo a la mentoría de estudiantes e investigadores jóvenes en el área.
De cara al futuro, planeo profundizar en líneas como el PLN multilingüe, la IA explicable y los enfoques neuronales para mejorar la comprensión textual, explorando siempre la conexión entre lingüística, ciencia de datos y educación.
Me motiva especialmente aplicar el PLN para construir sistemas de información más accesibles, equitativos e inteligentes, que realmente entiendan, y no solo procesen el lenguaje humano.
En cada proyecto, busco combinar intuición lingüística, capacidad computacional y conciencia ética para ampliar los límites de lo que la tecnología del lenguaje puede lograr.