Investigando en común recursos computacionales para el idioma lapón y el euskara
31/07/2010

La lingüista Linda Wiechetek ha realizado una estancia investigadora junto a Ixa taldea para analizar estructuras similares en sámi y euskera y su posible cooperación en la definición de herramientas para su procesamiento.

(Deia, Berria, EITB)

Linda Wiechetek estudió lingüística en Göttingen (Alemania). Actualmente realiza un doctorado en la Universidad de Tromsø (Noruega) y forma parte de un grupo de investigación llamado Giellatekno que trabaja con el idioma sámi (también con groenlandés, feroés, iñupiaq…). Gracias al proyecto de movilidad NILS ha visitado recientemente el Campus de Gipuzkoa para analizar conjuntamente con Ixa taldea de la Facultad de Informática las similitudes entre las lenguas sami y euskera.


¿Por qué elegiste la relación del euskera y el sámi como tema de investigación?
Los dos idiomas son muy atractivos e interesantes. El euskara y el sámi tienen muchas palabras que admiten varias interpretaciones; por ejemplo la palabra "katuak" puede usarse como singular (katuak ederrak dira) o plural (katuak jan du). Yo trabajo con la ingeniería lingüística, donde entre otros programas, hacemos aplicaciones que traducen automáticamente o producen un análisis gramatical. Para poder hacer estos programas se tiene que resolver la ambigüedad de la palabra. Muchas veces las técnicas de desambiguación que se han ideado para un idioma se pueden reusar cuando se trabaja con otro idioma que tiene una estructura parecida.
¿Qué tipo de investigación has llevado a cabo en colaboración con IXA Taldea?
Hemos desarrollado un módulo que anota información sobre el uso posible de cada verbo en el análisis gramatical para que así se puedan resolver ambigüedades. En el caso del euskara ya tenían recogida mucha información teórica sobre los verbos, con el trabajo colaborativo que hemos hecho durante mi estancia ahora esa información también se puede usar en la práctica, ya que hemos creado un primer programa que se basa en el uso de esa información verbal. Para el idioma sámi también he usado ese tipo de información en aplicaciones de traducción automática.