A ciencia galega logra que unha máquina lea e comprenda «O Quixote» en 20 segundos

Raúl Romar García
r. romar REDACCIÓN / LA VOZ

CIENCIA

ANGEL MANSO

Un equipo da Universidade da Coruña bate a marca mundial de velocidade e precisión dos analizadores sintácticos utilizados para axudar a as aplicacións a comprender a linguaxe humana

07 jun 2019 . Actualizado ás 20:09 h.

As máquinas falan aos humanos e nós podemos comunicarnos con elas. É posible desde hai anos e calquera pode comprobalo cun asistente de voz instalado no seu móbil ou computador. Pero, exprésanse de forma adecuada?, realmente entenden o que lles dicimos? A clave da linguaxe radica na correcta orde e na relación das palabras contidas nunha oración para expresar xustamente o que queremos expresar. En definitiva, na sintaxe, porque non significa o mesmo «a cidade dos rañaceos» que «os rañaceos da cidade». Son diferenzas sutís que aínda se lle resisten á intelixencia artificial. E si, unha máquina suspendería un exame de sintaxe de instituto.

O desafío pasa entón por conseguir que as máquinas poidan replicar a linguaxe humano. Ou, o que é o mesmo, en desenvolver programas analizadores sintácticos precisos e rápidos, un reto no que os que máis lonxe chegaron en todo o mundo son os investigadores da Facultade de Enxeñería Informática da Universidade da Coruña adscritos ao proxecto europeo Fastparse, financiado polo Consello Europeo de Investigación.Tamén forman parte do centro de investigación CITIC.

O equipo, dirixido polo investigador Starting Grant Carlos Gómez Rodríguez e integrado por Daniel Fernández, Michalina Strzyz e David Vilares, bateron tanto a marca mundial de precisión dun analizador, o que mide o seu grao de fiabilidade, como o de velocidade de procesamiento. O grupo presentará os seus resultados no congreso norteamericano da Asociación de Lingüística Computacional, que se celebrará entre mañá domingo e o 7 de xuño en Minneapolis.

A precisión dun analizador mídese, de forma estándar, segundo a proporción de relacións entre palabras que é capaz de atopar nunha colección de noticias xornalísticas en inglés. Neste caso, o sistema dos investigadores da UDC conseguiu unha cifra do 94,43 % de acertos, por amais da anterior marca do 94,21 % logrado no 2018 por científicos das universidades Carnegie Mellon e Tsinghua. Por pór un exemplo, na frase María comeu unha mazá, aínda que as hai máis complexas, a aplicación ten que entender que María é o suxeito e mazá o complemento directo. Así se mide a porcentaxe de éxito.

Pero cando se manexa un volume enorme de datos a velocidade de procesamiento é aínda máis importante, xa que do que se trata é de analizar máis texto en menos tempo. Neste caso, os informáticos da UDC crearon un analizador capaz de procesar a alta precisión máis de 700 oracións por segundo, fronte ás 400 acadados polos máis rápidos que existían anteriormente, desenvolvidos pola Universidade de Stanford. Ou, por pór un exemplo, podería ler, analizar sintácticamente e comprender o texto do Quixote en tan só 20 segundos.

Aplicacións

«A idea do noso traballo é que as máquinas sexan capaces de comprender a linguaxe humana de forma adecuada e precisa», explica Carlos Gómez, que lidera o proxecto Fastparse.

A investigación ten unha aplicación directa tanto na mellora dos asistentes de voz como na dos buscadores de Internet ou na tradución automática de textos. «O noso sistema presenta, ademais, a vantaxe de que funciona para múltiples idiomas», destaca Gómez, quen tamén destaca que pode ter outras utilidades, desde a análise de cantidades inxentes de datos en Internet ao exame das tendencias sociais e da opinión pública a través do seu uso das redes sociais.

«Máis importante que o feito de poder falar a unha máquina éo que esta nos entenda, que saiba o que dicimos», precisa o investigador, cuxo equipo terá a oportunidade de establecer no congreso norteamericano contactos con empresas interesadas no seu revolucionario sistema. Aínda que o software que desenvolveron é de acceso libre.