Nou repte: fer que Siri i Alexa ens parlin en català

Siri, Alexa, Cortana formen part, cada dia més de les nostres vides. Ajudants (i gairebé amigues) que ens faciliten la vida només amb demanar-les què necessitem o què ens han de recordar. Però per ara, comunicar-nos amb elles en català és poc menys que impossible. Per parlar d’aquest tema, i sobretot dels reptes que implica i de quines accions es preparen per solventar-lo, es va celebrar la Jornada sobre assistents de veu i llengua catalana. Us expliquem què s’hi va dir!

Aquesta jornada, organitzada pel Departament de Cultura i el de Polítiques Digitals i Administració Pública de la Generalitat de Catalunya va tenir lloc el 14 de febrer de 2020 a l’espai Movistar Centre de Barcelona. La trobada, liderada i moderada per la periodista Mariola Dinarès, presentadora del programa de Catalunya Ràdio Popap, va reunir a experts i institució per reflexionar i debatre sobre el futur del català i la seva presència en els assistents virtuals i va ser un espai per exposar l’estat actual en què es troba aquesta tecnologia, alhora que discutir les dificultats que existeixen avui i les que ens trobarem en el futur.  

La primera taula rodona va reunir a Xavier Fisa, de Lavinia Voice, Àlex Hinojo, activista cultural, i Maite Melero, doctora en lingüística computacional al Barcelona Supercomputing Center

Els tres experts van explicar en quin punt es troba la tecnologia dels assistents de veu dins el marc català. Melero va explicar que la tecnologia per a crear un assistent de veu en català ja existeix, però que ens trobem el problema de la manca de dades. Per poder desenvolupar aquesta intel·ligència seria necessari que es bolquessin grans quantitats de dades d’àudio i transcripcions als sistemes dels assistents de veu. Tot i això, els tres ponents van identificar un altre factor que interfereix en la comercialització del producte en català: les grans empreses tecnològiques. Apple, Samsung, Amazon, Google, són qui prenen la decisió final de produir o no assistents de veu en català. I tot depèn del cost que els hi suposi implementar-ho i el guany que hi puguin obtenir. 

La taula rodona també va servir per plantejar diversos escenaris de futur sobre com evolucionaran en els pròxims anys els assistents de veu. Tots van compartir la visió que el futur passa per la desaparició de l’aparell físic com a tal, és a dir, que la interacció per veu es farà sense que hi hagi cap dispositiu visible. Per exemple, Xavier Fisa afirmava que d’aquí a uns anys, quan anem a la consulta del metge, ens prendran la pressió mitjançant uns sensors ambientals que s’activaran a través de la veu. Tot i això, l’objectiu final és que aquesta nova tecnologia no només sigui capaç de reconèixer la informació, sinó que la pugui relacionar i reaccionar-hi.

La segona taula de la jornada va ser un recull d’experiències professionals d’empreses i entitats sobre les seves interaccions amb els assistents de veu en català. La taula va reunir a Judith de Argila, CCMA, Carol Cortés, Verbio, Baybars Kulebi, Col·lectivaT, i Joan Montané, Softcatalà.  

De Argila va destacar la dificultat a l’hora de crear experiències amb l’usuari quan s’integren dos idiomes, ja que es generen problemes quan l’usuari interactua en català amb un aparell que no reconeix l’idioma. En aquesta taula també es va posar en relleu la necessitat de generar dades en català per poder desenvolupar un assistent de veu en la nostra llengua. Per solucionar aquest problema, Montané va presentar el projecte Common Voice, que té l’objectiu de reduir les desigualtats en el món de la veu digital. La pàgina web és una plataforma perquè qualsevol persona pugui generar dades en català que després les empreses puguin utilitzar per desenvolupar un sistema de reconeixement de veu en català.  

 

Propostes de futur

La jornada també va servir perquè les Direccions de Política Lingüística i de Societat Digital de la Generalitat presentessin el projecte de creació d’un motor públic de veu en català amb mòduls oberts de reconeixement de la parla (ASR), interpretació del llenguatge natural (NLU), gestió del diàleg (DM), generació de resposta (NLG) i síntesi de parla (TTS). Aquests mòduls es posaran a disposició de l’Administració de la Generalitat per garantir que els serveis públics utilitzen la llengua pròpia de Catalunya, i també s’oferiran a les empreses privades i les organitzacions i altres administracions que vulguin incorporar la veu en català a la seva oferta de productes i serveis. L’objectiu és incentivar el servei de veu en català i que progressivament sigui adoptat i desenvolupat per la iniciativa privada, com va passar amb els sistemes de traducció automàtica els primers anys 2000. 

El Govern també estimularà la creació d’experiències de veu en català per ampliar el nombre d’aplicacions vinculades als assistents d’iniciativa privada com Google Home o Alexa d’Amazon. També s’impulsaran accions de sensibilització entre el sector empresarial i entre la ciutadania per promoure l’oferta i el consum d’experiències de veu en català.

Se’n preveu la plena operativitat en tres anys des de l’inici del projecte. N’estarem al cas!

 

Maria Vidal Robles 

Deixa un comentari