Gallach: “La IA ens ha de portar a una societat millor”
El PERTE de la Nova Economia de la Llengua és un projecte transversal que treballa en l'àmbit de la intel·ligència artificial, la traducció, l'aprenentatge, la divulgació cultural, la producció audiovisual, la investigació i la ciència. A Espanya, el PERTE es planteja com una oportunitat per “aprofitar el potencial de l'espanyol i de les llengües cooficials com a factor de creixement econòmic i competitivitat internacional en diverses àrees”. Compta amb un pressupost de 1.100 milions d'euros d'inversió pública, amb l'objectiu de mobilitzar 1.000 milions d'inversió privada més. Convidada per la Comissió de Societat Digital d'Enginyers Industrials de Catalunya, la Comissionada Especial per a l'Aliança per la Nova Economia de la Llengua, Cristina Gallach, ens en dona detalls, en aquesta entrevista a Fulls d’Enginyeria.
Per què és important aquest PERTE? En quina situació està la llengua espanyola en l’espai digital?
És crucial per dos aspectes. Un, perquè s'està generant una economia nova vinculada a tots els processos de digitalització. És l’economia del futur; encara és dèbil, i està dominada per les grans plataformes. Nosaltres hem d'assegurar-nos que traslladem recursos i mecanismes de suport a les empreses tant petites com mitjanes, perquè es desenvolupin al màxim en aquest sector. En segon lloc, perquè el pes en l’esfera digital del castellà, tot i ser una llengua molt parlada al món, és molt menor pel fet que es troba dominada per l'anglès i el xinès. Cal posar recursos per aixecar la presència del castellà o, sinó, les maquines ens parlaran en un castellà-anglès. Això seria inacceptable! Sobretot si tenim en compte que les màquines ens parlaran constantment... És, per tant, un sector estratègic perquè la llengua és bàsica per la vida quotidiana.
Ja hi ha projectes en marxa?
Sí, però sobretot hi ha la base: obtenir un corpus lingüístic del castellà, del català, de l'euskera, del gallec i del valencià que sigui utilitzable per tota mena d'aplicacions. Com més dades lingüístiques hi hagin, orals i escrites, més podrem tenir unes aplicacions adequades i eficaces. Això ho treballem amb una xarxa de centres d'excel·lència en intel·ligència artificial i, en concret, amb tecnologies del llenguatge. Són accions des del punt de vista tecnològic però no podem oblidar la ciència en castellà. Hem d’intentar visibilitzar millor l'actual producció científica en castellà i en llengües cooficials i connectar aquestes grans bases de dades perquè tot això que tenim, que està invisible, surti. També tenim projectes lògicament vinculats a l'ensenyament del castellà. En aquest moment, l'Institut Cervantes té reforços per a transformacions digitals molt importants. L'aprenentatge presencial d'una llengua canviarà a causa de la introducció de nous instruments tecnològics per l'ensenyament.
Parlaves de visibilitzar aquest corpus del castellà, hem d’entendre que també de les llengües cooficials. Com es fa això?
En primer lloc, pel que fa a les dades lingüístiques cal treballar amb els grans centres de computació com seria, en aquest cas, el centre de Computació de Barcelona, perquè siguin capaços d'entrenar models i portar-los a aplicacions concretes a través de donar-los accés a milions de dades de la Reial Acadèmia, la Biblioteca Nacional, centres d'investigació, etc. I, en segon lloc, treballar amb dades lingüístiques orals per poder distingir diferents accents. Parlem a les màquines, però aquestes no tenen la capacitat de reconèixer segons quins accents. Per tant, hem d'entrenar-les perquè reconeguin un accent d'Andalusia, de les illes o un accent d'Amèrica llatina, que n'hi ha de molt específics, com a l'Argentina o l'Uruguai. La llengua és el petroli i el corpus la manera com l’hem transformat perquè sigui utilitzable.
La intel·ligència artificial hi tindrà un paper gran, doncs?
Bàsic. Tot això no es fa si no és amb intel·ligència artificial; i les tecnologies del llenguatge en són un subgrup. És una tecnologia numèrica i funciona gràcies a l'ús d'una gran quantitat de dades per fer projeccions, analitzar estadístiques, etc. Però el 80% de les dades són lingüístiques i s'han d'estructurar i etiquetar bé perquè les màquines les puguin comprendre.
Comentaves abans de no deixar que això quedi en mans de grans empreses sinó que arribi a tothom. Què poden esperar les PIMES catalanes?
Hem iniciat un primer procés de divulgació del PERTE i un altre que ens sembla molt interessant que és el d'interconnexions. S’han fet jornades per a pimes i hi ha convocatòries d'ajudes pensades per a que se’n beneficiïn. Fer créixer el teixit industrial és clau perquè tenim les dades lingüístiques en espais estructurats, en grans centres de computació. Per tant, es poden elaborar en tota mena d'aplicacions i és molt rellevant que siguin aplicacions que en el fons milloraran el benestar de les persones, les gestions administratives, els processos judicials... Sens dubte, la IA és un àmbit a desenvolupar que ens ha de portar a una societat millor, però necessita mecanismes de vigilància.
Aquest és el propòsit final, doncs, el benefici social?
Són desenvolupaments tecnològics que han de contribuir a tenir una vida millor. D'ençà que ens llevem fins que anem a dormir utilitzem constantment aplicacions que estan basades en la IA i ens ajuden. Es tracta d'ampliar això encara més. Hem de pensar en tots els aspectes de suport assistencial. La societat es fa gran, des del punt de vista d'edat, i cada vegada necessitarem més ajudes i interactuar amb màquines perquè ens parlin i ens acompanyin. Tot això és un espai de desenvolupament econòmic, empresarial i social extraordinari.
El Govern català ha impulsat l’AINA, quina relació es pot esperar amb el PERTE?
És una relació molt estreta. El projecte AINA és un projecte pioner per col·locar el català en el món digital i assegurar que hi viu en aquest espai digital. Existeix el perill que les llengües menys parlades desapareguin del món digital per concentrar-nos en l'anglès i en el xinès. Per tant, la creació d'un corpus a través del qual es puguin fer tota mena d'aplicacions és bàsic. Catalunya el va posar en marxa i el Govern de l'Estat li va donar suport. Un corpus on tens castellà, català, basc i gallec és capaç d'alimentar-se positivament, per tant, segons la nostra concepció d'aquest espai de dades lingüístiques escrites i orals, ens sembla molt important que sigui multilingüe.
Quina influència tindrà el projecte respecte a l'humanisme tecnològic i la igualtat de gènere?
Ens preocupa molt que aquesta intel·ligència artificial no sigui inclusiva, que no tingui la diversitat com un dels objectius i que no defensi la igualtat, perquè sabem que hi ha molts baixos i exclusions. Ens trobem davant d’una nova tecnologia i poden haver-hi tota mena d'abusos i molt oportunisme. La tecnologia ha de facilitar la inclusió de les persones amb altres capacitats o amb discapacitats importants. Per tant, jo hi veig aquí dues àrees on hem treballat molt: el marc dels drets digitals d'accés a la digitalització i protecció i, després, el marc en el qual la protecció de la diversitat, el foment de la igualtat i de la inclusió són claus. És importantíssim que estiguem vigilants i que, a més, introduïm mecanismes pels quals es compleixen les normes. L’agència estatal de la IA, en mirall d'accions en l'àmbit europeu, serà l'espai oficial de vigilància. Hem d'assegurar-nos que la innovació té elements correctius i correctors per garantir que ningú queda enrere.
La tecnologia ha de garantir aquesta accessibilitat?
Des de fa temps s'han utilitzat aplicacions tecnològiques basades en IA per ajudar a les persones amb discapacitat. La robòtica és un exemple claríssim, i ara tot el que són les tecnologies de la llengua també han de fer-ho. Per exemple, si tu li dius als assistents de veu, com SIRI o Alexa, estic trist, et contestarà “tinc ganes de fer-te una abraçada”. Si li dius el mateix a la que és la tecnologia homòloga a Rússia, et respon “ningú t'havia dit que seria fàcil”. És molt important que incorporem aquesta mirada humanista en tots aquests processos de gestió de tecnologies del llenguatge per assegurar-nos que realment produïm unes aplicacions que tenen en compte els baixos i els intenten suprimir. Tots coneixem els riscos d’una destacada branca com és el reconeixement facial, de màxima vigilància pels estereotips que es repeteixen. Si alimentes les màquines amb dades que responen als estereotips masculins o els de persones de raça blanca et produeixen això. I si, a més a més, ho fas alimentant les màquines només en anglès, no trobes la diferenciació binària de gènere com al castellà o al català. A les traduccions automàtiques de l'anglès, com no hi ha diferenciació de gènere, “jo soc un enginyer” es tradueix en castellà masculí i “jo soc una infermera” es tradueix en gènere femení. Tots aquests automatismes són els que s'han de corregir.
Comentaves abans el paper que han de tenir els enginyers i enginyeres no només en la nova economia del llenguatge sinó en tots els PERTES en general.
Crec que, probablement no hi ha professió més necessària que l'enginyera per assegurar-nos avenços tecnològics transformadors en tots els àmbits en què actuen els PERTES. Penso que és un moment de transformacions molt dolç i també de gran responsabilitat, reposant en innovació, investigació, ciència i enginyeria. Enginyeria d'enginy i de genialitat, si es pot treballar una mica més la paraula. Per tant, és un moment de valorar moltíssim la professió. La responsabilitat de construir pons, camins, carreteres, edificis..., és crucial, però ara ens trobem parlant d'unes transformacions globals extraordinàries. Des de la lluita contra el canvi climàtic, mobilitat, transformacions en les fonts i l'ús de l'energia, les tecnologies del llenguatge, etc. És importantíssim aquest ventall d'àrees en les quals les enginyeries poden ser totalment transformadores.
No volem acabar sense fer referència a la teva trajectòria. Què suposa per a una periodista com tu arribar a tractar temes tecnològicament complexos?
Realment és un aprenentatge constant i diari. He de confessar que d'enginyeria hi entenc molt poc o res, però si que trobo que, intuïtivament, hem de ser capaços de transmetre la seva importància. Si puc contribuir amb la meva experiència en la mobilització i el meu interès per crear connexions, estic encantada.
Quin balanç en fas d’aquesta trajectòria professional?
He fet una mica de tot en la meva vida professional. Evidentment, sempre més vinculada a la comunicació, el periodisme, les relacions internacionals i la diplomàcia. Ara és un sector específic, però em permet, per exemple, en l'àmbit del castellà i d'Amèrica Llatina estar en contacte amb altres països. Tot és bo del que aprens i t'entusiasmes.