La UPF desenvolupa un principi neurocientífic per la IA generativa

Per Redacció, 13 setembre, 2024

Un nou principi de comportament ha estat desenvolupat per neurocientífics de la UPF, la qual cosa suposa un gran avenç per treballar amb agents virtuals que es comportin cada cop de forma més semblant als humans i siguin capaços d'interactuar amb les persones per ajudar-les a satisfer les seves necessitats en múltiples camps. Aquests agents virtuals es desenvolupen a partir de models d'intel·ligència artificial generativa, el vessant més conegut dels quals són les aplicacions generadores de text, vídeo o àudio, però que també s'està utilitzant per reproduir el comportament humà.

Perquè els agents virtuals siguin cada cop més semblants a les persones, és fonamental determinar quin paradigma s'ajusta millor a la conducta humana i tenir-ho en compte per dissenyar els algorismes i els sistemes de Deep learning amb xarxes neuronals artificials amb què es creen aquests robots.

En aquest sentit, un grup d'investigadors del Center for Brain and Cognition (CBC ) de la UPF han elaborat un nou paradigma en neurociència sobre el comportament humà que desafia la teoria majoritària fins al moment, segons la qual les persones actuen per maximitzar les recompenses externes. Han definit el nou Principi d'Ocupació Màxima (MOP), segons el qual les persones tenen motivacions intrínseques que les porten a ocupar el màxim d'espais possibles i a experimentar el major nombre d'estats. Les recompenses externes serien un mitjà per poder continuar vivint noves experiències, no un objectiu per si mateix.

Tot i que el MOP presenta paral·lelismes amb paradigmes ja teoritzats en psicologia o estudis de conducta, aquesta és la primera vegada que es demostra en el camp de la neurociència, a partir d'agents virtuals amb xarxes neuronals artificials basades en l'estructura del cervell humà. De fet, l'equip de recerca ha posat a prova i demostrat aquest nou paradigma en neurociència amb un agent virtual, els algorismes del qual li permetien fer el que volgués, en funció de les reaccions de les seves xarxes neuronals artificials als estímuls de l'entorn, excepte pels límits marcats pels tradicionals principis de la robòtica d'Isaac Asimov.

Els investigadors, del grup de Neurociència Teòrica i Cognitiva (TCN ) del CBC de la UPF, han examinat la conducta d'aquest agent virtual en diversos entorns on se li presentaven diversos estímuls com objectes, joguines... Aquest estudi, divulgat recentment a la revista Nature Communications, els ha permès constatar que l'agent no actuava per maximitzar les seves recompenses, sinó que fonamentalment experimentava, provant el major nombre d'accions i estats possibles com pot ser saltar, fer tombarelles, ballar de diferents maneres, tocar i fer servir els objectes o joguines virtuals de diferents maneres... També es desplaçava al màxim de llocs possibles en funció de les condicions i les limitacions de l'entorn.

Més enllà del món de la robòtica, els investigadors defensen que el MOP dona una explicació més racional i plausible a la curiositat i la variabilitat del comportament humà, en funció de les condicions del context. Aquest model de comportament es posa clarament de manifest amb la conducta dels nadons, ja que durant els primers mesos de vida no deixen d'explorar constantment el seu entorn, moure el seu cos de diferents maneres, balbucejar per provar diferents sons... Aquesta curiositat i capacitat d'exploració és fonamental per al procés de desenvolupament i aprenentatge.

En el cas dels adults, aquest afany per explorar i provar noves experiències continua existint. Però, atès els condicionants del context social i econòmic del món en què vivim, les persones adultes comprendrien que necessiten mitjans, recursos i energia (feina, diners, menjar...) per poder seguir provant noves experiències o viatjar a diferents llocs.

Principi d'Ocupació Màxima

Així doncs, si aquest nou principi neurocientífic explica millor el comportament humà, també hauria de servir per dissenyar agents virtuals que reprodueixin millor la seva conducta. Per a Rubén Moreno-Bote, director del grup de recerca en Neurociència Teòrica i Cognitiva del CBC de la UPF, "el Principi d'Ocupació Màxima constitueix un avenç rellevant per millorar els models d'IA generativa del comportament humà, el potencial de futur dels quals és enorme en múltiples camps".

En el futur, els agents no només podran interactuar amb una persona per identificar i satisfer les necessitats concretes per moure's, aprendre, fer exercici físic, organitzar l'economia domèstica.., sinó que també poden servir per fer experiments sociològics. Per exemple, es podrien agrupar diversos agents virtuals en un context concret per analitzar si col·laborarien, competirien, etc. Així doncs, també pot tenir aplicacions en el camp de la sociologia o l'economia, entre altres disciplines.