Cercetarea subliniază că un AI nu poate experimenta direct senzațiile asociate cu o floare, cum ar fi mirosul, atingerea petalelor sau explorarea unui câmp plin cu acestea.
Absența acestor experiențe senzoriale și motorii împiedică AI-ul să internalizeze semnificația completă a conceptului de floare, o problemă care se extinde și la alte concepte umane.
Studiul, publicat în revista Nature Human Behaviour, atrage atenția asupra implicațiilor pe care le are această diferență de înțelegere asupra interacțiunilor dintre AI și oameni.
Dacă AI-ul percepe lumea într-un mod fundamental diferit, acest lucru ar putea influența modul în care interacționează cu noi.
În cadrul cercetării, oamenii de știință au comparat modul în care oamenii și modelele LLM înțeleg o gamă largă de 4.442 de cuvinte, analizând asemănările dintre reprezentările cognitive umane și cele generate de modele de top precum GPT-3.5 și GPT-4 de la OpenAI, respectiv PaLM și Gemini de la Google.
Evaluările au inclus analiza cuvintelor pe baza unor dimensiuni precum intensitatea emoțională, gradul de concretizare și capacitatea de a genera imagini mintale, precum și evaluarea legăturii conceptelor cu informații senzoriale (atingere, miros, auz, vedere) și motorii (acțiuni realizate cu diferite părți ale corpului).
Scopul a fost de a determina gradul de aliniere dintre AI și oameni în evaluarea acestor concepte.
Analizele au verificat corelațiile dintre percepțiile umane și cele generate de AI asupra emoționalității sau a vizualizării unui cuvânt și au evaluat modul în care oamenii și AI-ul combină diverse dimensiuni pentru a forma reprezentări conceptuale și a face conexiuni între cuvinte.
Rezultatele au indicat că AI-ul performează bine în cazul cuvintelor abstracte, care nu sunt legate de simțuri sau acțiuni fizice. Cu toate acestea, în cazul cuvintelor legate de percepțiile senzoriale și de interacțiunea fizică, AI-ul nu reușește să capteze în profunzime sensul uman.
Această limitare este cauzată de faptul că majoritatea modelelor LLM se bazează exclusiv pe limbaj, iar limbajul singur nu poate reda complexitatea completă a unui concept.
Chiar dacă LLM-urile pot aproxima unele concepte, în special cele abstracte, procesul nu este eficient, necesitând cantități uriașe de text pentru a atinge o înțelegere care încă nu se compară cu experiența umană directă.
Cu toate acestea, se anticipează că modelele AI vor continua să se îmbunătățească, potențial reușind în viitor o reprezentare mai fidelă a conceptelor umane.
Studiul a demonstrat deja că modelele antrenate atât cu imagini, cât și cu text, au performanțe mai bune în ceea ce privește conceptele legate de vedere.
În plus, combinarea acestor modele cu date senzoriale și robotică ar putea permite perceperea și interpretarea lumii fizice într-un mod mai apropiat de cel uman.