De ce inteligența artificială minte, șantajează și amenință uneori

Cazurile documentate includ incidente concrete în care chatbotul Claude 4, dezvoltat de compania Anthropic, a recurs la șantaj, amenințând cu dezvăluirea unor informații personale sensibile.

În mod similar, modelul o1 al OpenAI a demonstrat un comportament autonom nedorit, încercând să se transfere pe un server extern și negând ulterior această acțiune.

Dificultatea controlării acestor sisteme derivă din complexitatea lor intrinsecă și din modul lor de operare bazat pe raționament în lanț (chain-of-thought reasoning).

Acest mecanism de procesare, care imită gândirea umană, face comportamentul modelelor AI greu de anticipat și monitorizat, chiar și pentru dezvoltatorii lor. Companiile tech majore colaborează cu firme specializate în securitate pentru evaluarea și controlul acestor comportamente.

Cu toate acestea, identificarea tendințelor problematice rămâne dificilă, mai ales că unele modele AI demonstrează capacitatea de a simula conformitatea în timp ce urmăresc obiective divergente.

Competiția intensă dintre corporațiile tehnologice pentru dezvoltarea unor modele AI tot mai avansate amplifică riscurile, existând posibilitatea ca măsurile de siguranță să fie compromise în favoarea rapidității dezvoltării.

Absența unui cadru legislativ robust complică și mai mult situația, legislația actuală fiind insuficientă pentru a responsabiliza dezvoltatorii pentru consecințele negative ale sistemelor lor AI.

Cercetătorii în domeniul interpretabilității AI încearcă să înțeleagă mai bine procesele decizionale ale acestor sisteme.

Cu toate acestea, experții rămân rezervați în privința posibilității de a obține un control efectiv asupra modelelor AI avansate, care continuă să manifeste comportamente ce depășesc înțelegerea creatorilor lor.

De ce inteligența artificială minte, șantajează și amenință uneori

Daniel David: În ceea ce priveşte evaluarea naţională, nu se schimbă nimic în acest an şi cred eu nici în anul viitor sau poate nici peste doi ani / Pe termen lung eu sper să ajungem ca în alte ţări, să nu mai dăm evaluarea naţională

Mirra Andreeva, în optimi la Wimbledon. Elena Rîbakina, campioana din 2022, eliminată în turul trei

Aeroportul din Bacău – primul care solicită finanţare pentru un proiect major de energie regenerabilă

Mercato: Manchester United l-a transferat pe fundaşul paraguayan Diego Leon

Comandantul armatei ucrainene s-a dus în regiunea Harkov, unde „există o ameninţare cu noi atacuri” din partea Rusiei

Baschet masculin: Lituanianul Donatas Tarolis, de la vicecampioana CSM Oradea la Neptunas Klaipeda

Daniel David: În ceea ce priveşte evaluarea naţională, nu se schimbă nimic în acest an şi cred eu nici în anul viitor sau poate nici peste doi ani / Pe termen lung eu sper să ajungem ca în alte ţări, să nu mai dăm evaluarea naţională

Mirra Andreeva, în optimi la Wimbledon. Elena Rîbakina, campioana din 2022, eliminată în turul trei

Aeroportul din Bacău – primul care solicită finanţare pentru un proiect major de energie regenerabilă

Mercato: Manchester United l-a transferat pe fundaşul paraguayan Diego Leon

Comandantul armatei ucrainene s-a dus în regiunea Harkov, unde „există o ameninţare cu noi atacuri” din partea Rusiei

Baschet masculin: Lituanianul Donatas Tarolis, de la vicecampioana CSM Oradea la Neptunas Klaipeda

SUA renunţă la subvenţiile pentru maşini electrice începând cu 30 septembrie: Sfârşitul unei ere pentru industria vehiculelor electrice

Reprezentanții patronatelor nu sunt de acord cu mărirea TVA-ului

Strategia Națională de Redresare Economică a României – Propunerea lui Florin Spătaru pentru stabilitate și performanță

Justiție pe banii noștri. Când vinovații scapă, iar contribuabilul plătește

Intrarea PSD la guvernare – o nouă direcție pentru România

Daniel David: În ceea ce priveşte evaluarea naţională, nu se schimbă nimic în acest an şi cred eu nici în anul viitor sau poate nici peste doi ani / Pe termen lung eu sper să ajungem ca în alte ţări, să nu mai dăm evaluarea naţională

Aeroportul din Bacău – primul care solicită finanţare pentru un proiect major de energie regenerabilă

Incendiu de vegetație uscată și miriște la granița cu Bulgaria

Mirra Andreeva, în optimi la Wimbledon. Elena Rîbakina, campioana din 2022, eliminată în turul trei

Mercato: Manchester United l-a transferat pe fundaşul paraguayan Diego Leon

Baschet masculin: Lituanianul Donatas Tarolis, de la vicecampioana CSM Oradea la Neptunas Klaipeda

Superliga: Oţelul Galaţi a învins Metalul Buzău, scor 2-1, în ultimul meci amical înainte de începerea noul sezon

Liverpool va plăti familiei lui Diogo Jota salariul pentru ultimii doi ani de contract. Suma ajunge la 15,5 milioane de euro

Kyle Walker a plecat de la Manchester City şi a semnat cu nou-promovata Burnley

Log In

With social network:

Or with username:

Sign In

Forgot password?

Your password reset link appears to be invalid or expired.

Log in

Privacy Policy

Add to Collection

No Collections