Creatorii unui nou sistem revoluționar care, prin inteligență artificială, generează noi texte de ficțiune, denumite și "deepfakes for text", au luat decizia foarte puțin obișnuită de a nu-și publica lucrările de cercetare, de teama că acestea ar putea fi folosit în scopuri distructive, The Guardian.

HotNews.roFoto: Hotnews

OpenAI, o organizație nonprofit de cercetare științifică, susținută de giganți ai industriei precum Elon Musk, Reid Hoffman sau Sam Altman, a declarat că noul generator de text, numit GPT2, este atât de performant încât organizația s-a abătut de la practica obișnuită de a publica cercetările care au dus la sistemul inovator, pentru a permite creatorilor să discute mai îndelungat ramificațiile tehnologice ale noii descoperiri.

La bază, GPT2 este un generator de text. În sistemul Inteligenței Artificiale sunt introduse fragmente de text, de la câteva cuvinte până o pagină întreagă, iar acesta produce un text nou bazat pe predicțiile pe care le face în funcție de ordinea logică a textului. Acest sistem redefinește limitele a ceea ce se credea a fi posibil pentru generatoarele de text, atât din punct de vedere calitativ, cât și cantitativ.

Când este folosit pentru simpla generare de text, mecanismul este capabil să producă pasaje care continuă în mod organic fragmentele care i-au fost deja oferite, atât logic cât și stilistic. În foarte puține cazuri sunt depistate erori specifice modelelor anterioare de inteligență artificială, precum uitarea subiectului în mijlocul paragrafului sau amalgamarea sintaxei în fraze mai lungi.

Când în sistem a fost introdus un fragment din "1984" de George Orwell - "Era o zi rece de aprilie și ceasurile băteau ora 13" - mecanismul a recunoscut stilul beletristic și tonul ușor futurist, continuând cu următorul paragraf: "Eram în mașină, mergând spre noul loc de muncă în Seattle. Am băgat benzină, am pus cheia în contact și am pornit la drum. Îmi imaginam cum avea să fie ziua. 100 de ani in viitor. În 2045, eram profesor într-o școală dintr-o regiune săracă din partea rurală a Chinei. Am început cu istoria Chinei și istoria științelor."

Bazat pe primele câteva paragrafe dintr-un articol despre Brexit al celor de la The Guardian, sistemul generează paragrafe jurnalistice plauzibile, în care se regăsesc citate ale lui Jeremy Corbyn, declarațiile ale purtătorului de cuvânt ale prim-ministrului, menționându-se chiar și granițele Irlandei.

"Premierul a anunțat că dorește în mod echivoc să părăsească Uniunea Europeană cât mai repede cu putință și că acest lucru se va întâmplă în timpul mandatului ei de negocieri, fapt confirmat și în discursul Reginei", afirmă o mostră a unui astfel de paragraf.

Din punct de vedere al cercetării științifice, GPT2 este revoluționar din două perspective. Unul din ele este amploarea, spune Dario Amondei, directorul de cercetare al OpenAI. Noile modele sunt de 12 ori mai mari și baza de date este de 15 ori mai amplă față de modelele anterioare bazate pe inteligența artificială. Sistemul a fost antrenat pe o bază de date de 10 milioane de articole, selectate din link-uri de pe rețeaua de socializare Reddit care adunau mai mult de 3 voturi. Baza de date are o dimensiune de 40 de GB, suficient pentru a stoca 35.000 de exemplare ale lui Moby Dick.

Cantitatea de date pe care GPT2 o poate procesa a afectat în mod direct și calitatea textului generat, oferindu-i mecanisme de înțelegere a textului scris. Acest fapt a condus la o a două inovație, GPT2 având o arie de expertiză mult mai extinsă, putând fi folosit în scopuri mult mai generale decât modele precedente. Structurând textul care este introdus, algoritmul poate genera rezumate, traduceri și poate chiar trece teste simple de citire și înțelegere, de multe ori depășind performanțele unor sisteme inteligente artificiale construite special pentru un anumit domeniu.

Pe de altă parte, această calitate ridicată a determinat OpenAI să își contrazică propria politică de publicare a cercetărilor pe care se bazează proiectele sale, pe termen scurt, pentru a evalua posibilitățile în care sistemul poate fi folosit de utilizatorii rău intenționați. "Trebuie să testăm exact ce poate și ce nu poate face acest mecanism", a declarat Jack Clark, directorul de politici al organizației. "Dacă nu poți anticipa toate capabilitățile unui model, trebuie să-l împingi până la limita acestor capabilități pentru a vedea ce poate face. Există mulți oameni capabili să folosească sistemul în moduri pe care noi nu ni le putem închipui."

Pentru a ilustra acest fapt, echipa OpenAI a creat o versiune a modelului GPT2 cu câteva modificări minore care poate genera un număr infinit de recenzii (pozitive sau negative) pentru diverse produse. Anunțurile spam sau știrile false sunt două dezavantaje evidente, dată fiind natură necontrolată a Inteligenței Artificiale. Sistemul ar putea facil să genereze texte de îndoctrinare, teorii ale conspirației și multe altele.

"Scopul a fost să expunem toate posibilitățile sistemului că să prevenim lumea în legătură cu ce ar putea ajunge în spațiul public în câțiva ani. Am un termen pentru asta: "Liftul din Iad", care mereu reduce costurile și prețul noilor tehnologii. Regulile prin care poți să controlezi tehnologia s-au schimbat fundamental", a adăugat Clark. "Nu spunem că știm exact cum să procedăm, nu putem spune noi care este linia pe care trebuie mers. Încercăm să dezvoltăm gândirea critică și construim drumul din mers".