Cercetătorii Facebook traduc folosindu-se de asemănările matematice dintre diversele limbi. Și româna este subiect de cercetare în laboratorul de inteligență artificială de la Paris

Marile companii de tehnologie folsessc unelte de inteligență artificială pentru a obține traduceri instant cât mai bune, iar la Paris Facebook face teste și între română și engleză, rezultatele metodei noi folosite în Franța fiind cel puțin la fel de bune precum la metodele clasice folosite în prezent de Facebook, spune un șef al companiei, citat de AFP. Laboratorul AI Research Paris a fost deschis în 2015.

HotNews.roFoto: Hotnews

La Paris, cercetătorii de la Facebook lucrează la traducerea unor texte într-o limbă străină fără vreun dicționar, ci folosidu-se de similitudinile matematice dintre limbi.

Marile companii de internet au nevoie de tool-uri de traducere automată cât mai performante, fiindcă intră pe cât mai multe piețe și sunt multe țări în care moderatorii umani de conținut nu sunt suficienți pentru a gestiona uriașele cantități de text postate și a putea elimina mesajele care incită la ură. Nu doar Facebook lucrează intens la îmbunătățirea traducerii instantanee, ci și Google, Microsoft, Yandex sau Baidu.

Pe Facebook se vorbesc undeva în jurul a 150-200 de limbi, spune Antoine Bordes, co-director pe cercetările de inteligență artificială ale Facebook în Europa.

Problema este că nu există dicționare complexe pentru fiecare pereche de limbi și tocmai de aceea este nevoie să se găsească un sistem prin care soft-ul să treacă de la o limbă la alta fără aceste ”punți” fundamentale care sunt dicționarele.

Cei de la Facebook încearcă în laboratorul de inteligență artificială de la Paris să rezolve dificultățile bazându-se pe reprezentări matematice ale cuvintelor.

În fiecare limbă cuvintele se gă găsesc sub formă de vectori, într-un spațiu de sute de dimensiuni. Fiecare vector este mai mult sau mai puțin apropiat de alte cuvinte, în funcție de asocierile dintre ele în limba respectivă.

În multe dintre limbi cuvintele ”câine” și ”pisică” au vectori destul de apropiați. La fel și vectorii ce reprezintă nume de țări au multe în comun, spune Guillaume Lample, unul dintre creatorii sistemului inovativ de traducere.

Ideea este că se pot face asocieri între limbi diferite pornind de la faptul că vectorii-cuvinte au tendința de a avea similarități în cadrul unei limbi. La început se pot face doar asemănări grosiere, apoi unele de o mai mare finețe, până la a se ajunge la asocierea unor fraze complete dintr-o limbă cu cele dintr-o altă limbă, fără prea multe erori.

Această metodă de traducere este doar în stadiu de experiment, dar rezultatele sunt promițătoare. De exemplu, pentru perechea de limbi engleză - română, sistemele actuale de traducere automată utilizate de Facebook au performanțe ”egale sau uneori inferioare” față de noua metodă dezvoltată de laboratorul parizian, explică Guillaume Lample.

Pe de altă parte, la perechea de limbi engleză - urdu (limba franca în Paksitan), metoda pariziană dă rezultate net superioare față de traducerile automate convenționale, fiindcă sunt prea puține texte engleză-urdu cu care soft-ul să se ”antreneze”.

Lample spune că pentru a ”desface” o limbă în vectori, soft-ul are nevoie să dispună de cantități enorme de texte scrise, iar acest lucru este imposibil pentru, spre exemplu, limbi din regiunea amazoniană. ”Dacă avem doar zeci de mii de fraze nu va funcționa, avem nevoie de sute de mii, estimează Guillaume Lample, întrebat dacă metoda va funcționa și pentru a face traduceri bune din limba bască într-o limbă vorbită în Amazonia.

Practic, cei de la Facebook lucrează la traduceri fără date paralele - adică fără dicționare sau texte bilingve - iar acest lucru reprezintă o revoluție din punct de vedere conceptual, dar întrebarea este cât de performantă poate deveni metoda și cât de bune pot ajunge rezultatele să fie.

Cercetătorii Facebook traduc folosindu-se de asemănările matematice dintre diversele limbi. Și româna este subiect de cercetare în laboratorul de inteligență artificială de la Paris

Pacientă a dr. Cîrstoiu: „Când a fost grav, de operație, am mers la stat. Când era de consultații, analize și de scos firele, la clinica privată Anemona”

REPORTAJ Cine este Ranga, srilankezul care a ajuns manager de fabrică în România și a organizat o petrecere cu 3000 de oameni în București

Primăria lui Piedone: 1 milion de lei fără licitație, spart în 12 contracte. Totul în trei zile

Ucraina riscă să piardă războiul până la sfârșitul anului, dacă SUA nu trimit mai mult ajutor militar, avertizează directorul CIA

lovedeco.ro: Au renovat și consolidat o casă pe deal, pentru care au construit mobilier dintr-un fost pridvor

Schimbări RCA: Răniții grav și rudele celor decedați în accidente vor fi despăgubiți prioritar - proiect / Despăgubirile cerute depășesc 4,19...

De ce urăște Trump Ucraina? Rădăcinile unei antipatii de lungă durată - Politico

Ciucă povestește culisele desemnării lui Cîrstoiu: Ciolacu ne-a zis cu doar două zile înainte

panorama.ro: Ce va face Israelul după atacul Iranului? Scenariile momentului și „cea mai plauzibilă opțiune”

totuldespremame.ro: Dr. Dan Enescu, chirurg plastician: „În prezent, crește numărul copiilor electrocutați pe garnituri de tren, scade cel al...

Israelul a judecat foarte greșit amploarea atacului iranian. Aștepta, inițial, 10 rachete. Au venit cu sutele - New York Times

FOTO / VIDEO Emiratele Arabe Unite, națiune aflată în deșert, confruntată cu cele mai abundente ploi din istorie. Aeroportul din Dubai și...

Intra în contul tau folosind adresa de e-mail si parola

Creaza un cont nou pe HotNews.ro

Ciucă evită să spună dacă PNL îl susţine pe Iulian Dumitrescu la CJ Prahova

3.200 de tentative de trecere ilegală a frontierei româneşti în 2024 / „Nu există riscuri”

O serie de cutremure a pus în alertă Turcia

Statele Unite s-au opus prin veto aderării depline a Palestinei la ONU

Verdict după 43 de ani în „Colectiv”-ul Irandei: Incendiul în care au murit 48 de tineri a fost provocat defecțiunile electrice ale clubului Stardust

Răzvan Lucescu a ratat calificarea în semifinalele Conference League

Zuckerberg: Meta AI este cel mai bun datorită Llama 3

Europa League: Liverpool și AC Milan, eliminate în sferturi – Duelurile din semifinale

Ucraina riscă să piardă războiul până la sfârșitul anului, dacă SUA nu trimit mai mult ajutor militar, avertizează directorul CIA

Dorinel Munteanu, optimist după ce a dus Oțelul în finala Cupei României: „Suntem pregătiți de Europa”

Cum încearcă Blinken să mobilizeze europenii împotriva Chinei

VIDEO Biden sugerează că unchiul său a fost devorat de canibali

CEO-ul Google News compară inteligența artificială cu un meci de fotbal: „Suntem abia în primele 5 minute” ale jocului

VIDEO Adversara Corvinului Hunedoara în finala Cupei României – Calificare în ultimul minut

VIDEO Actorul Alain Delon, decorat de Zelenski. „Nu sunteți singur”

Guvernul a dat aviz negativ pe proiectul de lege care penaliza practica trimiterii pacienților de la stat la privat

„Un golan cu halat". Reacții după explicațiile dr. Cîrstoiu, candidatul PSD-PNL

REPORTAJ Cine este Ranga, srilankezul care a ajuns manager de fabrică în România și a organizat o petrecere cu 3000 de oameni în București

Primăria lui Piedone: 1 milion de lei fără licitație, spart în 12 contracte. Totul în trei zile

LIVE Război în Ucraina - ziua 785: Olaf Scholz speră ca membrii NATO să livreze Ucrainei șase sisteme Patriot / Șeful CIA avertizează că Ucraina riscă să piardă războiul în lipsa ajutorului suplimentar al SUA / Un polonez este acuzat că colaborat cu Rusia pentru uciderea lui Zelenski

Israelul a judecat foarte greșit amploarea atacului iranian. Aștepta, inițial, 10 rachete. Au venit cu sutele - New York Times

Avertisment la nivel înalt către Israel și Iran: „Ne aflăm în pragul unui război regional. Opriți-vă!”

Zuckerberg: Meta AI este cel mai bun datorită Llama 3

Un senator PSD acuză marile reţele comerciale că restricţionează drastic prezența pe rafturi a produselor de calitate fabricate în România

Grampet Group renunță la vicepreședintele Călin Grațian după ce acesta ar fi atras într-un proiect investitori din Rusia

Una dintre cele mai mari țări din lume a blocat în secret accesul la „X”, platforma social media a lui Elon Musk

Podcast cu Andrei Roșu și Cristian Ionescu. Despre antreprenoriat, munca în corporație, finanțe, călătorii și factoring. “Oamenii care conduc companii importante în România văd o schimbare în mentalitatea generațiilor tinere"

În marș forțat spre „lumea celor patru războaie”. Demisia Occidentului ca hegemon...

A avut și Securitatea un Rocambole al său!

Infrastructură energetică pentru război. Lecții din Ucraina.

Rusia încearcă să facă din Găgăuzia o nouă „Transnistrie”. Același scenariu ca în anii ‘90

Orb prin Gaza

Ghid ANAF 2024 pentru manichiuriste și hairstyliști. Descarcă PDF

Garanția pe sticlă: Patronii de restaurante cer o păsuire. „Încep să curgă zoaie din saci”

iFactor a fost numit startup-ul fintech al anului, la Gala Premiilor RoFintech 2024

Ce este Bitcoin Halving, eveniment major cu posibile efecte de preț, așetaptat de investitorii crypto în aprilie 2024

Doi antreprenori români lansează un startup de dezvoltare imobiliară prin blockchain

Stand-up comedy cu Ciolacu în Abu Dhabi: M-am născut în comunism. Visul meu era să văd Parisul

"Alianța haosului": Negoiță spune că s-a discutat în PSD-PNL să candideze el la Primăria Capitalei

ChatGPT ar putea fi folosit în triajul pacienților cu probleme oculare

Ce spune Rafila despre medicii care direcționează pacienții la privat

Romsilva vrea să reîmpădurească zone afectate de calamități cu fonduri din PNRR