updated_icon

Actualizat acum 4 minute EUR 4.9765 USD 4.6373

hotnews_logo

Bănci Finanțe Companii EUROfonduri Auto IT Telecom Energie

VIDEO Inca un moment de referinta pentru inteligenta artificiala - Programul creat de compania DeepMind a Google a reusit pe cont propriu sa devina cel mai bun jucator de GO, pornind de la zero

Vlad Barza • HotNews.ro

Programul AlphaGo al companiei DeepMind, cumparata in 2014 de Google, bifeaza un nou moment de referinta in dezvoltarea inteligentei artificiale, reusind sa devina cel mai bun jucator de GO fara a se inspira in vreun fel din jocurile celor mai buni jucatori umani. Jocul de GO a evoluat timp de 3.000 de ani, iar soft-ul AlphaGo Zero a reusit fara vreun ajutor uman in 40 de zile sa avanseze mai mult, pornind doar de la regulile jocului. Noul software va putea fi folosit pentru descoperirea de noi medicamente sau pentru economisirea energiei, dar numai anumite domenii cu reguli clare se preteaza.

Alpha Go ZeroFoto: YouTube

AlphaGo a devenit celebru dupa ce a castigat in fata a doi campioni ai jocului de GO care s-au aratat uimiti de cat de bine joaca. Insa daca pentru a-i invinge pe campioni, AlphaGo a studiat milioane de jocuri disputate intre cei mai buni jucatori umani, acum versiunea mai puternica numita AlphaGo Zero a reusit sa invete singur pornind de la aproape nimic, fara a studia alte partide. Asadar, vorbim de o tehnica de invatare mult imbunatatita decat "invatarea supervizata" la care computerul invata din milioane de exemple furnizate de oameni.

Practic i s-au dat regulile jocului si pozitiile pieselor albe si negre pe tabla de joc si computerul a simulat apoi milioane de partide, primele fiind aleatorii, dar apoi calitatea jocului crescand si la fel si rafinamentul si strategia. Dupa trei zile de "antrenament" software-ul a batut cu 100-0 versiunea programului care in martie 2016 l-a batut pe campionul sud-coreean Lee Sedol, iar dupa 40 de zile a putut castiga in fata versiunii AlphaGo Master care in luna mai il invingea pe campionul mondial Ke Jie.

"Invata pur si simplu simuland singur jocuri, pornind de la partide aleatorii. A reusit foarte rapid sa depaseasca nivelul de joc al oamenilor si a invins cu 100-0 cea mai recenta varianta a programului", spune Demis Hassabis, CEO DeepMind.

David Silver, seful de proiect, a adaugat ca elementul special tine de faptul ca programul porneste de la zero si creeaza singur cunostiinte, pornind de la doar cateva informatii minimale. Practic, spune Silver, in doar cateva zile computerul, nu doar ca a depasit cei mai buni jucatori "umani", ci a depasit cunostiintele acumulate despre joc in cei 3.000 de ani de existenta ai jocului de GO.

Metoda se dovedeste a fi una puternica si ar putea fi eficienta si in domenii extrem de importante. Cei de la DeepMind spun ca aceasta metoda a "invatarii consolidate" (reinforcement learning) pentru a ajuta la descoperirea de noi materiale, la analiza proteinelor pentru crearea de noi medicamente sau pentru gasirea unor noi metode de economisire a energiei.

Computerul invata din simularea a milioane de jocuri, dar reteaua neurala decide care miscari au cea mai mare probabilitate de a duce la victorie. Reteaua invata din fiecare joc si devine tot mai buna pe masura ce simuleaza tot mai multe partide.

De fiecare data cand se anunta un avans in domeniul inteligentei artificiala apar teoriile care spun ca noul software sofisticat va putea prelua controlul si ca noi, oamenii, vom ramane spectatori. Nu este cazul: programul AlphaGo Zero este foarte bun la GO si poate fi util in anumite domenii, insa in multe altele nu are niciun fel de utilitate.

Tehnicile de invatare se preteaza bine la jocul de GO unde regulile sunt clare si unde hazardul nu joaca aproape niciun rol. La fel, si pe viitor aceste tehnici de invatare foarte avansata pot fi folosite pentru gasirea de solutii pentru rezolvarea unor probleme clar definite si unde imprevizibilul este cat mai putin prezent.

Surse: Le Monde, The Telegraph

RECOMANDĂRI HotNews.ro

Autostrada Litoralului

HARTĂ INTERACTIVĂ Autostrada Litoralului: Pe unde va trece viitorul drum de mare viteză de la malul mării / Proiectul, scos la licitație

Timur Ivanov (stânga), Vladimir Putin și Serghei Șoigu

Cum arată corupția în Rusia: 1.500 de metri avea casa lui Timur Ivanov, ministrul arestat al Apărării, pusă pe numele soției. „În fiecare an, își...

Oraș

fanatik.ro: Orașul perfect din România în care să te retragi la bătrânețe. Mulți pensionari au făcut-o deja

Vasile Banescu

Vasile Bănescu, purtătorul de cuvânt al BOR, compară Moscova lui Putin cu Berlinul lui Hitler, după cazul preotului-regizor fotografiat cu Zaharova

Doi tineri au lăsat viața de oraș și s-au mutat la poalele Munților Piatra Craiului, iar acum își împart curtea cu turiștii iubitori de natură

lovedeco.ro: Doi tineri au lăsat viața de oraș și s-au mutat la poalele Munților Piatra Craiului, iar acum își împart curtea cu turiștii iubitori de natură

Cristian Tudor Popescu

CTP, după ce Antena 3 l-a tăiat pe Piedone: „Un afront pentru candidatul usturoi”

Un militar rus lansează o rachetă anti-tanc, pe frontul din Ucraina

Analiza care poate ridica moralul Kievului: de ce este puțin probabil ca Rusia să reușească o ofensivă majoră anul acesta

Bucharest Street Food Festival

Weekend trending în București, 27-28 aprilie: festival de street food, meniuri cu pește pentru Florii, concerte cu „vocea îngerilor” și Doomnezeu

Panorama cu ALP: Cei patru candidați ne-fantastici pentru București și primarul „rău n-are ce să facă”

panorama.ro: Panorama cu ALP: Cei patru candidați ne-fantastici pentru București și primarul „rău n-are ce să facă”

Cum să prepari cafeaua acasă și să obții gustul de la cafenea. Trucuri bazate pe știință

smartliving.ro: Cum să prepari cafeaua acasă și să obții gustul de la cafenea. Trucuri bazate pe știință

Evghenia Gutul, bascana Gagauziei

„Și telefoanele…” Bașcana Găgăuziei, Evghenia Guțul, percheziționată pe aeroportul din Chișinău la revenirea de la Moscova

sistem radar rus Podlet-K1, lovit de ucraineni

VIDEO Pierdere usturătoare pentru ruși. GUR spune că a distrus un sistem radar rus în valoare de 5 milioane de dolari

ADAUGĂ COMENTARIU (12 comentarii)

None • 2017-10-19 08:34

Comentariu sters de utilizator // None

4

2

banel • 2017-10-19 10:50

Hai recunoaste // Ai probleme cu legea :)

3

0

pehash • 2017-10-19 09:41

regulile sunt prea simple // AI-ul invata repede pentru ca regulile sunt simple. desi abordarea este evident superioara algoritmilor de pana acum, aplicabilitatea este limitata la scenarii asemanatoare, in care ai reguli simple, clare si usor de inteles pentru AI. daca, de exemplu, provocarea AI-ului ar fi sa interactioneze cu o persoana, aceeasi abordare, de a rula N scenarii singur, din care sa invete, ar fi imposibila.

3

5

igorashu • 2017-10-19 12:19

nu e adevarat // In reinforced learning, conteaza rezultatele actiunilor si recompensa primita. Practic AlphaGo Zero ar fi putut deduce singur(a) regulile jocului chiar daca nu i-ar fi fost "explicate". Articolul HN nu specifica de exemplu ca AlphaGo Zero a descoperit mutari necunoscute oamenilor. Mi se pare fascinant rezultatul pentru ca e un fel de "thinking outside the box" si ma face sa ma indoiesc de eficienta scolilor care te fac sa gandesti intr-un anumit fel.

2

3

Prostu' satului • 2017-10-19 20:58

Nu stiu unde... // .. ati citit asta, dar traducerea dvs nu are niciun sens "Articolul HN nu specifica de exemplu ca AlphaGo Zero a descoperit mutari necunoscute oamenilor." In Go nu exista mutari.

0

1

TheBorg • 2017-10-20 01:38

nope // Nu avea cum sa deduca singur regulile jocului. Pentru ca de exemplu nu avea de unde sa stie ca nu are voie sa puna 2 piese una peste alta. Sau ca nu poate sa scoata orice piese de pe tabla oricand are chef. Evident regulile au fost programate, si programul a invatat ce trebuie sa faca pentru a castiga, in limitele acestor reguli. Si nu a descoperit "mutari necunoscute". A descoperit mutari pe care oamenii nu le faceau in situatia respectiva. Dar regulile evident permit acele mutari. Regulile sunt una, strategiile sunt alta. Tu le cam confunzi. Ca unele mutari legale sunt atat de stupide, incat poti considera ca "regula" ca nu trebuie facute, e alta discutie, dar asta n-are legatura cu regulile efective ale jocului, care spun doar ce mutare este legala si ce mutare este ilegala, nu si daca e bine sa o faci sau nu.

0

0

taro • 2017-10-19 10:14

mare relizare de la google.... // algoritmul de la GO este simplu si poate fi invatat usor de o retea neurala. Un AI sau algoritmul de la GO invinge un jucator uman pentru ca este constant. Daca la fiecare pas trebuie sa consideri 100 de mutari si sa alegi pe cea mai buna, mai devreme sau mai tarziu faci o greseala si nu alegi cea mai buna optiune. Un AI/algoritm alege tot timpul cea mai buna mutare. Si in plus astia de la deep mind au facut o greseala de incepatori. AI1 a jucat contra lui AI2 pana a invatat slabiciunile si l-a batut. AI1 invata din fiecare meci iar AI2 sta pe loc, ce surpriza ca primul l-a invins dupa o vreme. Daca AI-ul ala batea 10 versiuni diferite de oponent GO cu 100-0 atunci as fi fost impresionat.

5

0

banel • 2017-10-19 10:53

Romanul nu se dezminte // Acum se pricepe si la inteligenta artificiala. Dar cand vin alegerile, se prosteste brusc si voteaza cu PSD-ul.

2

6

taro • 2017-10-19 22:35

In caz ca ai ceva idee despre AI... // ce descrie ala in video sa numeste overfitting, in cazul asta e vorba de game strategy overfitting nu de aproximarea unei functii. S-au doar te-ai repezit sa dai un reply la ceva ce nu ai inteles?

1

1

TheBorg • 2017-10-20 01:46

pai taro n-a inteles, nu banel // Softul nou s-a antrenat jucand cu el insusi, dupa care a batut vechiul soft de 100 de ori. Noul soft nu s-a antrenat jucand contra vechiului soft, deci nu avea cum sa fie overfitting.

1

1

TheBorg • 2017-10-20 01:32

bati campii // Ambii jucatori, AI1 si AI2 cum i-ai numit tu, invata simultan. De fapt este acelasi soft, cu aceeasi retea neuronala in spate.

0

0

TheBorg • 2017-10-20 01:27

reinforcement learning // Nu prea se traducere prin "invatare consolidata", pentru ca este "reinforcement learning", nu "reinforced learning", si este folosit in sensul de "reinforcement based learning". re·in·force [rēinˈfôrs] VERB a) strengthen or support, especially with additional personnel or material b) strengthen (an existing feeling, idea, or habit): "various actions of the leaders so reinforced fears and suspicions that war became unavoidable" In cel mai rau caz ii putem spune "invatare prin consolidare", daca insistam sa mergem pe sensul a) si sa traducem "reinforcement" prin "consolidare". Dar aici are sensul de intarire, nu de consolidare, pentru ca nu vorbim despre o cladire. Deci corect ar fi "invatare prin intarire". Oricum o iei si o dai suna ca dracu', in limba romana, dar macar sa fie corect. Nu de alta, dar pe urma ajungem iar la tampenii cum a fost traducerea profesorilor mei din Politehnica care au tradus "round-robin" ca "furt de ciclu" in loc de "prin rotatie". Din ciclul WTF. Numai la furat se gandesc romanii. Cel care a tradus "robin" (un nume de pasare) prin "furt" probabil a confundat "robin" cu "robbing". Care oricum insemna a jefui, nu a fura (to steal). Ideal ar fi sa nu mai traducem totul in limba romana, mai ales dupa ureche, si sa folosim termenii din limba de origine, mai ales pentru ceva foarte tehnic. End rant.

0

0

ADAUGĂ COMENTARIU (12 comentarii)

INTERVIURILE HotNews.ro

16:00 • ACTUALITATE

Care sunt mesajele pe care le transmite China prin cea mai mare restructurare din ultimul deceniu a armatei care îi conferă lui Xi Jinping mai mult control - analiză CNN

15:39 • ACTUALITATE

VIDEO Pierdere usturătoare pentru ruși. GUR spune că a distrus un sistem radar rus în valoare de 5 milioane de dolari

15:27 • SPORT

CE Canotaj: Medalie de argint pentru România în proba de patru rame feminin

15:00 • ACTUALITATE

Ciolacu îl susţine pe Mugur Isărescu pentru un nou mandat la şefia BNR: România are nevoie de stabilitate monetară

14:52 • ACTUALITATE

CTP, după ce Antena 3 l-a tăiat pe Piedone: „Un afront pentru candidatul usturoi”

14:48 • SPORT

Performanță rară: Elizabeta Samara a câștigat a cincea oară Liga Campionilor la tenis de masă

14:36 • SPORT

VIDEO Surpriză mare la ATP Madrid: Unul dintre marii favoriți, învins de locul 118 mondial

14:33 • Ghid propus și listă CAEN

Fonduri UE 2024, București-Ilfov: 25.000-200.000 EUR pentru firmele micro, prin Programul Regional

14:18 • ACTUALITATE

Taiwanul a detectat 22 de avioane chinezești care se învârteau în jurul insulei

13:58 • ACTUALITATE

VIDEO Drone ucrainene au lovit două rafinării și un aerodrom militar din Krasnodar. Moscova susține că a respins atacul

13:44 • ACTUALITATE

Marcel Ciolacu, întrebat dacă va candida la prezidențiale: „Haideţi să vedem după data de 9 iunie”. Premierul spune că „e ferm convins” că Geoană candidează

13:29 • ACTUALITATE

Finlanda: Un deputat de extremă-dreapta suspectat că a tras în fața unui club de noapte

13:09 • ACTUALITATE

Costel Alexe, după „gluma” despre moldoveni făcută de Marcel Ciolacu: Este un derapaj grav

Articol susținut de fanatik.ro

fanatik.ro: Orașul perfect din România în care să te retragi la bătrânețe. Mulți pensionari au făcut-o deja

O insulă aflată între Scoția și Irlanda de Nord a fost scoasă la vânzare

Marcel Ciolacu

Prima reacție a lui Marcel Ciolacu după declarațiile despre moldoveni: A fost o glumă / Mama era din Tecuci

Băsescu: „Dacă România nu a cerut niciodată funcția asta la NATO, în numele cui s-a dus Geoană acolo?!”

Jaqueline Cristian, victorie senzațională în turul doi la WTA Madrid - Set câștigat cu 6-0 în fața unei campioane de Grand Slam

HARTĂ INTERACTIVĂ Autostrada Litoralului: Pe unde va trece viitorul drum de mare viteză de la malul mării / Proiectul, scos la licitație

Cum arată corupția în Rusia: 1.500 de metri avea casa lui Timur Ivanov, ministrul arestat al Apărării, pusă pe numele soției. „În fiecare an, își cumpărau o mașină sau motocicletă nouă”

VIDEO Mișcarea pentru Dezvoltarea Moldovei cere demisia lui Marcel Ciolacu pentru afirmația „Buzăul nu e în Moldova şi vă rog să nu mă jigniţi”

VIDEO Un clip a făcut să plângă mai multe personalități din România obișnuite cu cele mai dure vești

Fonduri UE 2024, București-Ilfov: 25.000-200.000 EUR pentru firmele micro, prin Programul Regional

LISTA: 18 bănci s-au înscris la IMM Plus 2024, program de credite cu dobânzi subvenționate pentru antreprenorii români

Cum au intrat infractorii eliberați pe lista categoriilor de beneficiari eligibili la ajutoare de 50.000 EUR. Explicațiile ministrului Oprea (PSD)

Guvernul ungar anunță că va da în judecată lanțul de supermarketuri Spar pentru „defăimare”

Americanii sunt „pur și simplu mai harnici” decât europenii, afirmă șeful celui mai mare fond de investiții din lume

contributors_author

Euristica fricii, etică și drepturi fundamentale

contributors_author

Greaua moștenire a economiei planificate (i)

contributors_author

Implicarea umanitară a României în salvarea unor israelieni şi palestinieni răniţi (1970-1989)

contributors_author

NASTY

contributors_author

Iulian Comanescu

Țăranii istoriei, orășenii Orientului

Fonduri UE 2024 în București-Ilfov: Ajutoare de 25.000-200.000 EUR pentru firmele micro, prin Programul Regional. Ghidul propus și lista domeniilor CAEN eligibile

Declarația Unică 2024: Amenda, dobânzile și penalitățile, dacă nu ne declarăm veniturile din chirii, investiții, crypto, PFA, activități independente

LISTA: 18 bănci s-au înscris la IMM Plus 2024, program de credite cu dobânzi subvenționate pentru antreprenorii români

Sistemul RO e-Transport 2024: Descarcă ghidul ANAF în format PDF

Startup românesc de tehnologie, premiat de germani

Băsescu, despre alegerea lui Cîrstoiu: E o probă a incompetenței politicienilor, sunt slabi la minte

Candidatul AUR la Primăria Sectorului 6 și-a anunțat demisia: Simion e obsedat de putere

Referendumul de aderarea la UE din Republica Moldova - percepție, miză și context

Cei doi britanici acuzați de spionaj pentru China au fost eliberați pe cauțiune

Ce ar fi de reținut din discursul lui Emmanuel Macron