​VIDEO Inca un moment de referinta pentru inteligenta artificiala - Programul creat de compania DeepMind a Google a reusit pe cont propriu sa devina cel mai bun jucator de GO, pornind de la zero

de Vlad Barza     HotNews.ro
Joi, 19 octombrie 2017, 0:28 Economie | IT

Alpha Go Zero
Foto: YouTube
​Programul AlphaGo al companiei DeepMind, cumparata in 2014 de Google, bifeaza un nou moment de referinta in dezvoltarea inteligentei artificiale, reusind sa devina cel mai bun jucator de GO fara a se  inspira in vreun fel din jocurile celor mai buni jucatori umani. Jocul de GO a evoluat timp de 3.000 de ani, iar soft-ul AlphaGo Zero a reusit fara vreun ajutor uman in 40 de zile sa avanseze mai mult, pornind doar de la regulile jocului. Noul software va putea fi folosit pentru descoperirea de noi medicamente sau pentru economisirea energiei, dar numai anumite domenii cu reguli clare se preteaza.

AlphaGo a devenit celebru dupa ce a castigat in fata a doi campioni ai jocului de GO care s-au aratat uimiti de cat de bine joaca. Insa daca pentru a-i invinge pe campioni, AlphaGo a studiat milioane de jocuri disputate intre cei mai buni jucatori umani, acum versiunea mai puternica numita AlphaGo Zero a reusit sa invete singur pornind de la aproape nimic, fara a studia alte partide. Asadar, vorbim de o tehnica de invatare mult imbunatatita decat "invatarea supervizata" la care computerul invata din milioane de exemple furnizate de oameni.

Practic i s-au dat regulile jocului si pozitiile pieselor albe si negre pe tabla de joc si computerul a simulat apoi milioane de partide, primele fiind aleatorii, dar apoi calitatea jocului crescand si la fel si rafinamentul si strategia. Dupa trei zile de "antrenament" software-ul a batut cu 100-0 versiunea programului care in martie 2016 l-a batut pe campionul sud-coreean Lee Sedol, iar dupa 40 de zile a putut castiga in fata versiunii AlphaGo Master care in luna mai il invingea pe campionul mondial Ke Jie.



"Invata pur si simplu simuland singur jocuri, pornind de la partide aleatorii. A reusit foarte rapid sa depaseasca nivelul de joc al oamenilor si a invins cu 100-0 cea mai recenta varianta a programului", spune Demis Hassabis, CEO DeepMind.

David Silver, seful de proiect, a adaugat ca elementul special tine de faptul ca programul porneste de la zero si creeaza singur cunostiinte, pornind de la doar cateva informatii minimale. Practic, spune Silver, in doar cateva zile computerul, nu doar ca a depasit cei mai buni jucatori "umani", ci a depasit cunostiintele acumulate despre joc in cei 3.000 de ani de existenta ai jocului de GO.

Metoda se dovedeste a fi una puternica si ar putea fi eficienta si in domenii extrem de importante. Cei de la DeepMind spun ca aceasta metoda a "invatarii consolidate" (reinforcement learning) pentru a ajuta la descoperirea de noi materiale, la analiza proteinelor pentru crearea de noi medicamente sau pentru gasirea unor noi metode de economisire a energiei.

Computerul invata din simularea a milioane de jocuri, dar reteaua neurala decide care miscari au cea mai mare probabilitate de a duce la victorie. Reteaua invata din fiecare joc si devine tot mai buna pe masura ce simuleaza tot mai multe partide.

De fiecare data cand se anunta un avans in domeniul inteligentei artificiala apar teoriile care spun ca noul software sofisticat va putea prelua controlul si ca noi, oamenii, vom ramane spectatori. Nu este cazul: programul AlphaGo Zero este foarte bun la GO si poate fi util in anumite domenii, insa in multe altele nu are niciun fel de utilitate.

Tehnicile de invatare se preteaza bine la jocul de GO unde regulile sunt clare si unde hazardul nu joaca aproape niciun rol. La fel, si pe viitor aceste tehnici de invatare foarte avansata pot fi folosite pentru gasirea de solutii pentru rezolvarea unor probleme clar definite si unde imprevizibilul este cat mai putin prezent.

Surse: Le Monde, The Telegraph


Citeste mai multe despre   












Jurnal din Israel

FOTOGALERIE Israel pe repede inainte: kit de informatii pentru o calatorie reusita

De la nord la sud, Israelul are putin peste 400 de kilometri, iar de la est la vest, putin peste 100. E printre putinele tari ale lumii in care, in aceeasi zi, poti face si baie in mare si ski la munte. E taramul miracolelor si al sperantelor, tara sfanta a pelerinilor, teritoriu complet liber si dezinhibat pentru hedonistii de pretutindeni. Ca vrei sa te regasesti spiritual sau ca vrei sa gasesti energia unor petreceri fantastice, mergi in Israel. O sa capeti ce cauti si, uneori, chiar mai mult decat atat.

8937 vizualizari

  • -2 (6 voturi)    
    Este evident, poate si da decizii! (Joi, 19 octombrie 2017, 8:34)

    Prea_Tarziu [utilizator]

    Daca este in stare sa joace go, poate fi si judecator, mai ales daca i se pune la dispozitie o infrastructura cu camere de luat vederi si roboti si drone politisti. Am scapa de cele mai mari consumatoare de bani din bugetele tarilor: Justitia injusta si Militia+Securitatea corupte de interlopi.
    Militienii, judecatorii si procurorii ar face ceea ce trebuiau sa faca de la bun inceput in loc sa pretinda ca sunt dumnezei, spre exemplu ar sapa, mult mai util decat injustitia actuala, vobresc la nivel global, nu doar Republica Interlopa Romana, iar de banii militienilor si judecatorilor oamenii de stiinta ar munci sa gaseasca cai de a coloniza alte planete.
    Apoi usor-usor un supercalculator de acest fel ar inlatura acei functionari responsabili de tiparirea hartiilor denumite retete, denumiti medici de familite, care printr-un app si un aparat ce masoara constantele corpului ar da diagnostice mult mai precise si s-ar scapa de o parte importanta de bugetul din sanatate samd.
    Normal ca vor aparea bullshituri cu nu e posibil sa inteleaga un calculator, programele le fac tot oamenii, probabil aceeasi rezistenta a intampinat si informatizarea contabilitatii, dar adevarul este ca tehnologic vorbind am putea avea o societate mai dreapta cu ajutorul IA.
    • -3 (3 voturi)    
      Hai recunoaste (Joi, 19 octombrie 2017, 10:50)

      banel [utilizator] i-a raspuns lui Prea_Tarziu

      Ai probleme cu legea :)
  • +2 (8 voturi)    
    regulile sunt prea simple (Joi, 19 octombrie 2017, 9:41)

    pehash [utilizator]

    AI-ul invata repede pentru ca regulile sunt simple. desi abordarea este evident superioara algoritmilor de pana acum, aplicabilitatea este limitata la scenarii asemanatoare, in care ai reguli simple, clare si usor de inteles pentru AI.
    daca, de exemplu, provocarea AI-ului ar fi sa interactioneze cu o persoana, aceeasi abordare, de a rula N scenarii singur, din care sa invete, ar fi imposibila.
    • +1 (5 voturi)    
      nu e adevarat (Joi, 19 octombrie 2017, 12:19)

      igorashu [utilizator] i-a raspuns lui pehash

      In reinforced learning, conteaza rezultatele actiunilor si recompensa primita.
      Practic AlphaGo Zero ar fi putut deduce singur(a) regulile jocului chiar daca nu i-ar fi fost "explicate".

      Articolul HN nu specifica de exemplu ca AlphaGo Zero a descoperit mutari necunoscute oamenilor.

      Mi se pare fascinant rezultatul pentru ca e un fel de "thinking outside the box" si ma face sa ma indoiesc de eficienta scolilor care te fac sa gandesti intr-un anumit fel.
      • +1 (1 vot)    
        Nu stiu unde... (Joi, 19 octombrie 2017, 20:58)

        Prostu' satului [utilizator] i-a raspuns lui igorashu

        .. ati citit asta, dar traducerea dvs nu are niciun sens
        "Articolul HN nu specifica de exemplu ca AlphaGo Zero a descoperit mutari necunoscute oamenilor."

        In Go nu exista mutari.
      • 0 (0 voturi)    
        nope (Vineri, 20 octombrie 2017, 1:38)

        TheBorg [utilizator] i-a raspuns lui igorashu

        Nu avea cum sa deduca singur regulile jocului.

        Pentru ca de exemplu nu avea de unde sa stie ca nu are voie sa puna 2 piese una peste alta. Sau ca nu poate sa scoata orice piese de pe tabla oricand are chef.

        Evident regulile au fost programate, si programul a invatat ce trebuie sa faca pentru a castiga, in limitele acestor reguli.

        Si nu a descoperit "mutari necunoscute". A descoperit mutari pe care oamenii nu le faceau in situatia respectiva. Dar regulile evident permit acele mutari.

        Regulile sunt una, strategiile sunt alta. Tu le cam confunzi.

        Ca unele mutari legale sunt atat de stupide, incat poti considera ca "regula" ca nu trebuie facute, e alta discutie, dar asta n-are legatura cu regulile efective ale jocului, care spun doar ce mutare este legala si ce mutare este ilegala, nu si daca e bine sa o faci sau nu.
  • -5 (5 voturi)    
    mare relizare de la google.... (Joi, 19 octombrie 2017, 10:14)

    taro [utilizator]

    algoritmul de la GO este simplu si poate fi invatat usor de o retea neurala.

    Un AI sau algoritmul de la GO invinge un jucator uman pentru ca este constant. Daca la fiecare pas trebuie sa consideri 100 de mutari si sa alegi pe cea mai buna, mai devreme sau mai tarziu faci o greseala si nu alegi cea mai buna optiune. Un AI/algoritm alege tot timpul cea mai buna mutare.

    Si in plus astia de la deep mind au facut o greseala de incepatori. AI1 a jucat contra lui AI2 pana a invatat slabiciunile si l-a batut. AI1 invata din fiecare meci iar AI2 sta pe loc, ce surpriza ca primul l-a invins dupa o vreme.

    Daca AI-ul ala batea 10 versiuni diferite de oponent GO cu 100-0 atunci as fi fost impresionat.
    • +4 (8 voturi)    
      Romanul nu se dezminte (Joi, 19 octombrie 2017, 10:53)

      banel [utilizator] i-a raspuns lui taro

      Acum se pricepe si la inteligenta artificiala. Dar cand vin alegerile, se prosteste brusc si voteaza cu PSD-ul.
      • 0 (2 voturi)    
        In caz ca ai ceva idee despre AI... (Joi, 19 octombrie 2017, 22:35)

        taro [utilizator] i-a raspuns lui banel

        ce descrie ala in video sa numeste overfitting, in cazul asta e vorba de game strategy overfitting nu de aproximarea unei functii.

        S-au doar te-ai repezit sa dai un reply la ceva ce nu ai inteles?
        • 0 (2 voturi)    
          pai taro n-a inteles, nu banel (Vineri, 20 octombrie 2017, 1:46)

          TheBorg [utilizator] i-a raspuns lui taro

          Softul nou s-a antrenat jucand cu el insusi, dupa care a batut vechiul soft de 100 de ori.

          Noul soft nu s-a antrenat jucand contra vechiului soft, deci nu avea cum sa fie overfitting.
    • 0 (0 voturi)    
      bati campii (Vineri, 20 octombrie 2017, 1:32)

      TheBorg [utilizator] i-a raspuns lui taro

      Ambii jucatori, AI1 si AI2 cum i-ai numit tu, invata simultan. De fapt este acelasi soft, cu aceeasi retea neuronala in spate.
  • 0 (0 voturi)    
    reinforcement learning (Vineri, 20 octombrie 2017, 1:27)

    TheBorg [utilizator]

    Nu prea se traducere prin "invatare consolidata", pentru ca este "reinforcement learning", nu "reinforced learning", si este folosit in sensul de "reinforcement based learning".

    re·in·force [rēinˈfôrs] VERB
    a) strengthen or support, especially with additional personnel or material
    b) strengthen (an existing feeling, idea, or habit):
    "various actions of the leaders so reinforced fears and suspicions that war became unavoidable"

    In cel mai rau caz ii putem spune "invatare prin consolidare", daca insistam sa mergem pe sensul a) si sa traducem "reinforcement" prin "consolidare".

    Dar aici are sensul de intarire, nu de consolidare, pentru ca nu vorbim despre o cladire.

    Deci corect ar fi "invatare prin intarire". Oricum o iei si o dai suna ca dracu', in limba romana, dar macar sa fie corect.

    Nu de alta, dar pe urma ajungem iar la tampenii cum a fost traducerea profesorilor mei din Politehnica care au tradus "round-robin" ca "furt de ciclu" in loc de "prin rotatie".

    Din ciclul WTF. Numai la furat se gandesc romanii. Cel care a tradus "robin" (un nume de pasare) prin "furt" probabil a confundat "robin" cu "robbing". Care oricum insemna a jefui, nu a fura (to steal).

    Ideal ar fi sa nu mai traducem totul in limba romana, mai ales dupa ureche, si sa folosim termenii din limba de origine, mai ales pentru ceva foarte tehnic.

    End rant.


Abonare la comentarii cu RSS



ESRI

Top 5 articole cele mai ...



Hotnews
Agenţii de ştiri

Siteul Hotnews.ro foloseste cookie-uri. Cookie-urile ne ajută să imbunatatim serviciile noastre. Mai multe detalii, aici.
hosted by
powered by
developed by
mobile version
Sâmbătă