DeepMind a creat un sistem de vorbire generata de computer care surclaseaza net tehnologia existenta

de I.C.     HotNews.ro
Duminică, 11 septembrie 2016, 18:26 Economie | IT

WaveNet fata de alte sisteme si fata de vocea umana
Foto: deepmind.com
Unitatea DeepMind a Google, care lucreaza la dezvoltarea de computere super-inteligente, a creat un sistem de vorbire generata de computer care, potrivit autorilor, care surclaseaza, cu circa 50%, tehnologia existenta, informeaza Bloomberg Technology.

Unitatea Deep Mind, aflata in Londra, a fost achizitionata de Google in 2014 pentru suma de 400 milioane de lire (533 milioane dolari). Deep Mind a dezvoltat WaveNet, o inteligenta artificiala care poate imita vorbirea umana invatand cum sa formeze undele de sunet individuale pe care le creaza o voce umana, se arata intr-o postare pe blogul sau.

In testele pentru engleza americana si chineza mandarina, ascultatorii au considerat ca vorbirea generata de WaveNet suna mult mai natural decat ce creata de oricare alte programe Google de transformare a textului in vorbire. WaveNet s-a prezentat insa sub vorbirea umana. DeepMind prezinta pe blogul sau mostre de vorbire WaveNet.

Majoritatea programelor de vorbire generata de computer functioneaza pe baza unui set mare de date care cuprinde scurte inregistrari ale aceleiasi persoane, combinand aceste fragmente de vorbire pentru a forma noi cuvinte.

Rezultatul este inteligibil si suna uman, insa nu complet natural. Dezavantajul este ca sunetul vocii nu poate fi modificat usor. Alte sisteme formeaza complet electronic vocea, in general in baza unor reguli despre cum sunt pronuntatea anumite combinatii de litere. Aceste sisteme permit ca sunetul vocii sa fie usor modelat, insa tind sa sune mai putin natural decat vorbirea generata de computer pe baza unor inregistrari ale unor voci umane, arata DeepMind.

WaveNet este un tip de inteligenta artificiala numita retea neuronala, care este proiectat sa imite felul in care functioneaza anumite functii ale creierului. Astfel de retele trebuie sa fie instruite cu ajutorul unor seturi mai de date.

WaveNet nu va avea aplicatii comerciale imediate, pentru ca sistemul necesita prea multa putere de calcul: trebuie sa esantioneze cu foarte mare viteza semnalul audio cu care este instruit. Apoi, pentru fiecare dintre aceste probe trebuie sa formeze o predictie cu privire la felul in care ar trebui sa arate unda sonora bazat pe fiecare din probele anterioare. Chiar si cercetatorii DeepMind au recunoscut ca acest lucru "este o sarcina in mod clar provocatoare".

Cu toate acestea, companiile tech vor acorda, cu siguranta, o atentie sporita reusitelor DeepMind. Discursul devine din ce in ce mai important in felul in care oamenii interactioneaza cu tehnologia, de la telefoane mobile la autoturisme.

Amazon.com Inc., Apple Inc., Microsoft Inc. si Alphabet Inc. a lui Google, toate au investit in asistenti personali digitali care interactioneaza cu utilizatorii in principal prin vorbire.

Bennett, Mark, directorul international al Google Play, care vinde aplicatii Android, a declarat la o conferinta a dezvoltatorului Android, desfasurata la Londra saptamana trecuta, ca 20% din cautarile pe mobile folosind Google sunt realizate prin voce, nu prin text scris.


Citeste mai multe despre   









5622 vizualizari
  • -6 (10 voturi)    
    potrivit autorilor... (Duminică, 11 septembrie 2016, 19:17)

    tearoftime [utilizator]

    ... si ce ar putea sa spuna autorii?
    "Am papat milioane de dolari ca sa facem un sistem aproximativ la fel cu cele existente?"

    Cred ca o dati incet-incet spre tabloidism, cu stiri senzationale neverificate din surse multiple (ca deh, doar autorii sunt aici sursa).
    • +3 (3 voturi)    
      dar te pricepi, nu gluma (Duminică, 11 septembrie 2016, 21:16)

      meme_youyou [utilizator] i-a raspuns lui tearoftime

      Daca ai fi citit cu atentie studiul original, care este insostit de exemple pe care le poti asculta, ai fi observat ca avansul fata de metodele actuale este semnificativ. Mai mult de atat, daca ai face parte dintr-un blind test, ma indoiesc ca ai putea discerne usor care este vocea umana si care este cea computerizata.

      Dar ne pricepem cu totii la orice, politica, fotbal si stiinta. Stirea numai "senzationala" nu e, pastreaza toate atributele unei stiri de stiinta si tehnologie, cu articolul original publicat in reviste de profil.
    • +3 (3 voturi)    
      varza (Duminică, 11 septembrie 2016, 22:12)

      muciflenduri [utilizator] i-a raspuns lui tearoftime

      Cat de varza esti, n-ai auzit nici de DeepMind, nici de AlphaGo, nici de inteligenta artificiala, dar comentezi ca o baba, de plictiseala.

      https://deepmind.com/blog/wavenet-generative-model-raw-audio/


Abonare la comentarii cu RSS





ESRI

Top 5 articole cele mai ...



Hotnews
Agenţii de ştiri

Siteul Hotnews.ro foloseste cookie-uri. Cookie-urile ne ajută să imbunatatim serviciile noastre. Mai multe detalii, aici.
hosted by
powered by
developed by
mobile version
Duminică