Microsoft spune ca a dezvoltat un software care poate transcrie o conversatie cu o acuratete similara cu cea a unui om, oficialii companiei spunand ca este vorba de o realizare revolutionara. Cand oamenii transciu o conversatie, ei rateaza in medie 5,9% din cuvinte, iar compania spune ca a creat un soft care reuseste un rezultat similar. Tehnologia se va regasi pe asistentul Cortana de pe Windows 10 si pe alte aplicatii ale companiei.

Logo-ul MicrosoftFoto: Microsoft

Xuedong Huang, director responsabil pemtru partea de speech recognition la Microsoft, spune ca soft-ul a reusit sa aiba cea mai mica rata de erori la transcrierea unei conversatii. Compania lucreza de doua decenii la rafinarea acestei tehnologii care poate fi utilizata pe un numar mare de aplicatii, dat fiind ca asistentii vocali sunt foarte la moda, dupa cum dovedesc realizarile Google si Amazon.

Avansurile in speech recognition nu au fost mari de-a lungul timpului, dar in ultimii ani s-au accelerat datorita retelelor neurale si a tehnologiilor de machine learning.

Cei de la Microsoft lucreaza pentru a imbunatati tehnologia, astfel incat sa functioneze bine si intr-un mediu foarte zgomotos sau cand mai multi oameni poarta discutii aprinse.

"Nici chiar cu cinci ani in urma nu as fi crezut ca putem reusi sa facem asa ceva. Pur si simplu nu credeam ca este posibil, spune Harry Shum, director pentru cercetare in inteligenta artificiala la Microsoft.

Soft-ul nu intelege insa sensul cuvintelor, pana in acel punct fiind mult de lucru. "Va mai trece destul timp si este lung drumul pana cand computerele vor intelege sensul corect al celor spuse sau aratate", spune Shum.

Surse: The Verge, The Telegraph