Dijous, 11 Gener 2018 10:09

Les xarxes neuronals permeten a Google interpretar un text i aplicar entonacions similars a una persona

Siri, Alexa, Cortana; són algunes de les assistents virtuals dels gegants tecnològics nord-americans. A aquests noms se li va sumar un fa uns anys: l'Assistent de Google. Per a això el gegant dels cercadors ha posat molts recursos per aconseguir desbancar Apple com el rei dels assistents.

A través del laboratori Deepmind, responsable de la Intel·ligència Artificial (IA) de la companyia, Google ha aconseguit desenvolupar una veu sintètica d'una precisió gairebé idèntica a la generada per un ésser humà.

Aquesta tecnologia rep el nom de Tacotron 2, el funcionament està basat en dues xarxes neuronals capaços d'interpretar el text i aplicar els efectes, pauses i entonacions que estiguin presents en el mateix.

Des del portal nord-americà Quartz indiquen que una de les novetats d'aquesta versió és la capacitat de pronunciar noms i paraules difícils, així com distingir els signes de puntuació o si una part del text requereix ser pronunciada amb una entonació diferent.

Aquest sistema permet transformar el text en discurs primer, recreant el text en un espectrograma, és a dir, plasmant de manera gràfica les paraules en forma d'ones perquè el programari de Google WaveNet les interpreti i posteriorment les transformi en veu.

Fins al moment, Tacotron 2 es troba en fase de prova, disponible únicament en anglès i interpretat per una veu femenina. Encara que, la companyia té la intenció d'entrenar altres versions en diferents idiomes i interpretats per una veu masculina.

Vist a: Hoy

Subscriviu-vos als nostres butlletins i rebreu les notícies sobre les nostres promocions.
Termes i Condicions