Google Assistant и WaveNet: для естественной речи

Виртуальный ассистент Google Assistant вскоре сможет разговаривать более естественно.

Это станет возможным благодаря новой разработке подразделения Google Deepmind – синтезатору речи WaveNet. Он отличается от традиционных преобразователей текста в речь Concatenative и Parametric. Первый использует обширную базу образцов речи, записанных единственным диктором, а в случае со вторым это сгенерированный компьютерным способом голос, который может создавать индивидуальное звучание, используя 16 тысяч сэмплов в секунду.

В отличие от них, WaveNet не только обращается к огромному банку образцов речи, но имеет опыт распознавания тональностей. Более года система училась определять, какие интонации следуют друг за другом и какое звучание реалистично.

Пока синтезатор WaveNet работает только с американсиким английским и японским, однако в будущем Google может «облагородить» и другие языки.

Источник: 1, 2

Добавить комментарий