Главная » Технологии » Китайские разработчики научили ИИ говорить человеческим голосом

Китайские разработчики научили ИИ говорить человеческим голосом

Китайские разработчики научили ИИ говорить человеческим голосомКитайские разработчики научили ИИ говорить человеческим голосом

Специалисты китайской лаборатории Baidu Research, принадлежащей крупнейшему поисковому гиганту Поднебесной, создали алгоритм ИИ Deep Voice, способный преобразовывать текст в речь. Подобные проекты, существовавшие до этого, сталкивались с проблемой скорости синтеза звука, поэтому для генерации голоса предшественникам Deep Vice требовалось от нескольких минут до пары часов, чтобы корректно и максимально натуралистично воспроизвести текст человеческим голосом. Новая разработка китайских учёных основана на нейронных сетях и способна преобразовывать текст в голос в реальном времени.

Deep Voice умеет имитировать тембр, интонацию голоса и акцент, делая их очень правдоподобными и почти неотличимыми от настоящих, при этом голос может быть мужским или женским. Разработчики уверены, что их технологию можно использовать в качестве цифровых помощников, применять для записи голосов в идеоиграх или же вовсе использовать для синхронного перевода фильмов по субтитрам.

«Это настоящий прорыв с технической точки зрения, ведь мы смогли решить сложнейшую проблему, синтезировав живую речь со всеми ее особенностями», — говорит Лео Зу, один из авторов проекта.

Создатели алгоритма пояснили, что проект Deep Voice вдохновлён аналогичными разработками, вот только все его компоненты работают под управлением нейронной сети, при этом используя в работе довольно простые функции, что делает их алгоритм весьма адаптивным — голоса можно подстроить «под себя», наделив систему новыми акцентами и другими особенностями.

«Глубокое обучение привело к революции в различных областях, таких как компьютерное зрение и распознавание речи, а сейчас настало время и голосового синтеза. Мы рады, что смогли добиться таких результатов, и будем работать дальше, чтобы сделать систему «текст-голос» ещё более реалистичной», — приводит Motherboard цитату разработчиков.

Не забывайте про наш телеграм-чатик!

Источник

О supergran

Оставить комментарий

Ваш email нигде не будет показанОбязательные для заполнения поля помечены *

*

x

Check Also

Арендовать грязезащитные коврики интереснее чем чистить их самостоятельно

Стирка и аренда грязезащитных ковриков — привлекательная тема для создания собственного бизнеса. Культура потребления услуги ...

Инвестиционная недвижимость часто рассматривается как выгодное и долгосрочное решение

Обычному человеку трудно понять, чем инвестиционная недвижимость отличается от основного места жительства, и это может ...

Панель SMM открывает возможности для вашего бизнеса в сети интернета

Панель SMM, такая как SocialServicesLLC, представляет собой платформу, которая предоставляет услуги и инструменты маркетинга в ...

Выгоднее всего купить жилье через риелтора

Чтобы купить квартиру в строящемся доме, можно обратиться в агентство недвижимости или непосредственно к застройщику. ...

Каждое предприятие устроено по определенной модели

Каждое предприятие устроено по определенной модели, в которой объединены различные функции, процессы и ресурсы. От ...