Искусственный интеллект от Facebook заговорил голосом Билла Гейтса

11 июнь 2019 13:40 #82366 от ICT
Разработчики сервиса MelNet от Facebook добились вполне правдоподобного синтеза голоса при воспроизведении коротких фраз. Для наглядности фразы озвучены "клонами" известных людей. Времена, когда искусственный голос был безжизненным и неэмоциональным, похоже, скоро останутся в прошлом. Сразу несколько команд разработчиков добились значительных успехов в синтезе настоящего живого аудио. Это уже не старые системы, которые нарезают звуки и слова, компонуя из них фразы. Программы WaveNet, SampleRNN и подобные продукты используют системы машинного обучения для анализа образцов звуков и последующего "озвучивания" текста.
Воссоздание песни Арианны Гранде с помощью SampleRNN

Пример озвучивания текста с помощью WaveNet
Фейковый репортаж известного комика и спортивного комментатора Джо Рогана, сгенерированный стартапом Dessa В Facebook, разрабатывающем систему MelNet, пошли другим путем и предложили искусственному интеллекту поработать со спектрограммами. Исследователи утверждают , что их продукт хорошо воспроизводит тонкие последовательности, содержащиеся в голосе спикера, которые, как ни странно, практически невозможно описать словами, но легко уловить человеческим ухом. Для проверки этого утверждения можно прослушать образцы фраз , которые алгоритм произносит голосом известных людей. В частности, разработчики MelNet "синтезировали" Билла Гейтса, Стивена Хокинга, Салмана Хана, Стивена Вольфрама и еще нескольких известных персон (в категории "Selected Speakers" можно выбрать конкретного спикера и прослушать одну и ту же фразу в исполнении разных ораторов).
Озвучивание текста "that we mother nature thank you" на основании анализа спектрограммы В качестве одного из ресурсов для анализа использовался 452-часовой набор аудио из известной программы TED. Остальные обучающие данные были взяты из аудиокниг, которые выбраны из-за "очень оживленной манеры" докладчиков, и, соответственно, максимальной сложности задачи. Несмотря на то, что короткие фразы звучат вполне правдоподобно, MelNet пока не умеет работать с эмоциональной наполненностью длинных текстов. Например, система не может создать драматический эффект или перепады вербального напряжения на протяжении абзаца или страницы текста. Ссылка на источник


  • Сообщений: 103416

  • Пол: Не указан
  • Дата рождения: Неизвестно
  • Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

    Похожие статьи

    ТемаРелевантностьДата
    Смоленской пенсионерке отказали в службе за здравие Билла Гейтса (видео)17.72Четверг, 25 февраля 2016
    HP требует $5 млрд от «британского Билла Гейтса», который довел ее до раскола17.72Понедельник, 25 марта 2019
    В Еврокомиссии отказались от предложения Билла Гейтса ввести налог на труд роботов17.54Пятница, 02 июня 2017
    Илон Маск обогнал Билла Гейтса и стал вторым в рейтинге миллиардеров17.54Вторник, 24 ноября 2020
    «Яндекс.Навигатор» заговорил голосом Василия Уткина17.27Четверг, 04 августа 2016
    Искусственный интеллект Facebook научился врать и торговаться16.14Четверг, 15 июня 2017
    Искусственный интеллект может начать модерацию комментариев в Facebook15.97Четверг, 17 июня 2021
    Facebook запустил искусственный интеллект, который будет читать личные сообщения15.64Четверг, 02 июня 2016
    Facebook начала применять искусственный интеллект для выявления склонных к суициду пользователей15.64Четверг, 02 марта 2017
    Больше искусственный, чем интеллект11.97Пятница, 05 июля 2019

    Мы в соц. сетях