Россияне научили компьютер распознавать эмоции человека по голосу

08 нояб 2017 18:40 #63176 от ICT
Разработка ВШЭ Специалисты из Высшей школы экономики (ВШЭ) создали компьютерную систему, которая различает эмоции, звучащие в голосе говорящего человека. Сотрудники факультета информатики, математики и компьютерных наук Нижегородского филиала ВШЭ представили доклад, посвященный изобретению, на международной конференции Neuroinformatics-2017. Конференция, прошедшая в Москве в начале октября, посвящена нейросетям, адаптивному поведению и когнитивным исследованиям. Эмоции и смысл Авторы проекта отмечают, что распознавание устной речи и представление ее в письменном виде уже давно не представляет трудности для компьютера. Однако смысл одного и того же слова или высказывания может меняться в зависимости от того, какая эмоция присутствует в голосе говорящего, и эти оттенки смысла компьютер не улавливает. Разработчики приводят следующий пример: допустим, на вопрос «Все в порядке?» человек отвечает «Конечно». Смысл этого «конечно» варьируется в зависимости от того, каким тоном слово было произнесено — спокойно, вызывающе, жизнерадостно и т. д. В результате, используя одно и то же слово, говорящий может дать на вопрос совершенно разные ответы. Технология распознавания эмоций Благодаря самообучающейся нейросети специалисты ВШЭ Анастасия Попова, Александр Рассадин и Александр Пономаренко добились от компьютерной системы распознавания восьми эмоциональных оттенков голоса — нейтрального, спокойного, счастливого, грустного, злого, испуганного, а также демонстрирующего отвращение или удивление. Используемая для этого нейросеть представляет собой сверточную сеть глубокого обучения с архитектурой VGG-16. http://filearchive.cnews.ru/img/news/2017/11/08/recognition600.jpg"> Чтобы легче было работать с голосом, специалисты ВШЭ используют спектрограммы По словам разработчиков, компьютер угадывает эмоцию с точностью в среднем 70%, однако для каждой эмоции этот показатель разный. С нейтральным и спокойным тоном у компьютера возникает меньше всего проблем. При этом счастливую интонацию система склонна путать с испуганной или печальной, а удивление зачастую распознается ею как отвращение. Чтобы со звуком было легче работать, исследователи преобразовывают его в изображения, так называемые спектрограммы. Для их анализа можно использовать методы, которые обычно используются при распознавании графики. Нейросеть и распознавание объектов Искусственная нейронная сеть — это программный или аппаратный комплекс, построенный по аналогии с нервной системой живого организма. Сеть состоит из искусственных нейронов — простых программ или процессоров, которые занимаются выполнением своих частных несложных задач. При этом в совокупности они способны справиться с достаточно трудными заданиями. В сети присутствует три типа нейронов: входные, через которые поступает информация, выходные, через которые выдается решение, и расположенные между ними скрытые нейроны. Отличием нейросети от других программных и аппаратных платформ является то, что ее не программируют, а обучают. Все задачи она выполняет с учетом предыдущих попыток и ошибок, допущенных в ходе этих попыток. Чтобы обучить нейросеть распознавать какие-либо объекты или явления, необходимо показать ей множество отличающихся друг от друга вариантов этих объектов или явлений, указывая в каждом случае, что именно она видит. Когда будет пройден определенный порог вариативности, нейросеть сама начнет соотносить поступающие образцы с нужными категориями.[img]http://filearchive.cnews.ru/img/news/2017/11/08/recognition600.jpg"> Чтобы легче было работать с голосом, специалисты ВШЭ используют спектрограммы По словам разработчиков, компьютер угадывает эмоцию с точностью в среднем 70%, однако для каждой эмоции этот показатель разный. С нейтральным и спокойным тоном у компьютера возникает меньше всего проблем. При этом счастливую интонацию система склонна путать с испуганной или печальной, а удивление зачастую распознается ею как отвращение. Чтобы со звуком было легче работать, исследователи преобразовывают его в изображения, так называемые спектрограммы. Для их анализа можно использовать методы, которые обычно используются при распознавании графики. Нейросеть и распознавание объектов Искусственная нейронная сеть — это программный или аппаратный комплекс, построенный по аналогии с нервной системой живого организма. Сеть состоит из искусственных нейронов — простых программ или процессоров, которые занимаются выполнением своих частных несложных задач. При этом в совокупности они способны справиться с достаточно трудными заданиями. В сети присутствует три типа нейронов: входные, через которые поступает информация, выходные, через которые выдается решение, и расположенные между ними скрытые нейроны. Отличием нейросети от других программных и аппаратных платформ является то, что ее не программируют, а обучают. Все задачи она выполняет с учетом предыдущих попыток и ошибок, допущенных в ходе этих попыток. Чтобы обучить нейросеть распознавать какие-либо объекты или явления, необходимо показать ей множество отличающихся друг от друга вариантов этих объектов или явлений, указывая в каждом случае, что именно она видит. Когда будет пройден определенный порог вариативности, нейросеть сама начнет соотносить поступающие образцы с нужными категориями.


  • Сообщений: 103416

  • Пол: Не указан
  • Дата рождения: Неизвестно
  • Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

    Похожие статьи

    ТемаРелевантностьДата
    Исследователи научились распознавать эмоции человека при помощи Wi-Fi роутера22.49Четверг, 22 сентября 2016
    Россияне научили «Эльбрусы» и «Байкалы» распознавать вражеские танки. Видео18.81Понедельник, 01 апреля 2019
    Россияне научили смартфоны распознавать счета и накладные за считанные секунды18.81Среда, 22 мая 2019
    Искусственный интеллект от Microsoft научился распознавать эмоции15.96Четверг, 20 июля 2017
    Банковские боты начнут распознавать эмоции клиентов15.96Воскресенье, 29 января 2023
    «Алиса» научилась распознавать пользователя по голосу15.53Среда, 25 сентября 2019
    Разработана технология, позволяющая синтезировать речь, копирующую интонацию и эмоции человека15.1Среда, 16 марта 2022
    Нейросеть научили распознавать отретушированные снимки14.01Понедельник, 25 июня 2018
    iPhone научили распознавать владельца в маске14.01Четверг, 09 апреля 2020
    Искусственный интеллект научился распознавать человека за стеной13.91Среда, 13 июня 2018

    Мы в соц. сетях