Исследователи компании Baidu создали алгоритм, который догнал людей в распознавании речи на английском и мандаринском

17 дек 2015 21:00 #30318 от ICT
Global Look Press Лаборатория искусственного интеллекта (SVAIL) исследовательского подразделения китайской компании Baidu улучшила алгоритм распознавания речи под названием Deep Speech, при этом в некоторых случаях вторая версия программы распознает речь даже быстрее людей, передает N+1 . Разработчикам удалось использовать один алгоритм глубокого обучения для распознавания устной речи на двух языках: английском и мандаринском (крупнейший из китайских языков). При этом авторы улучшили распознавание английского в шумных местах, а также продвинулись вперед в быстродействии - создали новую аппаратную платформу на видеокартах, в семь раз подняв производительность по сравнению с предыдущей версией сервера для Deep Speech. Авторы также протестировали Deep Speech 2 на скорость распознавания коротких фраз, сравнив ее с человеческой. Оказалось, что в некоторых случаях (короткие фразы без контекста) алгоритм справляется с распознаванием даже быстрее людей. Тем не менее, Deep Speech 2 все еще уступает людям в распознавании больших фрагментов текста, а также в распознавании речи с акцентом или при большом количестве посторонних шумов. По словам авторов, система уже готова к применению в онлайн-сервисах и мобильных приложениях и превосходит аналогичные алгоритмы конкурентов. В ближайшем будущем специалисты SVAIL планируют работать в направлении распознавания фраз на английском с акцентом. В частности, исследователи начали обучение нейросети английскому с индийским акцентом. Кроме Baidu обучение нейросетей для улучшения своих продуктов используют и другие компании. Facebook, например, разработала алгоритм, способный узнать человека даже со спины, а Google использует обученную нейросеть для перевода надписей на 27 языков в приложении Google Translate. Ссылка на источник


  • Сообщений: 103416

  • Пол: Не указан
  • Дата рождения: Неизвестно
  • Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

    Похожие статьи

    ТемаРелевантностьДата
    Исследователи компании Baidu создали алгоритм, который догнал людей в распознавании речи на английском и мандаринском85.49Четверг, 17 декабря 2015
    В Google создали самый совершенный алгоритм синтеза речи19.44Четверг, 28 декабря 2017
    В Facebook создали алгоритм, способный распознавать людей на фотографиях со спины17.96Вторник, 23 июня 2015
    В России создан бесплатный коммуникатор для людей с дефектами речи. Видео13.45Четверг, 18 января 2018
    Сбербанк создал новый алгоритм, который работает как дата-сайентист12.57Четверг, 14 февраля 2019
    Исследователи выяснили, что доступность информации в интернете заставляет людей завышать оценку своих собственных познаний12.45Среда, 01 апреля 2015
    Ученые создали алгоритм для "оживления" портретов (ВИДЕО)12.13Среда, 11 октября 2017
    Американские исследователи создали эластичный материал, отличающийся сверхпрочностью12Среда, 01 апреля 2015
    Ученые создали алгоритм, способный связно описывать изображения12Понедельник, 20 июля 2015
    В лаборатории Disney создали алгоритм для моделирования походки роботов12Вторник, 10 ноября 2015

    Мы в соц. сетях