Nvidia Tesla P100 ускоряет приложения глубокого обучения и высокопроизводительные вычисления

20 июнь 2016 18:41 #40540 от ICT
Компания Nvidia представила передовой графический ускоритель для сверхмасштабируемых дата-центров — Nvidia Tesla P100. Как сообщили CNews в Nvidia, Tesla P100, новейшее решение для платформы ускоренных вычислений Nvidia Tesla, позволяет создавать новый класс серверов с производительностью уровня нескольких сотен классических серверов на базе CPU. Nvidia Tesla P100 на базе Pascal Современные дата-центры — обширные сетевые инфраструктуры с многочисленными взаимосвязанными CPU-серверами — обрабатывают огромное количество транзакций, например, веб-сервисов. Но их мощи недостаточно для нового поколения научных приложений и задач, связанных с искусственным интеллектом, для которых требуются сверхэффективные, ультраскоростные серверные узлы, указали в компании. Ускоритель Tesla P100, основанный на новой архитектуре Nvidia Pascal с пятью передовыми технологиями, обеспечивает высокую производительность и экономичность для самых ресурсоемких приложений. Д-р Джон Келли III (John Kelly III), старший вице-президент Cognitive Solutions и IBM Research, отметил: «Искусственный интеллект и познание требуют абсолютно нового подхода и нового уровня вычислений. Графические процессоры Nvidia совместно с технологией OpenPower уже ускоряют обучение Watson новым умениям. Связка из архитектуры Power от IBM и архитектуры Pascal от Nvidia с интерфейсом NVLink вместе еще больше ускорит изучение процессов познания, ускорив развитие искусственного интеллекта». По информации Nvidia, в целом Tesla P100 — первый ускоритель Nvidia со скоростью вычислений двойной и одинарной точности в 5 и 10 терафлопс соответственно, который, по задумке производителя, позволит повысить скорость обработки данных и ускорит открытия в широком спектре областей. Решение обеспечивает высокую производительность и масштабируемость благодаря использованию пяти прогрессивных технологий. Архитектура Nvidia Pascal для экспоненциального роста производительности По утверждению представителей компании, Tesla P100 на базе архитектуры Pascal повышает скорость обучений нейронных сетей в 12 раз по сравнению с решениями на базе архитектуры прошлого поколения Nvidia Maxwell. Nvidia NVLink для масштабируемости приложений Nvidia NVLink, высокоскоростной интерфейс для связи между несколькими графическими процессорами, распределяет нагрузку между GPU, увеличивая пропускную способность. NVLink позволяет связать до восьми GPU Tesla P100, повышая производительность в узле. IBM уже внедрила NVLink в свои процессоры Power8 для высокоскоростной коммуникации между CPU и GPU. 16нм FinFET для высокой энергоэффективности Процессор Pascal обладает 15,3 млрд транзисторов, построенных на базе 16нм процесса FinFET. Он создан, чтобы обеспечить требуемую производительность и энергоэффективность для нагрузок с практически неограниченными вычислительными требованиями. CoWoS с HBM2 для больших нагрузок Архитектура Pascal объединяет процессор и данные в одном пакете, чтобы оптимизировать вычисления. Инновационный подход к строению памяти, Chip-on-Wafer-on-Substrate (CoWoS) с HBM2, повышает пропускную способность памяти в 3 раза, до 720ГБ/с, по сравнению с архитектурой Maxwell. Новые алгоритмы искусственного интеллекта для пиковой производительности Новые инструкции половинной точности обеспечивают пиковую производительность свыше 21 терафлопса в задачах глубокого обучения, указали в Nvidia. «Графический ускоритель Tesla P100 поднимает на новый уровень производительность в ряде приложений высокопроизводительных вычислений и глубокого обучения, включая приложение молекулярной динамики Amber, которое работает быстрее на 1-ом серверном узле с графическими процессорами Tesla P100, чем на 48 двухсокетных серверных узлах», — заявили в компании. Для обучения популярной глубокой нейронной сети AlexNet потребуется 250 двухсокетных серверных узлов, чтобы достичь производительности восьми GPU Tesla P100. А популярное приложение прогнозирования погоды COSMO работает быстрее на восьми GPU Tesla P100, чем на 27 двухсокетных серверах, рассказали в Nvidia. Обновления в Nvidia SDK Nvidia также анонсировала ряд обновлений в Nvidia SDK, платформе разработки для GPU-вычислений. В число обновлений входит Nvidia CUDA 8. Новейшая версия платформы параллельных вычислений Nvidia представляет разработчикам прямой доступ к новым возможностям Pascal, включая унифицированную память и NVLink. Кроме того, в актуальный релиз входит библиотека анализа графов nvGRAPH, которую можно использовать для расчета траекторий, информационной безопасности и анализа логистики, что включает в сферу применения GPU-ускоренных вычислений аналитику Big Data. В то же время, компания анонсировала cuDNN версии 5, GPU-ускоряемую библиотеку примитивов для сетей глубокого обучения. cuDNN 5 включает поддержку GPU Pascal, ускорение рекуррентных нейронных сетей, используемых для видео и других последовательных данных, а также ряд улучшений, предназначенных для использования в медицинской, нефтегазовой и других областях промышленности. cuDNN ускоряет работу фреймворков глубокого обучения, включая TensorFlow от Google, Caffe от Университета Беркли, Theano от Университета Монреаля и Torch от Нью-Йоркского Университета, которые, в свою очередь, находятся в основе решений от Amazon, Facebook, Google и других компаний, отметили в Nvidia. Доступность Графические ускорители Nvidia Tesla P100 на базе Pascal появятся в составе новой системы глубокого обучения Nvidia DGX-1 в июне. Также ожидается, что новый процессор появится в составе серверов от ведущих производителей в начале 2017 г. Ссылка на источник


  • Сообщений: 103416

  • Пол: Не указан
  • Дата рождения: Неизвестно
  • Пожалуйста Войти или Регистрация, чтобы присоединиться к беседе.

    Похожие статьи

    ТемаРелевантностьДата
    Nvidia представила контейнеры для глубокого обучения, Volta дебютируют в AWS21.7Четверг, 26 октября 2017
    Teradata и NVIDIA займутся совместными разработками ИИ и глубокого обучения21.7Четверг, 29 марта 2018
    Nvidia и Facebook ускорили работу ИИ в рамках фреймворка глубокого обучения Caffe221.25Четверг, 20 апреля 2017
    AMD представила графический ускоритель Radeon Instinct для процессов глубокого обучения15.19Вторник, 13 декабря 2016
    Nvidia совместно с производителями серверов развивает облачные вычисления для ИИ14.89Вторник, 30 мая 2017
    Nvidia совместно с производителями серверов развивает облачные вычисления для задач ИИ14.74Среда, 31 мая 2017
    Mail.Ru Cloud Solutions и Nvidia запускают в России облачные вычисления на GPU14.74Четверг, 26 апреля 2018
    Nvidia GRID ускоряет исследования в Северо-Кавказском федеральном университете13.82Понедельник, 22 мая 2017
    Расширение Oracle Cloud Platform поможет создавать и развертывать высокопроизводительные приложения13.68Среда, 25 января 2017
    Tesla выпустила собственный чип для беспилотных автомобилей. Он быстрее чипов Nvidia в семь раз13.03Вторник, 23 апреля 2019

    Мы в соц. сетях