하드웨어

엔비디아, 파스칼 기반 ‘테슬라 P4 · P40’ GPU 발표


  • 김성욱 기자
    • 기사
    • 프린트하기
    • 크게
    • 작게

    입력 : 2016-09-13 23:01:45

    엔비디아(CEO 젠슨황)가 13일, 중국 베이징에서 열린 GPU 기술 컨퍼런스 ‘GTC China 2016’에서 파스칼(Pascal) GPU 아키텍처 기반의 딥 러닝 플랫폼 테슬라(Tesla) P4, P40 가속기와 함께 인공지능 추론 작업을 가속화하는 새로운 소프트웨어 텐서RT(TensorRT)와 딥스트림(DeepStream) SDK를 공개했다.

    인공지능 추론에 특화된 테슬라 P4, P40 GPU

    테슬라 P4와 P40은 엔비디아의 최신 GPU 아키텍처 파스칼을 기반으로 음성, 이미지 또는 텍스트를 인식하기 위해 훈련된 심층 신경망을 구동한다.

    ▲ ©

    엔비디아에 따르면, 이 제품은 8비트(INT8) 기반의 특수 추론 명령을 사용해 CPU 대비 45배, 지난 1년 내 출시된 GPU 솔루션 대비 4배 더 빠른 속도로 추론 작업을 실행하는 등 인공지능 추론에 특화된 성능을 제공한다.

    테슬라 P4는 작은 사이즈의 폼팩터와 50W(와트)의 저전력 디자인으로 최고 수준의 에너지 효율을 필요로 하는 데이터 센터에 적합하다.

    가령 하나의 테슬라 P4은 영상 추론 작업에서 13대의 CPU 단일 서버를 대체 할 수 있기 때문에 서버 구입 및 전력 비용을 모두 포괄하는 총소유비용(TCO)에 있어 8배 이상의 절감 효과를 기대할 수 있다는게 엔비디아측의 설명이다.

    테슬라 P4가 에너지 효율에 특화됐다면, 테슬라 P40은 최고 수준의 딥 러닝 작업 처리 성능을 제공하는데 주력하는 제품이다.

    8개의 테슬라 P40 가속기를 탑재한 서버는 44 TOPS INT8(새로운 딥 러닝 추론 명령어)의 성능을 갖추게 되며, 140대 이상의 CPU 기반 서버를 대체 가능하다.

    서버당 가격을 5,000 달러(한화 약 550만 원)로 가정할 경우, 서버 구입에서만 650,000 달러(한화 약 7억 2천만 원) 이상의 비용 절감 효과를 볼 수 있는 것이다.

    한편, 엔비디아 테슬라 P4와 P40은 각각 11월과 10월에, ODM, OEM 및 공식 파트너사의 공인된 서버에 탑재돼 출시될 예정이다.


    베타뉴스 김성욱 기자 (betapress@betanews.net)
    Copyrights ⓒ BetaNews.net