하드웨어

엔비디아, 파스칼 아키텍처 기반 ‘테슬라 P100’ GPU 출시


  • 신근호 기자
    • 기사
    • 프린트하기
    • 크게
    • 작게

    입력 : 2016-04-06 11:05:14

    엔비디아(www.nvidia.co.kr, CEO 젠슨황)는 미국 캘리포니아 새너제이에서 열리고 있는 세계 최대의 GPU 개발자 컨퍼런스 ‘GTC 2016’에서 하이퍼스케일 데이터 센터 가속기인 ‘테슬라(Tesla) P100’ GPU를 출시했다.

    엔비디아의 차세대 ‘파스칼(Pascal)’ GPU 아키텍처를 기반으로 한 최신 가속 컴퓨팅 플랫폼 테슬라 P100은 수백 개의 CPU 노드를 합친 것과 동일한 수준의 성능을 자랑한다. 가장 심화된 연산 작업을 하는 애플리케이션을 위한 성능과 효율성을 제공하므로, 극대화된 노드와 빠른 속도를 필요로 하는 인공지능 및 과학 응용 분야에 적합하다.

    파스칼(Pascal) 기반 테슬라 P100은 이전 세대인 엔비디아 맥스웰(Maxwell) 기반 솔루션과 비교, 12배 향상된 뉴럴 네트워크 훈련 성능을 보이며, 애플리케이션 확장성 극대화를 위한 엔비디아 NV링크(NVLink)의 고속 GPU는 다중의 CPU에 걸쳐 애플리케이션을 확장하며, 현재 최고 수준의 솔루션과 비교했을 때 5배 가속화된 대역폭을 제공한다. 최대 8대의 테슬라 P100 GPU를 NV링크로 연결, 단일 노드에서 애플리케이션 성능을 최대화할 수 있다. 더 빠른 CPU와 GPU 간 정보 전송을 위해 IBM은 POWER8 CPU에 NV링크를 탑재했다.

    에너지 효율을 위해 16나노미터의 핀펫(FinFET, 3차원 입체 구조의 칩 설계 기술) 공정 기술의 153억 트랜지스터를 기반으로 한 파스칼 GPU 아키텍처는 현존하는 가장 큰 핀펫칩이다. 극한의 워크로드를 위해 가장 빠른 성능과 최상의 에너지 효율성을 제공한다.

    파스칼 아키텍처는 효율성 극대화를 위해 프로세서와 데이터를 하나로 통합했다. HBM2(고대역폭 메모리)을 탑재한 CoWoS(Chip on Wafer on Substrate) 형태의 혁신적인 메모리 디자인을 통해, 맥스웰 아키텍쳐와 비교해 초당 720GB 또는 3배 이상 높은 메모리 대역폭 성능을 제공한다.

    새로운 반정밀도의 명령은 딥러닝을 위해 21테라플롭스(teraflop, 1초에 1조회 연산) 이상의 성능을 제공한다. 배정밀도 및 단일 정밀도에서는 5에서 10 테라플롭스을 제공하는 첫 번째 가속기다.

    테슬라(Tesla) P100 GPU 가속기는 다양한 고성능 슈퍼 컴퓨터(HPC)와 딥 러닝 애플리케이션에 혁신적인 성능을 제공한다. 그 예로 앰버(AMBER) 분자동력학 코드는 48 개 듀얼 소켓 CPU 서버 노드에서보다 테슬라 P100 GPU 기반 단일 서버 노드에서 더 빠르게 작동되며, 알렉스넷(AlexNet) 딥 뉴럴 네트워크 훈련에는 250 개의 듀얼 소켓 CPU 서버 노드의 성능이 여덟 개의 테슬라(Tesla) P100 GPU로 가능하다. 일기 예보 애플리케이션인 코스모(COSMO)는 27대의 듀얼 소켓 CPU 서버보다 여덟 개의 테슬라(Tesla) P100 GPU에서 더 빠르게 구동된다.

    젠슨 황(Jen-Hsun Huang) 엔비디아 CEO 겸 공동창립자는 “암 치료 방법을 찾고, 기후 변화를 이해하며, 차세대 인공지능을 제작하는 등 우리의 과학적이고 기술적인 도전은 거의 무한한 양의 컴퓨팅 성능을 필요로 한다“며, “성능과 효율성 등 모든 수준에서 혁신적으로 발전한 엔비디아의 파스칼 GPU 아키텍처는 혁신가들에게는 새로운 기회를 제공할 것”이라고 말했다.

    ▲ ©


    베타뉴스 신근호 기자 (danielbt@betanews.net)
    Copyrights ⓒ BetaNews.net





    http://m.betanews.net/629713?rebuild=on