ITZONE

엔터프라이즈, 데이터센터급 서버 & 스토리지, 무선통신 microTCA 시스템에서
IT 가상화와 Deep Learning 솔루션까지 아이티존의 발전은 계속됩니다.

딥러닝솔루션

  • Home
  • Solution
  • 딥러닝솔루션

NVIDIA의 최신 GPU 기술을 탑재한 IBM 딥러닝 서버 솔루션 – IBM Minsky

IBM Power8 CPU와 NVIDIA P100 GPU의 조합

  • 최신 Pascal 아키텍처의 P100 4장 장착
  • 양방향 40+40GB/sec의 대역폭을 가지는 NVLink를 통해 GPU-GPU는 물론, CPU-GPU도 연결
  • 물리적 core 1개당 8개의 HW thread(SMT-8)를 가지는 Power8 프로세서
  • 2U 공간 안에 강력한 GPU 컴퓨팅 파워를 압축하여 성능 대비 상면적 및 전력 소비량에서 월등한 이점

최신, 최고의 GPU
PASCAL P100

  • NVIDIA의 최신 PASCAL 아키텍처 P100 GPU 장착
  • 딥러닝을 위한 Half-precision 성능 21TFLOPS
  • 기존의 3배에 달하는 GPU메모리 대역폭

신기술에 의한
기존 문제의 해결

  • Unified Memory로 GPU 메모레 한계 극복, P2P 문제 해결
  • NVLink 기술로 GPU-CPU간 병목 해결, 획기적 성능 향상

딥러닝 프레임워크 제공
PowerAI

  • IBM의 딥러닝소프트웨어툴킷 PowerAI 제공
  • CAFFE, Torch, TensorFlow 등 주요 딥러닝 프레임워크를 최적화하여 패키지로 제공

진정한 오픈 아키텍처
OpenPOWER 플랫폼

  • POWER 아키텍처 공개에 의한 진정한 오픈 아키텍처
  • IBM / Mellanox / NVIDIA 협업을 통한 굳건한 GPU 솔루션 로드맵
  • NVIDIA-IBM Acceleration Lab 지원

GPU를 'full peer'로 취급하여 P2P 문제 해결

Minsky는 '두껍고도 수평적으로' (both fat and flat) 설계된 시스템

  • 어느 link에서도 data 병목이 생기지 않도록 설계
  • GPU에서도 CPU처럼 시스템 메모리를 취급(시스템 메모리 최대 1TB

보편적 업무와 알고리즘에 잘 맞는 구조

  • Startup/teardown시 폭발적인 성능
  • 두 GPU간의 안정적 transfer
  • 부족한 대역폭으로 인한 host-device간의 bus transfer 문제 해소

기존 GPU 컴퓨팅의 병목을 해결하는 NVLink

세계 유일 GPU-GPU 뿐만 아니라 GPU-CPU도 NVLink로 연결 가능
기존 PCle Gen3대비 약 2.5배 대역폭 제공

IBM S822LC 20-cores 2.86GHz 512GB memory / 4 Nvidia Tesla P100 GPUs / Ubuntu 16.04 / CUDA 8.0.44 / cuDNN 5.1 / IBMCaffe 1.0.0-rc3 / Imagenet Data

Intel Broadwell E5-2640v4 20-core 2.6GHz 512GB memory / 8 NVIDIA Tesla M40 GPUs / Ubuntu 16.04 / CUDA 8.0.44 / cuDNN 5.1 / BVLC Caffe 1.0.0-rc3 / Imagenet Data

IBM Minsky(IBM Power System S822LC for HPC) 개요

시스템 구성(8335-GTB)
마이크로프로세서 8코어 3.25GHz Power8 프로세서 카드 2개 또는 10코어 2.86GHz Power8 프로세서 카드 2개
L2(Level 2) 캐시 코어당 512KB L2 캐시
L3(Level 3) 캐시 코어당 8MB L3 캐시
L4(Level 4) 캐시 소켓당 최대 64MB
메모리 최소/최대 4GB, 8GB, 16GB, 32GB, DDR4 모듈, 128GB ~ 1TB 총 메모리
프로세서-메모리 대역폭 소켓당 115GB/초, 시스템당 230GB/초(SCM에서 L4 캐시까지의 최대 지속 메모리 대역폭)
소켓당 170GB/초, 시스템당 340GB/초(L4 캐시에서 DIMM까지 최대 피크 메모리 대역폭)
스토리지 및 입출력(I/O)
표준 백플레인 하드 디스크 드라이브(HDD) 또는 솔리드 스테이트 디스크(SDD)를 위한 SFF(small form factor) 베이 2개
미디어 베이 해당 없음
RAID 옵션 통합 PCle 어댑터에서 하드웨어 RAID 지원
어댑터 슬롯 PCle Gen3 슬롯 3개: x16 PCle Gen3 2개, x8 PCle Gen3 1개 모두 CAPI 지원
I/O 대역폭 64GBps
GPU 엑셀러레이터 최대 4개의 NVIDIA Tesla P100(NVLink GPU)
전원, RAS, 시스템 소프트웨어, 물리적 특성과 보증
전원 200V ~ 240V
RAS 기능
  • 프로세서 명령 재시도
  • Chipki 메모리
  • 결함 모니터링 기능이 있는 서비스 프로세서
  • 핫플러그 및 이중 전원/냉각 팬(GPU 설치 시 전원 이중화 없음)
  • 선택 동적 펌웨어 업데이트
  • ECC L2 캐시, L3 캐시
  • 핫스왑 가능 디스크 베이
운영체제 Linux on POWER
시스템 크기 4415W x 86H x 822D mm