딥러닝 GPU 서버 구축 딥러닝 및 데이터 분석용 목적의 4 GPU 서버 조립 방법과 GPU 서버 사양에 대해 설명드립니다. Supermicro 회사의 X9DRG-HF 보드와, SYS-2027GR-TRF 케이스, Tesla K80 GPU가 사용되었습니다.
기존의 데스크탑으로 Tesla K80을 조립하였습니다. 하지만 CPU 레인수 등의 한계로 GPU 추가가 어려워 GPU 서버 구매 후 조립하였습니다. 데스크탑 기반으로 딥러닝 서버를 구축하는 방법은 아래의 글을 참고해 주시기 바랍니다.
GPU 서버 구매
ebay에서 서버를 구매하였고, 서버 배송료에만 $260 를 추가 계산하였습니다. 미국 캘리포니아 서니베일(Sunnyvale)에서 서울까지 Fedex으로 8일 정도 소요되었습니다.
![](https://hiseon.me/wp-content/uploads/2019/06/fedex-travel-history.png)
부피가 있을 뿐더러, 포장된 무게가 있어서 혼자 들지 못하고 서버를 함께 옮겨야 했습니다.
![](https://hiseon.me/wp-content/uploads/2019/06/gpu-server-box-1024x576.jpg)
서버가 안전하게 배송될까 걱정했었는데, 박스로 튼튼하게 포장되었습니다.
![딥러닝 GPU 서버 구축](https://hiseon.me/wp-content/uploads/2019/06/gpu-server-open-1024x576.jpg)
딥러닝 GPU 서버 구축
GPU 서버 사양
![딥러닝 GPU 서버 구축](https://hiseon.me/wp-content/uploads/2019/06/gpu-server-diagram.png)
PCI-E 3.0 16배속으로 4개의 GPU 슬롯이 지원되는 서버입니다. 2 개의 CPU(Xeon E5-2670 v2)를 사용하고 있는데, 각 CPU 마다 최대 PCI Express 레인 수 40으로 각 CPU 마다 2 GPU씩 사용됩니다. 그리고 추가로 PCI-E 3.0 8배속과 이더넷 카드등에서 레인이 사용됩니다.
https://www.supermicro.com/products/system/2U/2027/SYS-2027GR-TRF.cfm
![딥러닝 GPU 서버 구축](https://hiseon.me/wp-content/uploads/2019/06/gpu-server-spec.png)
기존의 128GB 메모리로 서버를 구매하였지만, 메모리를 업그레이드하여 256GB 으로 구성하였습니다.
![](https://hiseon.me/wp-content/uploads/2019/06/gpu-server-memory-upgrade.jpg)
GPU 서버 조립
Tesla K80 4개를 사용하여, 서버를 조립하였습니다. 먼저 Tesla K80에 장착되어 있는 마운트 브라켓(Bracket) 분리합니다. 다음 사진에서 아랫쪽에 있는 GPU가 마운트 브라켓을 제거한 모습입니다.
![](https://hiseon.me/wp-content/uploads/2019/06/tesla-k80-mount-braket-1024x704.jpg)
그리고 GPU 브라켓에 조립하여 연결 하였습니다.
![](https://hiseon.me/wp-content/uploads/2019/06/gpu-server-gpu-bracket-1-1024x440.jpg)
좌측과 우측 GPU 브라켓이 서로 다른데, 아래는 브라켓을 모두 연결한 모습입니다.
![딥러닝 GPU 서버 구축](https://hiseon.me/wp-content/uploads/2019/06/gpu-server-gpu-bracket-2-1024x576.jpg)
파워 케이블
Tesl K80은 PCI-E 파워 케이블이 아니라, EPS 파워 케이블을 사용합니다. 따라서, 서버를 조립하기 위해서 추가적으로 서버 파트 Supermicro CBL-PWEX-0663, CBL-PWEX-0665 을 2개씩 추가 구매했습니다.
![](https://hiseon.me/wp-content/uploads/2019/06/gpu-server-power-cables-1024x576.jpg)
CBL-PWEX-0665 케이블로 4개를 구매하는 것이 더 좋았을 것이라는 것을 설치 하면서 알게 되었습니다.
GPU 서버 조립
아래의 이미지는 최종적으로 조립이 완료된 모습입니다. 서버의 조립된 GPU는 Passive Cooling 방식으로 GPU 사용률과 전력 소모량 등에 따라서 자동으로 팬 속도가 조절되었습니다.
![딥러닝 GPU 서버 구축](https://hiseon.me/wp-content/uploads/2019/06/gpu-server-finish-1024x604.jpg)
GPU 서버 호스팅
조립한 Tesla K80 GPU 서버를 임대해 드립니다. 필요한 GPU 코어 개수 또는 메모리 크기등을 알려주시면 서버를 준비해 드리겠습니다. 보다 자세한 글은 아래의 페이지를 참고해 주시기 바랍니다.
( 본문 인용시 출처를 밝혀 주시면 감사하겠습니다.)