딥러닝 GPU 서버 구축


딥러닝 GPU 서버 구축 딥러닝 및 데이터 분석용 목적의 4 GPU 서버 조립 방법과 GPU 서버 사양에 대해 설명드립니다. Supermicro 회사의 X9DRG-HF 보드와, SYS-2027GR-TRF 케이스, Tesla K80 GPU가 사용되었습니다.

기존의 데스크탑으로 Tesla K80을 조립하였습니다. 하지만 CPU 레인수 등의 한계로 GPU 추가가 어려워 GPU 서버 구매 후 조립하였습니다. 데스크탑 기반으로 딥러닝 서버를 구축하는 방법은 아래의 글을 참고해 주시기 바랍니다.

딥러닝 서버 만들기

GPU 서버 구매

ebay에서 서버를 구매하였고, 서버 배송료에만 $260 를 추가 계산하였습니다. 미국 캘리포니아 서니베일(Sunnyvale)에서 서울까지 Fedex으로 8일 정도 소요되었습니다.

부피가 있을 뿐더러, 포장된 무게가 있어서 혼자 들지 못하고 서버를 함께 옮겨야 했습니다.

서버가 안전하게 배송될까 걱정했었는데, 박스로 튼튼하게 포장되었습니다.

딥러닝 GPU 서버 구축

딥러닝 GPU 서버 구축

GPU 서버 사양

딥러닝 GPU 서버 구축

PCI-E 3.0 16배속으로 4개의 GPU 슬롯이 지원되는 서버입니다. 2 개의 CPU(Xeon E5-2670 v2)를 사용하고 있는데, 각 CPU 마다 최대 PCI Express 레인 수 40으로 각 CPU 마다 2 GPU씩 사용됩니다. 그리고 추가로 PCI-E 3.0 8배속과 이더넷 카드등에서 레인이 사용됩니다.

https://www.supermicro.com/products/system/2U/2027/SYS-2027GR-TRF.cfm

딥러닝 GPU 서버 구축
(출처 : Supermicro)

기존의 128GB 메모리로 서버를 구매하였지만, 메모리를 업그레이드하여 256GB 으로 구성하였습니다.

GPU 서버 조립

Tesla K80 4개를 사용하여, 서버를 조립하였습니다. 먼저 Tesla K80에 장착되어 있는 마운트 브라켓(Bracket) 분리합니다. 다음 사진에서 아랫쪽에 있는 GPU가 마운트 브라켓을 제거한 모습입니다.

그리고 GPU 브라켓에 조립하여 연결 하였습니다.

좌측과 우측 GPU 브라켓이 서로 다른데, 아래는 브라켓을 모두 연결한 모습입니다.

딥러닝 GPU 서버 구축

파워 케이블

Tesl K80은 PCI-E 파워 케이블이 아니라, EPS 파워 케이블을 사용합니다. 따라서, 서버를 조립하기 위해서 추가적으로 서버 파트 Supermicro CBL-PWEX-0663, CBL-PWEX-0665 을 2개씩 추가 구매했습니다.

CBL-PWEX-0665 케이블로 4개를 구매하는 것이 더 좋았을 것이라는 것을 설치 하면서 알게 되었습니다.

GPU 서버 조립

아래의 이미지는 최종적으로 조립이 완료된 모습입니다. 서버의 조립된 GPU는 Passive Cooling 방식으로 GPU 사용률과 전력 소모량 등에 따라서 자동으로 팬 속도가 조절되었습니다.

딥러닝 GPU 서버 구축

GPU 서버 호스팅

조립한 Tesla K80 GPU 서버를 임대해 드립니다. 필요한 GPU 코어 개수 또는 메모리 크기등을 알려주시면 서버를 준비해 드리겠습니다. 보다 자세한 글은 아래의 페이지를 참고해 주시기 바랍니다.

저렴한 GPU 서버 호스팅

( 본문 인용시 출처를 밝혀 주시면 감사하겠습니다.)