국산 슈퍼컴퓨터, 미국산 보다 5-20배 탁월
■ 코코링크, 탁월한 “국산 슈퍼컴퓨터 시대 개막” 자신감
2018년 02월부터 최근 개발한 국산 슈퍼컴퓨터 시스템인 코코링크의 ‘클라이맥스 페타큐브’가 국내에 출시된다. 24대를 병렬 연결하면, 30 페타플롭스(PF) [1페타플롭스(PF)=1초에 부동소수점 1000조 회 연산] 성능을 내게 된다. 2017년 11월 발표된 톱 500 순위 기준으로 세계 400위권에 이른다. 한 대의 가격은 30억원이다.
2017년 11월 세계 슈퍼컴 1위에 오른 중국 선웨이타이후 라이트와 대등한 수준으로 작동하게 하려면, 코코링크의 ‘클라이맥스 페타큐브’를 100대 병렬 연결하면 된다. 그러면, 126 페타플롭스(PF)의 성능을 구현할 수 있다. 국내 출시를 앞둔 이 슈퍼컴퓨터는 이전에 자체 개발한 HPC (고성능 컴퓨터) (클라이맥스 210S) 10대를 하나의 랙으로 연계 구성함으로써 시스템 ‘클라이맥스 페타큐브’ 한 대로 1.26 페타플롭스(PF) 성능을 구현한다.
코코링크의 클라이맥스 페타큐브는 GPU 기반이라서 대당 1.26 페타플롭스(PF)에 불과한 이론 성능이지만, 많은 소프트웨어에서 대전 한국 과학 기술 정보원(KISTI)에 설치되는 미국 크레이의 25.7 페타플롭스(PF) 시스템과 대등한 성능을 보여줄 것으로 예상된다. 클라이맥스 페타큐브의 상품성은 응용 프로그램을 추가하여 어플라이언스 형태로 공급할 때 월등히 높아진다.
■ 코코링크, 미국산 보다 5-20배 슈퍼컴퓨터 구축 능력 확보
코코링크의 국산 슈퍼컴퓨터의 성능은 2018년 대전 KISTI 내 슈퍼컴퓨팅 센터에 구축될 슈퍼컴 5호기와 비교해 보면 더 분명해진다. 정부는 2018년 09월 540억원짜리 국가 슈퍼컴 5호기 구축 사업자로 미국 크레이 슈퍼컴을 선정했다. 미국 크레이는 슈퍼컴 5호기 (이론 성능 25.7PF)를 한창 구축 중이다. 미국 크레이의 HPC (고성능 슈퍼컴퓨터) 120대를 병렬 연결해서 완성된다. 차지하는 공간이 교실 4-5개 정도 크기이다.
하지만, 코코링크의 국산 HPC (고성능 슈퍼컴퓨터) 24대를 병렬 연결하는 것만으로도 대전 KISTI 내 국가 슈퍼컴퓨팅 센터에 구축중인 슈퍼컴 5호기 성능을 넘어선 30PF 연산 성능을 발휘한다. 이는 클라이맥스 페타큐브가 국가 슈퍼컴 5호기 설치 면적의 4분의 1 면적만으로도 동일한 이론 성능을 구현할 수 있게 해준다. 즉 코코링크가 개발한 슈퍼컴퓨터의 성능 밀도가 미국 크레이의 국가 슈퍼컴 5호기 보다 높다는 의미이다.
그렇다면 코코링크의 HPC (고성능 슈퍼컴퓨터) 제품 성능은 국내에서 안심하고 사용할 수 있을 정도로 검증됐을까? 코코링크는 2013년부터 해마다 두 차례 열리는 세계 슈퍼컴퓨팅 컨퍼런스를 거의 빠지지 않고 참가했다. 첫 출품시 1.5테라플롭스 [1테라플롭스(TF)=초당 1조회 연산속도] GPU 8개가 꽂힌 ‘클릭8000’을 소개했다. 2015년 코코링크는 처음으로 해외에서 한국산 슈퍼컴퓨팅 제품 설계 능력을 인정받았다. 2015년 미국의 컴퓨팅 전문 사이트 넥스트 플랫폼은 코코링크의 잠재력을 알아보고 주목할 만한 전세계 HPC (고성능 슈퍼컴퓨터) 스타트업 9개사에 코코링크를 포함시켰다.
2015년 코코링크는 해외 유명 연구소와 기업으로부터 HPC (고성능 슈퍼컴퓨터) 수주를 받기에 이른다. 2015년 세계 굴지의 연구소인 미국 해군 연구소(NRL)와 프랑스 제 1 이통 사업자인 오렌지 텔레콤으로부터 클라이맥스 210 시스템 수주를 받았고, HPC (고성능 슈퍼컴퓨터)를 공급하기에 이른다.
미국 해군 연구소(NRL)는 국방 관련 연구소인 만큼 용도를 알 수 없다. 하지만 오렌지 텔레콤의 경우, 인공 지능 음성 인식용으로 사용하고 있는 것으로 알려졌다. 또한 오렌지 텔레콤 본사는 코코링크의 제품을 실리콘밸리에 설립한 연구소에도 소개시켜 주기도 했다. 코코링크는 2017년 해외 수요처의 요청으로 ‘클라이맥스 페타큐브’를 만들었다.
특히, 놀라운 것은 클라이맥스 페타큐브에는 고효율의 PCI 익스프레스(PCIe) 스위치 기술이 세계 최초로 적용되었다. 모든 GPU 간에 완벽한 P2P 기능을 구현토록 했다. 코코링크의 여러개 GPU를 연결해 주는 PCI 익스프레스(PCIe) 스위치는 성능면에서 세계 최고라는 평가를 함께 받고 있다. 코코링크는 이 기술을 자사 HPC (고성능 슈퍼컴퓨터)에 적용함으로써 이미 클라이맥스210에서 보여주었듯이 20대의 고성능 GPU를 장착하고도 95%가 넘는 연동 성능 효율을 보여주었다. 인공 지능(AI) 연구를 비롯한 과학 공학 계산 분야에서 절대적인 성능 우위를 과시한다.
실제로 미국 캘리포니아 샌디에이고 대학(UCSD)의 슈퍼컴퓨터 센터장인 로스 워커 교수는 자신의 블로그에 코코링크 클라이맥스 210에 탑재된 PCIe 스위치에 장착된 모든 GPU가 25GB/초의 균일한 전송 성능을 보였다는 테스트 결과를 밝히고 있다. 그는 자신의 블로그에 “코코링크의 클라이맥스 210이 기판 하나에 20개의 GPU를 장착하는 전세계 유일의 시스템이며, 성능 또한 가장 우수하다”며 코코링크 시스템을 베낀 유사 제품들과의 비교 테스트 결과를 제시하고 있다. 실제로 코코링크는 이를 통해 GPU 중심(GPU Centric) 프로그래밍을 지원하는 세계 유일의 시스템을 제공하게 됐다.
코코링크는 2018년 02월 클라이맥스 페타큐브를 국내 출시하면서 국산 슈퍼컴 시대 개막에 대해 확신한다. 이미 코코링크의 시스템을 인정해 준 해외 기업·대학·연구소의 사용 경험과 신뢰가 자리하고 있다. 하지만, 아쉽게도 국내에서는 코코링크는 상대적으로 덜 알려져 있다. 국내에서는 외산 브랜드의 명성에 밀려 왔다. 하지만, 이제 자신감 있게 말할 수 있다. 코코링크의 클라이맥스 페타큐브 출시를 계기로 한국의 그 어떤 기관이나 연구소에도 당장이라도 슈퍼컴 5호기 이상의 작동 성능을 갖는 최고급 슈퍼컴퓨터 시스템을 즉시 구축해 드릴 수 있다.
■ 클라이맥스 210S 서버로 구성된 ‘클라이맥스 페타큐브’ 성능
코코링크가 세계 최고급 국산 슈퍼컴 시대를 열게 된 배경은 최근 개발한 슈퍼컴 ‘클라이맥스 페타큐브’ 덕분이다. 그리고, 그 뒷심은 이를 구성하는 클라이맥스 210S 서버에서 나온다. 2016년 선보인 ‘클라이맥스-210S’ 서버는 엔비디아의 GPU (테슬라 V100) 18장으로 구성되어 단일 노드로는 세계 최고 성능 [126테라플롭스(TF)]을 과시한다.
클라이맥스 페타큐브는 이 서버(HPC) 10대와 2중 스위치, 스토리지 서버 등을 19인치 듀얼컬럼 랙에 장착했다. 이를 이중 또는 삼중의 100Gbps의 네트워크로 연동해 클러스터를 구성함으로써 더욱더 효율성 높은 슈퍼컴을 구성했다.
이렇게 만들어진 클라이맥스 페타큐브 시스템 한 대(rack)는 커다란 사무실용 에어컨 크기다. 시스템 한 대의 성능은 1.26 페타플롭스 (64비트 연산시), 2.5 페타플롭스 (32비트 연산시), 20.1 페타플롭스 (딥러닝 활용시)를 각각 구현한다.
클라이맥스 페타큐브는 규모 확장에도 용이하다. 인터커넥션 스위치를 추가하지 않고도 최대 24대를 상호 연동해 30 페타플롭스의 성능을 구현할 수 있다. 충분한 내장 인터커넥션의 여유를 갖고 있도록 설계됐기 때문이다. 인터커넥션으로 스위치 (48포트 100Gbps)를 장착해서 각 노드를 2중 또는 3중으로 연결함으로써 병목 현상을 최소화했다. 대규모 SSD 스토리지 노드가 제공된다.
100대를 연동시키는 것만으로도 126 페타플롭스의 성능을 구현할 수 있다. 이는 2017년 11월 세계 슈퍼컴 1위에 오른 중국 선웨이타이후 라이트와 대등한 수준이다. 인터커넥션 스위치를 보강하면, 시스템 규모를 1000대 이상으로 확장시킬 수 있다.
클라이맥스 페타큐브를 테스트해 본 결과, 이 시스템은 인공 지능 연구, 3D 렌더링, 암호 처리, GPU DBMS 등과 같은 32비트 연산은 물론 유체 시뮬레이션처럼 64비트 연산이 요구되는 영역에서도 발군의 고효율 특성을 보였다. 실제로 단일 노드로 운영 중인 클라이맥스-210S는 국내외 유수의 대학, 연구소, 기업에서 여러 대가 이같은 용도로 공급 운영되면서 성능을 과시하고 있다. 해외에서는 앞서 밝힌 미국 해군 연구소(NRL)와 프랑스 최대 이통사인 오렌지 텔레콤, 국내에서는 서울대, 대구 경북 과학 기술원(DGIST) 등이 이를 활용해 상당한 성과를 드러내고 있다.
■ GPU 기반 슈퍼컴, 독보적 PCIe 기술에 전 세계가 주목
이미 수년 전부터 전세계 슈퍼컴 업계의 슈퍼컴용 칩 사용 트렌드는 중앙 연산 처리 장치(CPU)기반에서 GPU 기반으로 가고 있다. 업계. 학계 모두가 GPU 컴퓨터가 CPU 기반 슈퍼컴에 비해 150배 이상 빠르다고 보는 것이다. 주목할 만한 예를 들자면, 2017년 톱-500이 발표한 세계 슈퍼컴 랭킹 3위에 오른 스위스 기상청 슈퍼컴은 기존에 사용하던 구형 CPU를 장착한 구형 크레이 슈퍼컴을 동일한 구조의 신형 GPU를 탑재한 시스템으로 교체했을 뿐인데, 커다란 성능 향상을 보였다는 점이다. 2018년 구축될 대전 한국 과학 기술 정보원(KISTI) 내 슈퍼컴퓨팅 센터에 설치될 슈퍼컴 5호기는 CPU 기반이다.
코코링크의 클라이맥스 페타큐브 24대를 연동하면, 이론 성능으로는 KISTI 슈퍼컴 5호기와 비슷하지만 작동 성능으로는 슈퍼컴 5호기의 4배 이상이 될 것이다. 그래픽 칩셋(GPU) 기반으로 제작했기 때문에 가능해지는 것이다. GPU를 주된 연산 장치로 사용할 경우, CPU를 사용할 때와 비교해 더욱더 큰 연산 효율의 능력을 보인다.
고효율화가 가능한 GPU를 주된 연산 장치로 활용하면, 고효율의 프로그래밍 기술을 지원할 있어 슈퍼컴퓨팅의 비용을 획기적으로 줄일 수 있다. 그래서, 과학 공학 계산에서 있어 가장 효율적인 칩이 GPU이며, 클라이맥스 페타큐브는 가장 이상적인 GPU 기반 슈퍼컴이다.
코코링크의 GPU 기반 클라이맥스 페타큐브로 슈퍼컴 5호기의 이론 성능과 맞먹는 시스템을 구축할 경우, 비슷한 구축 비용이 들고 최대 이론 성능은 비슷하겠지만, 실제 작 동성능에서는 차이가 크다. 64비트나 32비트 연산은 CPU 기반의 슈퍼컴 5호기 보다 10배 정도 빠를 것으로 예상이 된다. 인공 지능 분야에 적용할 경우, 50배 이상의 성능 우위가 예상된다.
코코링크의 클라이맥스 페타큐브는 GPU 기반이라서 대당 1.26 페타플롭스(PF)에 불과한 이론 성능이지만, 많은 소프트웨어에서 대전 한국 과학 기술 정보원(KISTI)에 설치되는 미국 크레이의 25.7 페타플롭스(PF) 시스템과 대등한 성능을 보여줄 것으로 예상된다. 클라이맥스 페타큐브의 상품성은 응용 프로그램을 추가하여 어플라이언스 형태로 공급할 때 월등히 높아진다.
■ 코코링크, 국내 유일의 슈퍼컴퓨터 국산화 및 수출 기업
해외에서도 인정해 주는 한국산 코코링크의 슈퍼컴 기술에 대한 인지도와 수출 성과는 하루아침에 이뤄진 것은 아니다. 코코링크는 2001년 설립된 이래 슈퍼컴퓨터 기술 개발에 주력해 왔지만, 2010년에야 자체 개발 성과를 제품화해 내놓을 수 있었다. 그리고, 2015년 코코링크는 미국 텍사스주 오스틴에서 열린 SC15 (Supercomputing Conference 2015)에서 세계적인 슈퍼컴 유망 벤처로서 인정받게 된다. 이 행사 현장에서 코코링크의 클라이맥스 210의 시연 성능을 유심히 지켜 본 미국 해군 연구소(NRL)와 프랑스 최대 이통사 오렌지 텔레콤의 관계자들이 제품 주문을 해오면서 마침내 수출의 물꼬를 트게 되었다.
코코링크는 GPU 프로그래밍 분야의 코딩 역량은 물론 GPU로의 코드 이식과 최적화에서도 정상급 역량을 입증하였고, 세계적 슈퍼컴 업체로서의 성장 가능성을 보여 주었다. 코코링크는 그동안 개발해 온 HPC (고성능 슈퍼컴퓨터) 연산 성능을 이용하여 다양한 시스템 활용에 나서고 있다.
대표적인 것이 2016년 출시한 OLED 소자 개발이다. 발광 소자의 효율을 해석하고, 발광 물질의 특성을 분석해 최적의 색채와 최고 전력효율 설계를 가능케 하는 시뮬레이팅 SW와 HW (룩솔 OLED) 개발 및 상용화에 기여했다. 기존 시뮬레이터의 CPU 프로그램을 GPU로 이식했고, 그 결과 성능을 수천 배 개선한 GPU칩 기반 시뮬레이터를 상용화하는데 성공했다. 그 후, 삼성과 LG에 공급되었고, 세계 최고 한국 OLED 디스플레이 개발에 활용되고 있다.
■ 2018년 02월부터 CPU 기반 슈퍼컴퓨터에 대한 GPU 코드 이식
국내 유일의 슈퍼컴퓨터 제조 업체이자 서울대 기술 지주회사의 자회사인 ㈜코코링크는 지난 10년 동안 클릭(CliC) 80000 시리즈, 클라이맥스-210 시리즈, 클라이맥스-x10 시리즈 등 HPC (고성능 슈퍼컴퓨터)를 설계해서 제조하고 수출해 왔다. 국내 시장에 슈퍼컴을 공급할 때는 클라이맥스 페타큐브에서 사용할 응용 프로그램을 포팅해서 어플라이언스 형태로 공급하게 될 것 같다.
한국산이란 이유만으로 외면당해 왔던 국내 유일의 슈퍼컴 개발업체 코코링크의 슈퍼컴퓨터 수출은 2018년부터 가속될 전망이다. 국내 수요처들은 예산 확보 문제 등으로 인해 당장 클라이맥스 페타큐브를 구입하기는 쉽지 않을 것이다. 따라서, 이 시스템을 구성하는 서버(HPC)인 클라이맥스 210S가 주로 구매될 것으로 보인다.
서울대학교 교내 연구자들의 슈퍼컴퓨팅 수요만도 50PF 이상일 것이다. 지난 20년간 대학의 슈퍼컴퓨팅 수요 예산을 억제하는 정책을 펴면서 국내 슈퍼컴 활용 연구 분야가 매우 심각하게 위축돼 버렸다. 대전 한국 과학 기술 정보원(KISTI) 슈퍼컴 (5호기) 성능이 대단해 보이지만, 실상은 그조차도 연구 기관 한곳의 요구 성능을 충족시키는데 불과한 수준이다. 게다가 KISTI 슈퍼컴은 CPU 기반이라 현업에서의 실제 성능은 매우 낮다.
코코링크는 전세계 유수 슈퍼컴퓨터 수요자들의 반응에 힘입어 국내 시장을 놓고 글로벌 슈퍼컴 강자들과 한판 대결에 나섰다. 상대는 크레이, IBM, HPE 같은 글로벌 시장의 강자들이다. 기술과 성능면에서 한국은 이미 슈퍼컴퓨팅 강국이다. 코코링크가 있기 때문이다. 코코링크는 2018년 02월부터 국가급 슈퍼컴퓨터 시스템 ‘클라이맥스 페타큐브’ 국내 출시를 계기로 기존 CPU 기반 슈퍼컴 사용자들의 성능 향상 작업을 시행한다. CPU 기반 슈퍼컴퓨터에 대한 GPU 코드 이식 서비스를 본격적으로 제공할 계획이다.
'양자 컴퓨터' 카테고리의 다른 글
슈퍼 컴퓨터 100배 CPU 개발 성공 (0) | 2018.08.27 |
---|---|
양자 컴퓨팅 속도 높이는 SW 개발 (0) | 2018.07.05 |
양자 통신은 미래 정보 통신의 핵심 (0) | 2018.04.11 |
양자 암호 통신 야외 환경 전송 성공 (0) | 2018.04.11 |
LG 유플러스, 양자 암호 통신 시동 (0) | 2018.04.09 |