양자 컴퓨터

국산 슈퍼컴퓨터, 미국산 보다 5-20배 탁월

마도러스 2018. 4. 11. 22:45


국산 슈퍼컴퓨터, 미국산 보다 5-20배 탁월

 

■ 코코링크탁월한 국산 슈퍼컴퓨터 시대 개막” 자신감

 

2018년 02월부터 최근 개발한 국산 슈퍼컴퓨터 시스템인 코코링크의 클라이맥스 페타큐브’가 국내에 출시된다24를 병렬 연결하면30 페타플롭스(PF) [1페타플롭스(PF)=1초에 부동소수점 1000조 회 연산성능을 내게 된다. 2017년 11월 발표된 톱 500 순위 기준으로 세계 400위권에 이른다한 대의 가격은 30억원이다.

 

2017년 11월 세계 슈퍼컴 1에 오른 중국 선웨이타이후 라이트와 대등한 수준으로 작동하게 하려면코코링크의 클라이맥스 페타큐브’를 100 병렬 연결하면 된다그러면126 페타플롭스(PF)의 성능을 구현할 수 있다국내 출시를 앞둔 이 슈퍼컴퓨터는 이전에 자체 개발한 HPC (고성능 컴퓨터) (클라이맥스 210S) 10대를 하나의 랙으로 연계 구성함으로써 시스템 클라이맥스 페타큐브’ 한 대로 1.26 페타플롭스(PF) 성능을 구현한다.


코코링크의 클라이맥스 페타큐브는 GPU 기반이라서 대당 1.26 페타플롭스(PF)에 불과한 이론 성능이지만많은 소프트웨어에서 대전 한국 과학 기술 정보원(KISTI)에 설치되는 미국 크레이의 25.7 페타플롭스(PF) 시스템과 대등한 성능을 보여줄 것으로 예상된다클라이맥스 페타큐브의 상품성은 응용 프로그램을 추가하여 어플라이언스 형태로 공급할 때 월등히 높아진다.


■ 코코링크미국산 보다 5-20배 슈퍼컴퓨터 구축 능력 확보

 

코코링크의 국산 슈퍼컴퓨터의 성능은 2018년 대전 KISTI 내 슈퍼컴퓨팅 센터에 구축될 슈퍼컴 5호기와 비교해 보면 더 분명해진다정부는 2018년 09월 540억원짜리 국가 슈퍼컴 5호기 구축 사업자로 미국 크레이 슈퍼컴을 선정했다미국 크레이는 슈퍼컴 5호기 (이론 성능 25.7PF)를 한창 구축 중이다미국 크레이의 HPC (고성능 슈퍼컴퓨터120를 병렬 연결해서 완성된다차지하는 공간이 교실 4-5개 정도 크기이다.

 

하지만코코링크의 국산 HPC (고성능 슈퍼컴퓨터24를 병렬 연결하는 것만으로도 대전 KISTI 내 국가 슈퍼컴퓨팅 센터에 구축중인 슈퍼컴 5호기 성능을 넘어선 30PF 연산 성능을 발휘한다이는 클라이맥스 페타큐브가 국가 슈퍼컴 5호기 설치 면적의 4분의 면적만으로도 동일한 이론 성능을 구현할 수 있게 해준다즉 코코링크가 개발한 슈퍼컴퓨터의 성능 밀도가 미국 크레이의 국가 슈퍼컴 5호기 보다 높다는 의미이다.

 

그렇다면 코코링크의 HPC (고성능 슈퍼컴퓨터제품 성능은 국내에서 안심하고 사용할 수 있을 정도로 검증됐을까코코링크는 2013년부터 해마다 두 차례 열리는 세계 슈퍼컴퓨팅 컨퍼런스를 거의 빠지지 않고 참가했다첫 출품시 1.5테라플롭스 [1테라플롭스(TF)=초당 1조회 연산속도] GPU 8개가 꽂힌 클릭8000’을 소개했다. 2015년 코코링크는 처음으로 해외에서 한국산 슈퍼컴퓨팅 제품 설계 능력을 인정받았다. 2015년 미국의 컴퓨팅 전문 사이트 넥스트 플랫폼은 코코링크의 잠재력을 알아보고 주목할 만한 전세계 HPC (고성능 슈퍼컴퓨터스타트업 9개사에 코코링크를 포함시켰다.

 

2015년 코코링크는 해외 유명 연구소와 기업으로부터 HPC (고성능 슈퍼컴퓨터수주를 받기에 이른다. 2015년 세계 굴지의 연구소인 미국 해군 연구소(NRL)와 프랑스 제 이통 사업자인 오렌지 텔레콤으로부터 클라이맥스 210 시스템 수주를 받았고, HPC (고성능 슈퍼컴퓨터)를 공급하기에 이른다.

 

미국 해군 연구소(NRL)는 국방 관련 연구소인 만큼 용도를 알 수 없다하지만 오렌지 텔레콤의 경우인공 지능 음성 인식용으로 사용하고 있는 것으로 알려졌다또한 오렌지 텔레콤 본사는 코코링크의 제품을 실리콘밸리에 설립한 연구소에도 소개시켜 주기도 했다코코링크는 2017년 해외 수요처의 요청으로 클라이맥스 페타큐브를 만들었다.

 

특히놀라운 것은 클라이맥스 페타큐브에는 고효율의 PCI 익스프레스(PCIe) 스위치 기술이 세계 최초로 적용되었다모든 GPU 간에 완벽한 P2P 기능을 구현토록 했다코코링크의 여러개 GPU를 연결해 주는 PCI 익스프레스(PCIe) 스위치는 성능면에서 세계 최고라는 평가를 함께 받고 있다코코링크는 이 기술을 자사 HPC (고성능 슈퍼컴퓨터)에 적용함으로써 이미 클라이맥스210에서 보여주었듯이 20대의 고성능 GPU를 장착하고도 95%가 넘는 연동 성능 효율을 보여주었다인공 지능(AI) 연구를 비롯한 과학 공학 계산 분야에서 절대적인 성능 우위를 과시한다.

 

실제로 미국 캘리포니아 샌디에이고 대학(UCSD)의 슈퍼컴퓨터 센터장인 로스 워커 교수는 자신의 블로그에 코코링크 클라이맥스 210에 탑재된 PCIe 스위치에 장착된 모든 GPU가 25GB/초의 균일한 전송 성능을 보였다는 테스트 결과를 밝히고 있다그는 자신의 블로그에 코코링크의 클라이맥스 210이 기판 하나에 20개의 GPU를 장착하는 전세계 유일의 시스템이며성능 또한 가장 우수하다며 코코링크 시스템을 베낀 유사 제품들과의 비교 테스트 결과를 제시하고 있다실제로 코코링크는 이를 통해 GPU 중심(GPU Centric) 프로그래밍을 지원하는 세계 유일의 시스템을 제공하게 됐다.

 

코코링크는 2018년 02월 클라이맥스 페타큐브를 국내 출시하면서 국산 슈퍼컴 시대 개막에 대해 확신한다이미 코코링크의 시스템을 인정해 준 해외 기업·대학·연구소의 사용 경험과 신뢰가 자리하고 있다하지만아쉽게도 국내에서는 코코링크는 상대적으로 덜 알려져 있다국내에서는 외산 브랜드의 명성에 밀려 왔다하지만이제 자신감 있게 말할 수 있다코코링크의 클라이맥스 페타큐브 출시를 계기로 한국의 그 어떤 기관이나 연구소에도 당장이라도 슈퍼컴 5호기 이상의 작동 성능을 갖는 최고급 슈퍼컴퓨터 시스템을 즉시 구축해 드릴 수 있다.

 

■ 클라이맥스 210S 서버로 구성된 클라이맥스 페타큐브’ 성능

 

코코링크가 세계 최고급 국산 슈퍼컴 시대를 열게 된 배경은 최근 개발한 슈퍼컴 클라이맥스 페타큐브’ 덕분이다그리고그 뒷심은 이를 구성하는 클라이맥스 210S 서버에서 나온다. 2016년 선보인 클라이맥스-210S’ 서버는 엔비디아의 GPU (테슬라 V100) 18장으로 구성되어 단일 노드로는 세계 최고 성능 [126테라플롭스(TF)]을 과시한다.

 

클라이맥스 페타큐브는 이 서버(HPC) 10대와 2중 스위치스토리지 서버 등을 19인치 듀얼컬럼 랙에 장착했다이를 이중 또는 삼중의 100Gbps의 네트워크로 연동해 클러스터를 구성함으로써 더욱더 효율성 높은 슈퍼컴을 구성했다.

 

이렇게 만들어진 클라이맥스 페타큐브 시스템 한 대(rack)는 커다란 사무실용 에어컨 크기다시스템 한 대의 성능은 1.26 페타플롭스 (64비트 연산시), 2.5 페타플롭스 (32비트 연산시), 20.1 페타플롭스 (딥러닝 활용시)를 각각 구현한다.

 

클라이맥스 페타큐브는 규모 확장에도 용이하다인터커넥션 스위치를 추가하지 않고도 최대 24를 상호 연동해 30 페타플롭스의 성능을 구현할 수 있다충분한 내장 인터커넥션의 여유를 갖고 있도록 설계됐기 때문이다인터커넥션으로 스위치 (48포트 100Gbps)를 장착해서 각 노드를 2중 또는 3중으로 연결함으로써 병목 현상을 최소화했다대규모 SSD 스토리지 노드가 제공된다.

 

100를 연동시키는 것만으로도 126 페타플롭스의 성능을 구현할 수 있다이는 2017년 11월 세계 슈퍼컴 1에 오른 중국 선웨이타이후 라이트와 대등한 수준이다인터커넥션 스위치를 보강하면시스템 규모를 1000대 이상으로 확장시킬 수 있다.

 

클라이맥스 페타큐브를 테스트해 본 결과이 시스템은 인공 지능 연구, 3D 렌더링암호 처리, GPU DBMS 등과 같은 32비트 연산은 물론 유체 시뮬레이션처럼 64비트 연산이 요구되는 영역에서도 발군의 고효율 특성을 보였다실제로 단일 노드로 운영 중인 클라이맥스-210S는 국내외 유수의 대학연구소기업에서 여러 대가 이같은 용도로 공급 운영되면서 성능을 과시하고 있다해외에서는 앞서 밝힌 미국 해군 연구소(NRL)와 프랑스 최대 이통사인 오렌지 텔레콤국내에서는 서울대대구 경북 과학 기술원(DGIST) 등이 이를 활용해 상당한 성과를 드러내고 있다.

 

■ GPU 기반 슈퍼컴독보적 PCIe 기술에 전 세계가 주목

 

이미 수년 전부터 전세계 슈퍼컴 업계의 슈퍼컴용 칩 사용 트렌드는 중앙 연산 처리 장치(CPU)기반에서 GPU 기반으로 가고 있다업계학계 모두가 GPU 컴퓨터가 CPU 기반 슈퍼컴에 비해 150배 이상 빠르다고 보는 것이다주목할 만한 예를 들자면, 2017년 톱-500이 발표한 세계 슈퍼컴 랭킹 3위에 오른 스위스 기상청 슈퍼컴은 기존에 사용하던 구형 CPU를 장착한 구형 크레이 슈퍼컴을 동일한 구조의 신형 GPU를 탑재한 시스템으로 교체했을 뿐인데커다란 성능 향상을 보였다는 점이다. 2018년 구축될 대전 한국 과학 기술 정보원(KISTI) 내 슈퍼컴퓨팅 센터에 설치될 슈퍼컴 5호기는 CPU 기반이다.

 

코코링크의 클라이맥스 페타큐브 24대를 연동하면이론 성능으로는 KISTI 슈퍼컴 5호기와 비슷하지만 작동 성능으로는 슈퍼컴 5호기의 4배 이상이 될 것이다그래픽 칩셋(GPU) 기반으로 제작했기 때문에 가능해지는 것이다. GPU를 주된 연산 장치로 사용할 경우, CPU를 사용할 때와 비교해 더욱더 큰 연산 효율의 능력을 보인다.

 

고효율화가 가능한 GPU를 주된 연산 장치로 활용하면고효율의 프로그래밍 기술을 지원할 있어 슈퍼컴퓨팅의 비용을 획기적으로 줄일 수 있다그래서과학 공학 계산에서 있어 가장 효율적인 칩이 GPU이며클라이맥스 페타큐브는 가장 이상적인 GPU 기반 슈퍼컴이다.

 

코코링크의 GPU 기반 클라이맥스 페타큐브로 슈퍼컴 5호기의 이론 성능과 맞먹는 시스템을 구축할 경우비슷한 구축 비용이 들고 최대 이론 성능은 비슷하겠지만실제 작 동성능에서는 차이가 크다. 64비트나 32비트 연산은 CPU 기반의 슈퍼컴 5호기 보다 10배 정도 빠를 것으로 예상이 된다인공 지능 분야에 적용할 경우, 50배 이상의 성능 우위가 예상된다.

 

코코링크의 클라이맥스 페타큐브는 GPU 기반이라서 대당 1.26 페타플롭스(PF)에 불과한 이론 성능이지만많은 소프트웨어에서 대전 한국 과학 기술 정보원(KISTI)에 설치되는 미국 크레이의 25.7 페타플롭스(PF) 시스템과 대등한 성능을 보여줄 것으로 예상된다클라이맥스 페타큐브의 상품성은 응용 프로그램을 추가하여 어플라이언스 형태로 공급할 때 월등히 높아진다.

 

■ 코코링크국내 유일의 슈퍼컴퓨터 국산화 및 수출 기업

 

해외에서도 인정해 주는 한국산 코코링크의 슈퍼컴 기술에 대한 인지도와 수출 성과는 하루아침에 이뤄진 것은 아니다코코링크는 2001년 설립된 이래 슈퍼컴퓨터 기술 개발에 주력해 왔지만, 2010년에야 자체 개발 성과를 제품화해 내놓을 수 있었다그리고, 2015년 코코링크는 미국 텍사스주 오스틴에서 열린 SC15 (Supercomputing Conference 2015)에서 세계적인 슈퍼컴 유망 벤처로서 인정받게 된다이 행사 현장에서 코코링크의 클라이맥스 210의 시연 성능을 유심히 지켜 본 미국 해군 연구소(NRL)와 프랑스 최대 이통사 오렌지 텔레콤의 관계자들이 제품 주문을 해오면서 마침내 수출의 물꼬를 트게 되었다.

 

코코링크는 GPU 프로그래밍 분야의 코딩 역량은 물론 GPU로의 코드 이식과 최적화에서도 정상급 역량을 입증하였고세계적 슈퍼컴 업체로서의 성장 가능성을 보여 주었다코코링크는 그동안 개발해 온 HPC (고성능 슈퍼컴퓨터연산 성능을 이용하여 다양한 시스템 활용에 나서고 있다.

 

대표적인 것이 2016년 출시한 OLED 소자 개발이다발광 소자의 효율을 해석하고발광 물질의 특성을 분석해 최적의 색채와 최고 전력효율 설계를 가능케 하는 시뮬레이팅 SW와 HW (룩솔 OLED) 개발 및 상용화에 기여했다기존 시뮬레이터의 CPU 프로그램을 GPU로 이식했고그 결과 성능을 수천 배 개선한 GPU칩 기반 시뮬레이터를 상용화하는데 성공했다그 후삼성과 LG에 공급되었고세계 최고 한국 OLED 디스플레이 개발에 활용되고 있다.

 

■ 2018년 02월부터 CPU 기반 슈퍼컴퓨터에 대한 GPU 코드 이식

 

국내 유일의 슈퍼컴퓨터 제조 업체이자 서울대 기술 지주회사의 자회사인 코코링크는 지난 10년 동안 클릭(CliC) 80000 시리즈클라이맥스-210 시리즈클라이맥스-x10 시리즈 등 HPC (고성능 슈퍼컴퓨터)를 설계해서 제조하고 수출해 왔다국내 시장에 슈퍼컴을 공급할 때는 클라이맥스 페타큐브에서 사용할 응용 프로그램을 포팅해서 어플라이언스 형태로 공급하게 될 것 같다.

 

한국산이란 이유만으로 외면당해 왔던 국내 유일의 슈퍼컴 개발업체 코코링크의 슈퍼컴퓨터 수출은 2018년부터 가속될 전망이다국내 수요처들은 예산 확보 문제 등으로 인해 당장 클라이맥스 페타큐브를 구입하기는 쉽지 않을 것이다따라서이 시스템을 구성하는 서버(HPC)인 클라이맥스 210S가 주로 구매될 것으로 보인다.

 

서울대학교 교내 연구자들의 슈퍼컴퓨팅 수요만도 50PF 이상일 것이다지난 20년간 대학의 슈퍼컴퓨팅 수요 예산을 억제하는 정책을 펴면서 국내 슈퍼컴 활용 연구 분야가 매우 심각하게 위축돼 버렸다대전 한국 과학 기술 정보원(KISTI) 슈퍼컴 (5호기성능이 대단해 보이지만실상은 그조차도 연구 기관 한곳의 요구 성능을 충족시키는데 불과한 수준이다게다가 KISTI 슈퍼컴은 CPU 기반이라 현업에서의 실제 성능은 매우 낮다.

 

코코링크는 전세계 유수 슈퍼컴퓨터 수요자들의 반응에 힘입어 국내 시장을 놓고 글로벌 슈퍼컴 강자들과 한판 대결에 나섰다상대는 크레이, IBM, HPE 같은 글로벌 시장의 강자들이다기술과 성능면에서 한국은 이미 슈퍼컴퓨팅 강국이다코코링크가 있기 때문이다코코링크는 2018년 02월부터 국가급 슈퍼컴퓨터 시스템 클라이맥스 페타큐브’ 국내 출시를 계기로 기존 CPU 기반 슈퍼컴 사용자들의 성능 향상 작업을 시행한다. CPU 기반 슈퍼컴퓨터에 대한 GPU 코드 이식 서비스를 본격적으로 제공할 계획이다.