하드웨어

후지쯔가 만든 1위 슈퍼컴 ‘후가쿠’…“코로나 극복 구원 투수로”

백지영
-코로나19 치료제 개발과 감염 시뮬레이션 연구 활용
-차세대 슈퍼컴 ‘후가쿠 넥스트’도 준비 중

[디지털데일리 백지영기자] 코로나 바이러스 비말은 실내습도가 낮을수록 더 멀리 퍼진다. 공기 중 습도가 30%일 때는 비말 입자가 건조돼 작아지면서 습도 60%에 비해 2배 이상의 에어로졸 입자가 발생하는 것으로 나타났다.

또 4명이 한 테이블에 앉아 대화할 경우 옆자리에 앉은 사람이 정면에 앉은 사람보다 약 5배 가까이 비말에 노출되는 것으로 분석됐다. 대각선에 앉은 사람은 정면의 약 4분의 1에 그쳤다. 즉, 옆자리의 감염 위험이 가장 높고, 그 다음이 정면, 대각선 순으로 감염 위험이 높다.

이같은 내용은 일본 후지쯔와 이화학연구소(RIKEN)가 함께 개발한 슈퍼컴퓨터 ‘후가쿠(Fugaku)’를 활용해 시뮬레이션 한 결과다.

후가쿠(후지산의 다른 이름)는 지난 6월 열린 국제슈퍼컴퓨팅컨퍼런스(ISC)에서 전세계에서 가장 빠른 슈퍼컴퓨터로 이름을 올린 시스템이다. 후가쿠의 전신은 지난 2011년 전세계 1위 슈퍼컴퓨터에 오른 ‘K컴퓨터’다. 이 역시 후지쯔와 이화학연구소가 함께 개발한 것이다.

지난 14일 온라인으로 열린 ‘후지쯔 액티베이트 나우 디지털 익스피리언스’에선 후가쿠 핵심 기술 개발을 이끌었던 유이치로 아지마 박사(수석 아키텍트)<사진 오른쪽>가 후가쿠 개발 배경과 활용에 관한 내용을 공유해 주목을 받았다.
초당 415.5페타플롭스(41경5500조번, 1페타플롭스는 1000조번)의 연산을 수행할 수 있는 후가쿠는 성능 기준의 ‘톱500’을 비롯해 ‘그래프500’, ‘HPCG’, ‘HPL-AI’ 등 4개 부문에서 1위를 기록했다.

아지마 박사에 따르면, 후가쿠는 대규모 시뮬레이션과 계산이 필요한 사회 문제와 과학 연구 과제 해결을 목적으로 개발됐다. 무려 729만9072코어가 탑재된 후가쿠의 일부 시스템은 예정보다 일찍 가동돼 위 사례처럼 코로나19 감염 연구와 치료제 개발 등에 활용되고 있다.

아지마 박사는 “현재 후가쿠의 사회적 공헌에 대한 기대가 높다”며 “이미 코로나19 바이러스 감염을 종식할 치료제 개발이나 감염 시뮬레이션 연구에 사용되고 있으며 이외에도 재해대책, 지속가능에너지 등 현대사회가 직면한 여러 문제를 해결하는데 광범위한 분야의 연구자들이 이용했으면 한다”고 말했다.

후가쿠는 기술 측면에서도 이전과는 완전히 다른 기술을 채택했다. 아지마 박사에 따르면, 후가쿠를 뒷받침하는 가장 중요한 기술은 프로세서를 6차원(6D)으로 연결하는 기술이다. 6D 연결 기술은이전의 K컴퓨터에서 채택한 것으로, 기존 3D 연결 약점을 극복하기 위해 만들어졌다.

아지마 박사는 “2004년 말 K컴퓨터를 개발하기 시작했을 당시 최고의 슈퍼컴퓨터는 미국IBM의 블루진과 크레이의 레드스톰이었다”며 “두 컴퓨터 모두 3D 연결 기술을 이용해 1만개 이상의 프로세서를 연결했는데, 당시만 해도 일본은 수천개를 연결하는 기술 밖에 없어 격차가 컸다”고 설명했다.

하지만 3D 연결시스템엔 약점이 있었다. 블루진 시스템은 섹션으로 나눠졌는데, 이는 나눌 수도 재연결할 수도 있지만 오작동이 발생하면 전체 섹션이 완전히 분리돼야 해서 가동률이 심각하게 떨어졌다. 또, 레드스톰은 가동률을 최우선으로 해 오작동하는 프로세서를 우회하는 방법을 구현했지만, 이 방법은 충돌이 잦아 통신성능을 떨어졌다.

그는 “우리는 프로세서 개수를 뛰어넘는 것 뿐 아니라 3D 연결 약점을 극복하는 것을 목표로 6D이전에 가상 3D를 생각했다”며 “이는 3D보다 복잡하지만 사용자가 소프트웨어를 사용할 때에는 3D처럼 보이도록 했다”고 말했다.

지금은 엑사스케일 컴퓨팅을 목표로 하고 있지만, 당시 페타스케일 컴퓨팅 능력을 갖춘 슈퍼컴을 만들려면 8만개 이상의 프로세서가 필요했다. 미국과 일본 모두 페타스케일급 컴퓨팅을 2010년까지 구현하는 것을 목표로 연구개발을 진행했다. 3D 연결의 문제였던 통신성능 저하를 막기 위해선 통신 채널이 더 필요했다.
2007년 만들어진 후지쯔 연구소 차세대 테크니컬 컴퓨팅 개발본부에서 비용이 들더라도 성능을 높여보자는 결정을 내렸고, 그 결과 6D 연결 기술이 나오게 됐다는 설명이다.

6D 연결기술은 단순히 다이멘션을 늘리는 것이 아니라 레이어 모델 아이디어가 포함됐다. 3D 2개를 어떻게 합쳐서 6D로 만드느냐가 중요했다. 프로세서 12개를 한 그룹으로 묶어, 그룹 자체가 3D가 되도록 하고 다른 3D 구조 속에 그룹을 연결하는 방식을 택했다.

그 결과 K컴퓨터는 2019년 은퇴하기 전까지 통신성능이 중요한 그래프500에서 1위를 유지했으며, 실제 사용자들 사이에 평판도 좋았다는 설명이다.

그렇다면 2011년 1위를 차지한 K컴퓨터와 9년 뒤인 2020년 1위를 차지한 후가쿠의 가장 큰 차이는 무엇일까.

이에 대해 아지마 박사는 “하드웨어 측면에서 말하자면 슈퍼컴퓨터는 크게 프로세서, 메모리, 인터커넥트 3가지로 구성되는데, K컴퓨터의 경우 프로세서와 메모리가 별개의 부품이었던 반면 후가쿠는 이종 통합 패키징 기술로 프로세서와 메모리가 단일부품이 됐다”고 설명했다.

그는 “후가쿠의 뛰어난 점은 이 기술을 사용해 메모리 성능을 상당히 높였고, 프로세서는 스마트폰에 널리 쓰이는 ARM 명령어 세트를 사용했다”며 “인터커넥트도 옵티컬(광학)으로 바꿈으로써 전반적인 성능 향상이 있었다”고 덧붙였다.

무엇보다 후가쿠의 성능을 이끌어낸 것은 6D 연결기술이다. 이 기술의 개발 코드명은 ‘토푸(Tofu, 두부)’다. 아지마 박사는 “처음부터 수냉식 시스템을 사용할 생각이었고 어디에서든 시스템과 분리 가능한 컨셉이었기 때문에 이런 특징을 갖는 음식이름으로 선택했다”고 설명했다. 또 이는 토러스(Torus)와 풀 커넥션(Full connection)을 합친 말이기도 하다.

토푸 인터커넥트는 이전의 3D 연결과는 달리 10만개 이상의 프로세서를 연결할 수 있다. 그룹이 단위를 이루기 때문에 어디서든 그룹을 분리해도 시스템은 여전히 사용 가능한 장점이 있다. 또, 이런 특징 때문에 다양한 수준의 병렬 프로그램을 효율적으로 돌릴 수 있는 이점이 있다. 특정 프로세서가 고장나더라도 그 부분을 우회해 계속 연결을 유지할 수 있어 데이터 통신이 정체되지 않는다.

아지마 박사는 “수리나 교환 시에도 격리부분을 최소화할 수 있어 높은 성능과 가동률을 갖게 됐다”며 “후가쿠가 과학기술연구에 활용돼 사회 문제 해결에 도움이 됐으면 한다”고 강조했다.

한편 후지쯔는 미래의 슈퍼컴퓨터나 후가쿠를 이을 ‘후가쿠 넥스트(가칭)’을 준비 중이다. 그는 “현재 6D 연결기술에 관한 특허를 우리가 보유하고 있지만 2028년 기한이 만료된다”며 “그때 나올 신기술을 사용한 슈퍼컴퓨터 아키텍처 개발에 참여하고 싶다”고 말했다.

<백지영 기자>jyp@ddaily.co.kr
백지영
jyp@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널