인터넷

[이프카카오] “달라지겠다” 향후 5년간 3배 이상 투자 확대

최민지

[디지털데일리 최민지 기자] 카카오가 서비스 장애를 계기로 IT엔지니어링 혁신을 꾀하기 위해 투자를 확대한다.

고우찬 비상대책위원회 재발방지대책 공동소위원장은 7일 열린 연례 개발자 콘퍼런스 ‘이프카카오데브2022(if kakao dev 2022, 이하 이프카카오)’에서 “향후 5년간은 지난 5년간 투자 금액의 3배 이상 규모로 투자를 확대하겠다”고 선언했다.

이날 카카오는 미래 투자와 혁신 계획으로 ▲IT엔지니어링 거버넌스 강화 ▲인재 확보 ▲비상대응계획(BCP) 외부 자문 ▲기술 연구개발(R&D)과 오픈소스화 ▲삼중화 플러스알파의 재해복구(DR) 아키텍처 구현 ▲멀티클라우드 ▲원격지 DR 구현 등을 내놓았다. 이는 초기 투자비를 제외하고도 연간 운영비만 수백억~수천억원 단위 투자결정이 이뤄져야 실행할 수 있는 계획이다.

카카오는 이같은 투자 결정을 기반으로 IT엔지니어링 혁신을 꾀한다. 우선, 거버넌스를 변화한다.

현재 카카오 IT 엔지니어링 조직은 개발 조직산하에 있지만, 앞으로 카카오 최고경영자(CEO) 직할 부문 규모로 IT 엔지니어링 전담 조직을 확대 편성하는 방안을 검토한다. 또, 대규모 장애에 즉각 대비할 수 있도록 재해복구위원회를 신설한다. 연속성 확보에 필수적인 항목을 도출하고, 실제적으로 지속 운영‧발전할 수 있도록 하는 전담조직도 준비한다.

국내 최고 IT 엔지니어링 전문가들도 추가로 영입할 계획이다. 특히 데이터센터, 서비스 신뢰성 엔지니어링(SRE), 데브옵스(Devops), 클라우드개발 엔지니어 채용과 육성을 공격적으로 진행한다.

카카오는 외부 전문가 자문을 구해 현재 BCP 취약성을 진단하고 정확한 처방을 받기로 했다. BCP(Business Continuity Plan)는 각종 자연 재해나 인위적 사건 사고 등에도 불구하고 사업이 중단되는 상황을 최소화하기 위한 비상대응계획을 의미한다.

고우찬 소위원장은 “서비스 연속성은 BCP 개념에 포함된다. 나름의 BCP 체계를 갖췄다고 생각했지만, 결과적으로는 부족했다는 것이 이번 사고의 교훈”이라며 “적절한 외부 파트너와 협력해 철저하게 BCP를 준비하겠다”고 말했다.

서비스 안정성을 담보하기 위해 카카오는 카오스 엔지니어링 등 국내에는 보편화되지 않았지만 주요 글로벌 기업들이 도입해 효과를 보고 있는 영역에서 R&D를 실시한다. 관련해 개발된 툴들은 오픈소스로 공개하기로 했다.

DR 아키텍처는 삼중화 플러스 알파 구조로 개선한다. 데이터센터 삼중화는 구조상 3개 데이터센터 중 하나가 무력화되는 상황에서도 이중화가 담보된다. 여기에 주요 서비스는 멀티 클라우드를 활용해 서비스 연속성을 강화한다. 자체 아키텍처 확충 및 구조 개선과 더불어 외부 클라우드를 안전장치로 추가하는 것이다.

이 모든 것이 무력화될 경우 꼭 단기간 내 살려야 할 서비스, 이를테면 카카오톡 메시지 전송 기능 등을 위해 원격지 DR 데이터센터를 별도로 구축하는 방안도 고려한다.

카카오는 이번에 화재가 발생한 SK C&C 판교데이터센터를 주 데이터센터로 활용하면서, 한양대 에리카캠퍼스(안산)에 자체 데이터센터를 짓고 있다. 자체 데이터센터에서는 판교데이터센터 교훈을 기반으로 재난재해 대비에 만전을 기할 예정이다.

카카오는 2024년을 목표로 안산데이터센터 설립에 4600억원 예산을 투입해 시공 중이다. 24시간 무중단 운영을 위한 이중화 인프라 구축은 전력, 냉방, 통신 각각에 모두 적용된다. 이번 판교데이터센터 화재 사고에서 이슈가 된 무정전전원장치(UPS)실과 배터리실을 방화 격벽으로 각각 분리 시공, 배터리실에 화재가 발생하더라도 나머지 시설 작동에 영향을 주지 않게 설계됐다.

안산데이터센터는 3중 진화방식을 단계적으로 자동 작동돼 화재 조기진압을 위해 골든타임 안에 대처한다. 침수, 해일, 강풍, 지진 등 극단적인 재난 재해에 대한 대비책도 완비했다.

고 소위원장은 “EPS-UPS-배터리를 묶어 하나의 섹터를 구성, 총 4개 섹터를 확보해 전력 안정성을 극대화했다. 만약 이번과 같은 배터리실 화재 상황이 발생할 경우, 3중의 진화 방식이 작동한다”며 “이번 화재 사고처럼 밀폐된 공간에 소화 가스가 들어가지 못해 진화에 문제가 발생하지 않도록 밀폐된 전기 판넬별로 개별 소화장치를 설치했다”고 설명했다.

이어 “소화 가스 부족 상황에 대응하기 위해 필요한 경우 다른 층 소화 가스를 끌어다 쓸 수 있도록 예비 시스템을 구축했다”며 “만약 소화 가스를 활용한 진화가 실패할 경우, 화재 발생 구간을 차단하고 냉각수를 채워 방염, 방열이 가능하다”고 부연했다.

최민지
cmj@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널