백지영 칼럼

[취재수첩] 데이터센터(IDC) 장애 막으려면

백지영 기자

[디지털데일리 백지영기자] 최근 국민 메신저라 불리는 ‘카카오톡’의 장애로 일반인들에게도 데이터센터(IDC)에 대한 관심이 부쩍 높아졌다. IDC는 서버와 스토리지, 네트워크 등 IT장비의 집합소로, 카카오톡과 같은 모바일 메신저 뿐만 아니라 우리 생활에 필수적인 거의 모든 서비스와 관련이 있다.

일상생활에 중요한 금융이나 공공서비스, 인터넷 검색, 택배 배송 등은 물론 기업들의 업무도 데이터센터에 있는 IT장비들을 통해 가능한 것이다. 그런데 이러한 IDC에 장애가 발생하면, 사실상 우리 생활과 밀접한 대부분의 서비스가 중단되는 상황이 발생한다.

때문에 장애 발생시 파장이 큰 금융기관들은 기본적으로 메인 데이터센터를 두고, 백업 센터를 필수적으로 배치해 IDC에 장애가 나도 서비스에 문제가 없도록 하고 있다. 그럼에도 불구하고 IDC의 장애는 빈번히 발생한다. 이중, 삼중으로 백업 센터를 운영하는 금융기관 역시 마찬가지다.

IDC 장애 원인은 여러 가지다. 카카오톡의 사례처럼 분전반에 문제가 발생할 수도 있고, DDoS와 같은 해킹에 의해서도 장애가 발생할 수 있다. 지난 2010년 발생한 씨티은행 IDC의 경우처럼 난방파이프 동파로 인한 침수도 장애 원인이 될 수 있다.


전력 사용이 많은 여름철에는 정전에 의한 장애도 빈번하다. IDC 운영 직원의 실수로 장애가 발생하는 경우도 파다하다. 지난해 발생한 일본의 자연재해처럼 피할 수 없는 경우도 있다.

이처럼 IDC의 장애 원인은 수백, 수천가지도 넘는다. 장애를 원천적으로 막을 수 있다면 좋겠지만, 그렇지 않은 것이 현실이다. 따라서 현재로선 IDC의 장애를 100% 막을 수 있는 절대적인 방법은 없다고 봐도 무방할 것이다.

최근에는 시스템 장애를 빨리 파악하고 복구할 수 있는 다양한 솔루션과 모니터링툴도 계속해서 출시되고 있지만,
무엇보다 장애가 발생했을 때는 원인을 빠르게 파악하고 이를 재빠르게 복구할 수 있는가가 현재로써는 유일한 대응책일 것이다.

한번 발생한 장애 원인을 철저히 파악하고, 재발하지 않도록 막는 것이 중요하다.

<백지영 기자>jyp@ddaily.co.kr

백지영 기자
jyp@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널