뉴스

[하이브리드DR 2023] 재해복구 자동화로 운영 효율성↑...맨텍솔루션 'MDRM'

양민하 기자
맨텍솔루션 장영환 부장
맨텍솔루션 장영환 부장

[디지털데일리 양민하기자] 디지털 전환 본격화로 기업의 비즈니스 연속성 확보가 어느 때보다 중요해진 환경에서 데이터 센터 재해, 장애에 대한 민감도 또한 증가하고 있다.

지난해 10월 발생한 판교 데이터 센터 화재는 전국의 정보기술(IT) 서비스 책임자들에게 재해복구 전략의 필요성을 각성하게 했다.

예상치 못한 재해 발생으로 서비스 중단이 될 경우, 복원력 확보를 위한 재해복구 전략 수립 여부에 따라 기업의 피해는 최소화될 수도, 최대화될 수도 있다.

지진, 화재 등 자연재해는 물론 사이버 공격, 휴먼 에러 등 서비스 중단이 일어날 수 있는 상황은 더욱 복잡해지고 있다.

재난 인지부터 실제 재해복구센터 가동까지도 수많은 절차 및 승인이 필요하다. 이러한 과정을 담당자들이 매뉴얼로 처리하는 것은 한계가 있다. 이에 자동화를 통한 재해복구 과정의 효율성 확보가 중요한 화두로 부각되고 있다.

27일 <디지털데일리> 웨비나 플랫폼 ‘DD튜브’에선 맨텍솔루션의 장영환 부장은 ‘재해복구(DR) 자동화를 통한 기업 비즈니스 연속성 확보 전략’이라는 주제로 재해복구센터를 어떻게 구축하고 운영할 것인가에 대해 소개했다.

데이터 환경은 통제 가능한 내부 요인에 의한 장애, 통제 불가능한 외부 요인에 의한 재해를 포함한 다양한 형태의 재난·장애 발생 위험에 노출돼있다. 이 같은 재난 발생 시 데이터 센터를 어떠한 정책으로 신속하게 복구할 것인가가 문제다.

장영환 부장은 “핵심은 업무영향분석(BIA), 복구시간목표(RTO), 복구시점목표(RPO) 등을 고려하는 것”이라며 “BIA를 통해 복구 우선순위를 정립하고, 그에 따라 RTO·RPO 등 목표를 설정해 적합한 솔루션을 배치할 수 있다”고 설명했다.

이를 통해 재해복구계획(DRP) 선정 등 재해복구전략(BCP) 수립이 이뤄진다. 또한 데이터 중요도에 따라 RPO 설정 및 복제 방안을 결정한다.

재해복구 운영 과제에서 고려되어야 할 요소는 ▲복구 시간이 예측 가능한가 ▲얼마나 빠른 복구를 통해 비즈니스 연속성을 확보할 것인가 ▲휴먼 에러 발생 시 대응 체계는 마련되어 있는가 ▲복구 인력의 운영 관리는 어떻게 할 것인가 등이다.

장 부장은 “이 같은 고민들로 인해 최근 재해복구 자동화 솔루션에 대한 검토가 활발히 진행되고 있다”며 “장애 및 재난 인지부터 재해복구센터 가동까지는 복잡하고 수많은 절차 및 승인이 필요하다. 이를 자동화할 경우 체계적인 모의훈련, RTO 단축, 인력 및 시간 최적화, 변경 관리, 운영 효율성 증대 등의 기대효과를 볼 수 있다”고 강조했다.

이와관련 맨텍이 제시하고 있는 ‘맨텍 다이나믹 로보틱 매니저(Mantech Dynamic Robotic Manager, 이하 MDRM)’은 다양한 고객 환경에서 시스템의 효율적인 운영·위험관리를 제공하는 IT 자동화 솔루션이다.

MDRM에서는 워크플로우 기반의 업무 프로세스 관리, 시스템 복구 과정의 가시화, 리스크 관리를 통해 데이터 센터의 효율적인 운영 관리가 가능하다.

이를 통해 ▲휴먼에러 방지 ▲복구 시간 단축 ▲운영·관리 비용 절감 ▲장애예방·사전감지 ▲복구 실패 원천 차단 등 이점을 제공한다.

MDRM은 작업의 최소 단위인 ‘컴포넌트’를 그룹화해 각 단위업무별 기동 절차를 수립한 후 워크플로우를 구성한다. 이렇게 생성된 워크플로우는 순차적 또는 병렬 등 다양한 형태로 기동이 가능하며, 원클릭을 통해 실행될 수 있다.

실행 이후에는 진행사항에 대한 모니터링 및 소요시간 등을 실시간으로 확인할 수 있다.

단위 업무별 목표 RTO 설정을 통해 목표 대비 준수·초과 결과를 확인할 수 있다. 초과된 단위 업무는 추가적인 분석을 통해 수정 및 보완이 가능하다. 데이터 복제에 대한 실시간 모니터링도 수행할 수 있다.

제공되는 30여 종의 위젯으로 사용자 정의 대시보드를 생성할 수 있다. 각 사용자, 단위업무, 시나리오를 고려한 대시보드를 제공해 직관적인 모니터링 및 관리가 가능하다. 이 외에도 보고서 및 문서관리 기능을 통해 수행된 재해복구 및 모의훈련에 대한 시행 결과 보고서를 확인할 수 있다. 각 결과 보고에 대한 문서 관리 기능을 제공한다.

MDRM은 재해복구 자동화뿐만 아니라 운영 환경의 업무 자동화에도 적용될 수 있다. ▲IPL(Initial Program Loader) ▲일일 점검 ▲센터 이전 ▲반복적인 프로세스 등 업무 역시 워크플로우 기반으로 자동화 구축이 가능하다.

장 부장은 “사용자들이 매일 반복적으로 점검해야 할 항목을 자동화해 간소화하고, 휴먼 에러를 감소시킬 수 있다”고 설명했다.

이 외에도 MDRM은 시스템 통합 모니터링을 통해 실시간 모니터링 및 사전 장애 감지 등을 수행한다. 모바일 대시보드 운영 UI와 다양한 형태의 알림 서비스도 제공된다.

장 부장은 “MDRM은 RTO 최소화를 통한 안정적인 서비스 기간 확보, 운영·관리 생산성 증대, 업무 절차 정의를 통한 명확한 역할과 책임(R&R) 제시, 재해복구와 운영 관리를 위한 올인원 솔루션을 제공한다”고 전했다.

양민하 기자
ymh@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널