클라우드 서비스

AWS코리아, 장애 고객에 11월 EC2 요금중 10% 환불 조치

백지영

-3년 만에 서비스 장애 발생 처음, 보안 및 데이터 유출 없어
-관리시스템도 호주·미국 아닌 서울 리전에서 자체 운영 강조

[디지털데일리 백지영기자] 아마존웹서비스(AWS)는 지난달 22일 서울 리전(복수의 데이터센터 묶음)에 발생한 서비스 장애와 관련, 별도의 추가 조치 없이 올해 11월 EC2 사용 요금에서 10% 비용을 환불한다고 밝혔다.

11일 AWS코리아는 자사 블로그에 장정욱 대표 이름으로 ‘11월 22일 AWS 서울 리전 이슈의 후속 조치 안내’ 포스팅을 올리고 이같이 공지했다. 앞서 지난 11월 22일 AWS 서울 리전의 일부 도메인네임시스템(DNS) 서버 설정이 잘못돼 84분 동안 아마존 EC2 인스턴스가 제대로 작동하지 않아 배달의 민족, 쿠팡 등 국내 다수 고객이 피해를 입었다.

장 대표는 “당시 설정 오류는 바로 해결됐으며, 이후 서비스는 정상적으로 운영되고 있다”며 “이로 인해 한국 고객에 불편을 끼친 부분에 대해 사과한다”고 전했다.

이번 장애에 대한 후속조치로 AWS는 EC2에 영향을 받은 모든 고객을 대상으로 11월 EC2 청구 항목에 대해 10%를 환불할 예정이다. AWS의 서비스 수준 계약(Service Level Agreement, SLA)에 따르면, EC2의 경우 최소 99.99%의 월간 가동률을 보장하고 있다.

SLA는 일종의 서비스 수준 보장 협약서로, 서비스 공급자와 사용자 간 공식적으로 합의되는 사항이다. 수치는 다르지만 대부분의 전세계 클라우드 서비스 업체들은 SLA를 기반으로 장애에 대한 환불금액을 책정한다.

월별 가동시간이 99.0%~99.99% 미만일 경우 10%, 99.0% 미만일 경우 30%의 서비스 이용권을 지급하는 구조다. 즉, 장애가 한달에 432분(7.2시간) 이하로 발생할 경우엔 10%를 환불받는다. EC2에 84분 동안 장애가 발생했기 때문에 10%를 받을 수 있다.

다만 이를 받기 위해선 보통 고객이 직접 청구사유와 산출근거를 제출해야 하는 반면, AWS은 이번에 예외적으로 고객이 별도의 추가 조치를 하지 않아도 2018년 12월 청구서에 자동으로 반영한다고 밝혔다.

또, AWS은 서울 리전이 호주나 미국에서 운영되는 있다는 점에 대해선 사실이 아니라고 해명했다.

장 대표는 “2012년부터 AWS는 한국에 사무실을 두고 서울 리전 운영을 담당하고 있으며, 앞으로도 계속해서 운영할 것”이라며 “AWS는 한국 데이터센터를 관리하는 높은 역량을 가진 팀을 포함해 솔루션즈 아키텍트, 프로페셔널 서비스 컨설턴트, 기술 어카운트 매니저, 기술 지원 담당자 등과 같이 중요한 현장 팀을 지속적으로 구축해 왔으며, 이를 통해 국내 고객들과 협력해 왔다”고 강조했다.

특히 이번 이슈에 영향을 받은 고객에 대한 어떠한 보안 또는 데이터 손실 위험이 야기되지 않았다는 점을 부각했다.

그는 “일부 고객이 AWS 서울 리전에서 과거에도 이런 유형의 EC2 이벤트가 발생했는지 여부를 질문했는데 AWS 서울 리전을 운영한 3년 동안 이런 종류의 이벤트(장애)가 발생한 것은 이번이 처음”이라며 “서울 리전에서 EC2 서비스 수준을 측정한 이후, EC2 가용성은 매년 100%였다”고 설명했다.

이번 장애의 공지 방법에 대해선, 수천명의 고객에게 빠르고 정확하게 업데이트 정보를 저달할 수 있는 방법으로 ‘서비스 헬스(상태) 대시보드’라는 웹 사이트를 운영하고 있다고 밝혔다. 이슈가 발생되는 동안 고객에게 거의 실시간으로 정보를 제공하는 방법은 웹사이트를 운영하는 것이며, 이는 AWS를 비롯한 클라우드 벤더가 실시하고 있는 글로벌 업계 표준 방법이라는 설명이다.

장 대표는 “이번 이슈가 진행 되는 동안 주기적으로 서비스 헬스 대시보드에 정보를 업데이트 했다”며 “AWS 서비스의 성능과 가용성에 대한 개인별 맞춤형 정보를 제공하는 퍼스널 헬스 대시보드(Personal Health Dashboard)를 통해 고객 알림과 함께 자세한 정보를 제공했다”고 전했다. 뿐만 아니라 AWS 코리아 지원 담당자들은 개별적인 이메일, 전화, 웹사이트 문의하기 및 AWS 관리 콘솔 기술 지원 페이지를 통해 고객 문의에 응답했다는 점을 강조했다.

그는 “지난 11월 22일에 발생한 84분 간의 이슈를 통해 배워 나갈 것이며, 실제로 재발을 막기 위해 몇 가지 조치를 이미 취했다”며 “고객과의 소통을 넓히고 신뢰를 얻기 위해 항상 노력할 것”이라고 끝맺음했다.

<백지영 기자>jyp@ddaily.co.kr

백지영
jyp@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널