보안

‘라우터 포트 불량’ 결론 난 행정 전산망 마비… “낡은 환경이 사태 키웠다”

이종현 기자
정부서울청사에 설치된 지방행정전산서비스 장애 대응 상황실 ⓒ연합뉴스
정부서울청사에 설치된 지방행정전산서비스 장애 대응 상황실 ⓒ연합뉴스

[디지털데일리 이종현기자] 전국의 행정 서비스를 중단시켰던 11월17일 행정 전산망 장애 원인이 네트워크 장비인 라우터 불량으로 결론났다. 정확히는 라우터의 포트에 불량이 있어 데이터 패킷을 정상적으로 주고받지 못했기 때문에 생긴 일이라는 설명이다.

지난 25일 고기동 행정안전부 차관과 송상효 숭실대 교수 등 지방행정전산서비스 개편 태스크포스(TF) 공동 팀장은 정부서울청사에서 장애 원인 및 향후 대책 브리핑에서 이같이 밝혔다.

발표에 따르면 행정안전부는 장애 후 네트워크 장비를 대상으로 성능을 점검하기 위해 구간을 나눠 반복적인 부하 테스트를 진행, 장애 및 접속 지연이 발생하는 영역을 확인하는 방식으로 장애 유발 원인을 좁혀나갔다. 그 결과 네트워크 장비인 라우터에서 패킷을 전송할 때 용량이 큰 패킷이 유실되는 현상이 관찰됐다고 전했다.

라우터는 7계층(L1~L7)로 구분되는 네트워크 프로토콜 통신 구조(OSI) 중 네트워크 영역인 3계층을 담당하는 장비다. 네트워크 전문가는 “데이터 패킷을 목적지까지 잘 안내하는 경로(Route)를 안내하는 내비게이션”이라며 통상 ‘네트워크 장비’라고 지칭할 경우 그 대표격인 제품이라고 설명했다.

송상효 교수는 “패킷이 유실돼 통합검증서버가 라우터로부터 서비스 제공에 필요한 패킷을 정상적으로 수신할 수 없었다”며 “지연이 중첩돼 작업을 정상적으로 수행할 수 없는 상황에 이르게 된 것”이라고 전했다.

해당 내용은 행정안전부의 중간 발표와도 맞닿아 있다. 24일 행정안전부는 통합검증서버의 처리가 지연이 ‘CLOSE_WAIT 적체 현상’ 때문으로 추정한다고 전했다. 통합검증서버는 공무원들이 정부 시스템에 인증(로그인)하기 위해 사용하는 정부공개키기반구조(GPKI) 서버를 뜻한다.

CLOSE_WAIT에 대해 전문가는 “네트워크 엔지니어에게는 기초적인 내용이다. 통상 패킷이 전달될 때는 연결해 달라는(SYN) 패킷과 연결을 확인했다는(ACK) 패킷, 작업을 마친 뒤 연결을 끊어달라고 하는(FIN) 패킷을 보낸 뒤 연결을 종료한다. 이게 정상적인 흐름인데, FIN 패킷이 정상적으로 처리되지 않아 연결이 지속되고 있는 것이 CLOSE_WAIT”이라고 말했다.

유선 전화기를 예로, 통화가 끝났음에도 수화기를 제 자리에 두지 않아 이후 전화기는 계속 통화 중인 상태로 남는 것과 유사하다고도 한다. 이런 현상이 적체됨으로써 전체 시스템에 영향을 미쳤다는 것이다.

해당 발표로 당초 원인으로 지목된 L4 스위치의 경우 문제의 원인이 아님이 드러났다. 장애가 발생하기 하루 전인 16일 L4 장비의 운영체제(OS) 업데이트가 이뤄졌고 L4 장비에서 이상이 발생해 원인으로 지목됐다. 하지만 L4보다 앞단의 L3에서 문제가 발생했기 때문으로 확인됐다.

정보기술(IT) 업계 전문가들은 해당 건과 관련해 “L4 장비가 원인이 아닌 건 일찌감치 알았다. L4 문제였다면 이렇게 오랜 기간 복구가 안 될 수가 없었다”며 “아닌 게 뻔한데 왜 L4를 계속 거론한 건지 모르겠다. 또 포트 불량 같은 경우도 발견이 그렇게 어렵지 않다. 24시간씩이나 걸릴 문제가 아니다”라는 의견을 내비쳤다.

장비 불량으로 결론난 데 대해 “근본적인 해결책이 필요하다”고도 밝혔다. 한 업계 관계자는 “사고 발생 후 해결까지 최소 20시간 이상 걸린 것은 국가정보자원관리원의 낡은 설계 때문”이라고도 지적했다.

그는 “노후화된 장비로 인한 문제라는 말도 들리는데, 장비는 시간이 흐르면 노후화될 수밖에 없다. 그러면 주기적으로 이런 일이 반복된다는 말이 된다”며 “차세대 프로젝트를 통해 주기적으로 낡은 시스템을 현대화해야 하는데, 그렇지 않고 하드웨어만 계속해서 가져다 붙이는 방식이다 보니 여기저기서 문제가 생겨나는 것”이라는 주장이다.

실제 IT 자산에 대한 통합 가시성(옵저버빌리티)을 확보하는 것이 업계 트렌드다. 다이나트레이스, 데이터독, 뉴렐릭, 솔라윈즈 등 기업들의 제품이 이 역할을 한다. 국내에서도 나임네트웍스와 같은 기업이 데이터센터 현대화 과정에서 관련 기술을 제공 중이다.

고기동 차관은 “다시는 유사한 문제로 국민이 불편을 겪지 않도록 어떠한 상황에서도 중단 없는 안정적인 디지털정부를 만들어 나가겠다. 세계적 수준의 디지털정부 명성에 걸맞은 편리하면서도 보다 안정성 높은 서비스를 제공할 수 있도록 최선을 다할 것”이라며 개선을 약속했다. 국가정보자원관리원의 운영방식 또한 전면 재검토한다는 방침이다.

이종현 기자
bell@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널