솔루션

NHN두레이, 개발자 피로도 낮추는 벡엔드 운영 노하우 공유

박세아

NHN두레이 발표장면
NHN두레이 발표장면

[디지털데일리 박세아 기자] NHN두레이가 개발자들의 피로도를 해결할 수 있는 NHN두레이 벡엔드 운영과 개발에 대해 공유하고 나섰다.

NHN두레이는 반복된 장애 위험 패턴은 자동화를 통해 해결할 수 있었다고 강조했다.

24일 NHN두레이가 서울 삼성동 인터컨테넨탈 파르나스에서 열린 'NHN 포워드(FORWARD)' 행사에서 안정적인 백엔드 운영과 개발기법에 대해 발표했다.

이 자리에서 정지범 개발 수석은 두레이 사용자가 많아지면서 발생한 장애와 해결을 위한 접근방법에 대해 상세히 공유했다. 두레이 유저가 많아지고, 애플리케이션 개발자가 운영까지 같이 하는 상황이 오면서 예측 불가능한 장애에 대처해야 하는 상황이 빈번해졌다는 설명이다.

그는 서버의 '자동 재시작'을 통해 이러한 문제의 상당부분을 해결할 수 있었다고 강조했다. 제한이 없는 요청 응답 레코드 수, 해제되지 않는 객체 참조 등 '가부지 콜렉션 데스 스파이럴' 현상이 나타나게 됐고, 이를 자동 재시작을 통해 해결했다.

정 수석은 "반복되는 문제가 생겼을 때, 이를 해결하기 위한 과정을 자동화할 필요가 있었다"라며 "크롭탭 서비스에 해시체크를 할 수 있는 쉘을 돌리고, 프로세스의 얼라이브 상태를 파악해 서버를 로직화했다"라고 언급했다.

또 더 실용적으로 문제를 다루기 위해 쿠버네티스의 라이브니스프로브를 활용했다고 전했다. 이를 통해 일시적인 장애는 익일 확인 후 대응이 가능해졌고, 무중단 서비스를 유지할 수 있었다고 덧붙였다.

박세아
seeall@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널