인터넷

[네이버 어벤저스] SSR에서 개발자 시야를 넓혀보세요

이대호
올해 20주년을 맞은 네이버가 상당 폭의 변화를 맞았다. 하루 3000만명이 드나드는 모바일 메인 개편은 여러 실험 끝에 적용이 이뤄졌고 동영상 중심의 콘텐츠 제작과 편집, 소비에 이르기까지 끊이지 않는 사용자경험을 위한 체질 개선에도 나선다. 이용자가 보는 앞단의 변화가 이 정도라면 개발 뒷단에선 보다 과감하고 치열한 고민이 필요하다.

<디지털데일리>는 네이버를 움직이는 기술 리더들을 마블 캐릭터에 빗대 ‘네이버 어벤저스’라 이름 붙이고 이들의 연속 인터뷰를 통해 국내 최대 인터넷 기업의 속 깊은 고민과 핵심 경쟁력의 원천을 짚어보고자 한다. ‘빅데이터 & AI 플랫폼’과 ‘검색엔진’, ‘엣지서버’에 이은 네 번째 네이버 어벤저스 팀은 ‘SRE’ 엔지니어들이다. <편집자 주>


[디지털데일리 이대호기자] 네이버는 국내 최대 빅데이터를 가진 기업이다. 그러나 데이터만 갖고 있어선 이렇다 할 효용이 없다. 수집한 데이터를 분석, 가공해야 가치를 지닐 수 있다. 이런 의미에서 네이버 SSR<이전 기사 참조>은 회사가 잘 돌아가게 만드는 핵심 조직이라고 할 수 있다.

그렇다면 SSR(Service System Reliability) 개발자들은 구체적으로 어떤 일을 할까. 네이버 검색 시스템과 같은 대규모 서버군의 데이터를 효율적으로 한눈에 볼 수 있도록 만든다. 이 과정에서 사건·사고를 분석하고 시스템 취약점을 파악해 미래를 대비하는 역할도 맡고 있다. 자동화, 이중화, 사용성 개선 등의 작업을 진행한다.

이를 위해선 별도 도구를 개발하고 관리하는 것이 필수다. 오픈소스를 활용하는 것은 한계가 있기 때문에 자체 기술로 ‘데이터 수집 플랫폼의 혁신’을 목표한다는 게 네이버 SSR 조직을 이끄는 김재헌 리더의 설명이다. 네이버의 글로벌 진출과 맞물려 있는 화두이기도 하다.

사진 왼쪽부터 네이버 SSR 개발을 맡은 강민철 엔지니어, 김재헌 리더, 손주식 엔지니어
사진 왼쪽부터 네이버 SSR 개발을 맡은 강민철 엔지니어, 김재헌 리더, 손주식 엔지니어
◆“SRE 분야가 널리 알려졌으면”=
세계 유수의 IT기업들이 네이버 SSR과 같은 조직을 갖췄지만 정보 공유에 인색한 반면, 네이버는 데뷰(DEVIEW) 컨퍼런스나 국외 학회 발표에 나서곤 한다. SSR 조직에 몸담은 SRE(Site Reliability Engineering) 개발자를 확보하기 위해서다. 김 리더는 그만큼 SRE 분야를 널리 알리고 싶은 속내를 보였다.

김 리더는 “미국과 유럽에서 열리는 학회나 컨퍼런스에 가면 한국 기업의 참석이 없다”고 현황을 전한 뒤 “컨퍼런스에 가면 좋은 문화를 받아들일 수 있어서 도움이 많이 된다. 올해가 될지 내년이 될지 모르겠지만 스폰싱(개최 지원)도 하려고 한다”고 말했다.

그는 네이버 SSR 개발자들이 “스타트업처럼 일한다”고도 언급했다. 예상치 못한 이벤트가 발생할 수 있다는 것이다. 오늘과 내일 그리고 모레의 업무가 다른 것이 SSR 업무의 특성이다. 김 리더는 “답을 규정하면서 찾아가야 하기에 매일이 새롭다”며 “어떤 날은 퇴근할 때까지 십수건의 이벤트가 발생할 수 있고 어떤 날은 없기도 하다”고 전했다.

◆거시적 관점서 생태계 조망…사회·정치 공부가 업무에 보탬=손주식 엔지니어는 SSR 조직에 들어온 이후 좋았던 점으로 “거시적 관점에서 전체 생태계를 보고 시야를 넓혔다“고 밝혔다. 그는 여타 개발자들이 이 같은 경험을 공유하길 원했다.

손 엔지니어는 “전통적인 개발자는 마이크로한(미시적인) 영역을 공부하는데, 지금 하는 일은 정반대”라며 “매크로(거시적인) 분석이라고 얘기할 수 있다”고 힘줘 말했다. 이어서 “큰 시스템이 전체 생태계가 어떻게 움직이는지 보면서 시야가 넓어지는 느낌이다. 좋은 경험이 됐다”고 덧붙였다.

김 리더는 SRE 업무와 관련해 “기술적 분석으로 시작하지만 답이 안 나올 때가 있다”며 “원인은 사회적 정치적 사건이 있는데 이것을 알아야 앞뒤 추론을 할 수 있다”고 말했다. 그는 “모든 (사회·정치적) 사건을 공부한다고 보면 된다”며 개발 외적인 업무를 설명했다.

현재 네이버 SSR은 300개 이상의 문제해결 분석 리포트를 누적·확보하고 있다. 김 리더는 “웬만한 케이스는 기존 리포트에서 소화 가능할 정도로 라이브러리를 확보했다”며 업무 현황을 전했다.

◆기본적 개발 역량만 있으면 OK=현재 네이버 SSR 조직 인원은 10여명. 기존 서비스의 덩치도 커지고 크고 작은 서비스가 계속 생겨나는 까닭에 지금의 인원으론 네이버의 SRE 분야를 감당하기가 쉽지 않은 상황이다.

김 리더는 3년 전 우버와 관련한 기사를 보는 중에 SRE 분야에 150여명이 몸담고 있다는 정보를 파악했다. 그만큼 우버가 SRE를 중요한 업무로 보고 있다는 뜻이다.

김 리더는 인터뷰에 나선 주된 이유로 ‘개발자 구인’을 손꼽았다. 그는 다음과 같이 구인 의지를 보였다.

“분야 자체가 워낙 독특하고 또 SRE라고 불리는 조직들이 회사마다 하는 역할이 다른 것으로 알고 있습니다. 그래서 저희는 SRE 자체에 익숙한 엔지니어보다는 기본적인 개발 역량을 가진 다양한 분야의 엔지니어들이 함께 어우러지기를 희망하고 있습니다. 새롭게 채용 공고를 준비하고 있으니 많은 분들의 지원 부탁드리겠습니다. 또 저희와 같은 고민을 하는 엔지니어들이 모이는 SREcon(미국, 아시아, 유럽에서 연 1회 개최)이라는 컨퍼런스가 있는데요. 작년부터 2년째 참가를 하고 있는데 아직까지 한국 IT 기업에서 오신 엔지니어들을 만나 뵙지 못했습니다. 이런 컨퍼런스에서 동종 업계분들을 많이 만나 뵐 수 있으면 좋겠습니다.”

<이대호 기자>ldhdd@ddaily.co.kr
이대호
webmaster@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널