소프트웨어

[오픈테크넷서밋 2020] OSC, “인스타나로 마이크로서비스 모니터링 해결”

백지영
-현장중계 / '오픈 테크넷 서밋 2020' 버추얼 컨퍼런스

[디지털데일리 백지영기자] 모바일 웹페이지가 3초 내 열리지 않으면 고객은 지체하지 않고 떠난다는 조사가 있다. 하물며 서비스에 장애가 발생하면 막대한 비즈니스 손실로 이어지기 마련이다. 기업 브랜드 이미지 실추에도 영향을 줄 가능성이 높다. 때문에 서비스를 안정적으로 운영하려는 기업에게 IT 인프라 모니터링은 매우 중요하다.

하지만 최근 쿠버네티스와 같은 클라우드 네이티브로의 전환 등 최근 IT업계의 화두이기도 한 애플리케이션 현대화는 IT인프라의 복잡도를 증가시키고 있다. 이같은 클라우드 네이티브는 보통 마이크로서비스 아키텍처(MSA)를 기반으로 하고 있다. MSA는 레고블록처럼 작은 서비스를 여러 개 만들어 놓고 이를 조립하는 방식으로 애플리케이션을 보다 민첩하게 제공할 수 있다.

그렇다보니 하나의 서비스 인듯 해도 여러 서비스가 얽혀있어 문제 발생 시 추적이 쉽지 않다. 다양한 기술이 적용돼 있고 빈번하게 발생하는 변화 때문에 기존 방식으로는 MSA 환경에 대한 관리와 모니터링이 어려운 상황이다.

과학기술정보통신부 주최, 정보통신산업진흥원(NIPA)·디지털데일리 공동 주관으로 진행된 ‘오픈 테크넷 서밋 버추얼 컨퍼런스’ 첫째날 장수영 OSC코리아 이사는 “OSC는 국내에서 MSA 프로젝트를 가장 많이 한 기업”이라며 “클라우드를 도입한 기업이 기존에 사용하던 환경을 확장하면서 MSA 도입 논의가 늘고 있다”고 말했다.
2016년 설립된 OSC코리아는 오픈소스와 클라우드 네이티브를 통해 혁신적인 아키텍처와 기술을 제공하는 기업이다. 장 이사는 “특히 MSA 도입 후의 프로덕션 단계에 대한 모니터링 문의가 많다”며 “이를 해결하기 위해 현재 마이크로서비스 환경을 위한 APM(애플리케이션 성능 모니터링) 솔루션인 ‘인스타나’를 국내에 제공하고 있다”고 말했다. 국내 주요 이커머스 기업에서도 도입해 사용 중이라는 설명이다.

지난 2015년 독일과 미국에서 설립된 인스타나는 마이크로 서비스 아키텍처에서 사용되는 소프트웨어의 성능을 모니터링하고 관리하기 위해 개발됐다. 특히 머신러닝 알고리즘을 사용해 생성된 그래프를 통해 실시간 성능에 대한 3D 시각화를 제공한다. 최근에는 쿠버네티스 모니터링 서비스도 제공하기 시작했다.

드류 플라워스 인스타나 솔루션 아키텍트는 “만약 특정한 시점에 응답속도가 느려진다고 판단이 되면 이와 관련된 매트릭스를 살펴보고 무슨 일이 발생했는지 알 수 있다”고 말했다.

예를 들어, 애플리케이션이 도커 컨테이너에서 운영되고 있다고 했을 때 문제가 생겼다고 치자. 이것이 앱의 문제인지 인프라의 문제인지 바로 파악이 어렵다. 이때 실제 문제는 물리적인 쿠버네티스 노드(하드웨어)에서 생겼을 가능성이 있다.

3차원 매트릭스를 통해 문제가 생긴 시점을 추적하다보면, 도커 런타임 이미지가 수시로 삭제되고 새로운 이미지가 물리적인 호스트에 올라가지만, 겉으로 보이는 이미지는 클러스터에서 운영하는 것과 동일하다. 하지만 실제로 돌고 있는 하드웨어는 전혀 새로운 노드(서버)에서 돌고 있는 것을 알 수 있게 된다.
이때 물리적 스택의 어딘가 물리적인 디스크IO 과부화가 생기면서, 서비스 응답속도를 느리게 하는 것과 연관이 있다는 결론을 내릴 수 있다는 것이 그의 설명이다.

그는 “인스타나는 다이나믹 그래프라는 방식을 통해 원하는 시간으로 돌아가 특정 시간의 설정값과 여러가지 환경 설정을 볼 수 있다”며 “매트릭스는 일종의 시계열 데이터로 애플리케이션 상태를 정의하는데 유용하다”고 말했다.

또, 분산추적을 통해 마이크로서비스와 같은 분산시스템의 행동을 이해할 수 있다. 보통 요청(리퀘스트)이 서비스A로 들어오면, 이것은 서비스B를 호출하고 다시 서비스B는 서비스C를 호출하는 방식으로 작동한다. 서비스 간 유기적으로 얽혀있기 때문에, 분산그래프를 통해 전반적인 그림을 이해하고 추적기능을 통해 에러가 발생한 지점으로 쉽게 찾아갈 수 있다.

그는 “하나의 서비스인 듯 해도 여러 서비스가 모여있기 때문에 서비스를 구조화하고, 자동화된 분석추적을 통해 시스템의 행동을 이해할 수 있도록 도와준다”며 “인스타나는 하나의 에이전트를 통해 쿠버네티스나 리눅스, 윈도VM 등을 비롯한 250개 기술을 감지하고 자동으로 설정해 모니터링이 가능하다”고 강조했다.

이어 그는 “환경설정이 끝나면 거의 실시간에 가까운 가시성을 운영 중인 인프라에 제공하며 인텔리전트 경고(얼럿) 시스템을 통해 바로 문제점을 인식할 수 있게 해준다”며 “만약 21개의 이벤트가 서로 다른 7개의 애플리케이션에 영향을 준다고 했을 때 실제 원인은 SQL 데이터베이스의 문제라고 한다면, 운영자에게는 21개의 얼럿이 아닌 SQL DB에 대한 하나의 알럿만 보낸다”고 말했다.

<백지영 기자>jyp@ddaily.co.kr
백지영
jyp@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널