하드웨어

3400만명의 네이버 사용자 데이터, 어떻게 관리될까

백지영 기자
[IT 전문 블로그 미디어=딜라이트닷넷]
사용자 삽입 이미지

2010 년 7월 기준으로 네이버의 회원수는 총 3400만명, 1일 방문자수 1700만명, 1일 페이지뷰가 10억에 달한다고 합니다. 여기에 한게임의 3000만명 회원, 최고 동시 접속수는 29만명에 달하는 등 NHN은 강력한 IT인프라가 지원돼야 하는 서비스 구조를 갖고 있습니다.

최근 블로그와 멀티미디어 저장 파일 등의 급증에 따른 데이터의 폭발적 증가로 NHN의 누적 파일 스토리지 총량이 매년 2~2.5배 늘어나고 있고, 다양한 신규 서비스 오픈 및 기존 서비스의 증설 이슈로 서버 수요 역시 지속적으로 증가하고 있다고 합니다.

특히 네이버는 최근 N드라이브라는 개인화 클라우드 서비스 등을 출시하면서 이같은 인프라 증설 수요가 계속해서 급증하고 있는 편입니다. N드라이브는 한 계정당 10GB까지 파일을 온라인상에 저장할 수 있습니다.

3400만명의 회원 모두가 이를 이용한다고 생각했을 때, 이를 저장할 스토리지의 수요는 가히 상상할 수 없을 정도로 커집니다.

이러한 상황에서 NHN은 과연 IT인프
라를 어떻게 구성하고 있을까요.

지난 27일, 한국IDG가 주최한 ‘IT Infrastructure 2010 : Virtualization in Action’ 컨퍼런스에서는 마침 NHN 관계자가 연사로 등장해 자체적으로 진행한 분산 스토리지 및 서버 가상화를 통한 인프라 혁신 사례를 발표하는 시간을 가졌습니다.

이날 NHN 저장시스템개발팀 김태웅 부장은 자체 개발한 분산파일시스템(OwFS)과 서버 가상화 솔루션(CoVI) 및 이를 통한 비용 절감 효과에 대해 발표했는데요.

NHN은 VM웨어나 MS 하이퍼-V 등 상용 솔루션을 도입하는 대신, 자체적으로 플랫폼 및 솔루션을 개발하며 기술 내재화 및 비용절감의 효과를 누렸다고 밝혔습니다(물론 지난해 서버 통합 과정에서 파일럿 프로젝트를 진행하며 VM웨어를 일부 도입한 부분이 있지만, 전체 비중에서 1%에도 못 미친다고 합니다).

이미 아마존이나 구글, 페이스북 등 글로
벌 업체들은 저가(commodity) 서버에 SATA 디스크를 장착한 형태의 스토리지 팜을 형성하고 자체적인 데이터 분산 및 복제 기술 개발을 통해 급증하는 데이터 처리에 대응하고 있습니다.

이중 아마존의 경우는 클라우드 스토리지 서비스인 S3에 약  1600억개의 파일 및 65페타바이트(PB) 이상의 용량이 저장돼 있을 것으로 추정되고 있습니다.

또한 CPU 성능이 계속 발전하고 올초 인텔에서 네할렘 프로세서를 출시하면서 서버 통합 수요와는 맞아 떨어졌지만, 여전히 저사양 서버의 수요가 지속되다보니 낮은 통합 효과가 있었다고 판단됐다고 합니다.

사용자 삽입 이미지

이에 따라 NHN은 OwFS라는 분산파일시스템<개요도 참조>과 오픈소스 젠 기반의 CoVI라는 가상화 솔루션을 개발하게 됐다고 했습니다.

김 부장은 “특히 지난해부터 비용절감 요구가 증가하면서 서버 가상화를 어떻게 구현할지에 대해 고민이 많았다”고 말했습니다.

먼저 NHN이 자체개발한 분산파일시스템인 OwFS(Owner-based File System)의 경우,  파일의 갯수가 많은 경우 효율이 좋은 것이 특징입니다.

용량이 늘어나도 단일 저장공간으로 가상화되고 분산 저장을 통한 확장성은 물론 복제본에 의한 고가용성이 보장되는 것이지요.

여기서 Owner라는 것은 분산과 복제의 기본 단위인 파일 저장소를 뜻합니다.

이밖에도 고장에 대한 자동복구 및 용량 자동 재분배 등의 운영 편의성에 따라 현재 이는 40여개 이상의 네이버 및 한게임 서비스에 적용되고 있다고 합니다.

이같은 분산파일시스템(OwFS) 적용으로 NHN은 스토리지 운영상의 다양한 장점을 가지면서 총소유비용(TCO)을 절감하게 됐다는 설명입니다.

이는 코모디티(저렴한) 서버의 내장 SATA 디스크 채용 및 표준화된 서버와 네트워크 스위치 구성 관리를 간소화했기 때문입니다.

복제본이 여러개 있기 때문에 굳이 스위치를 이중화하지 않아도 불필요한 비용을 절감할 수 있었다고 하네요.

김 부장에 따르면 OwFS 적용을 통
해 NHN은 기존 네트워크 스토리지를 사용하는 것에 비해 테라바이트(TB)당 약 40~60% 이상의 비용절감이 가능했다고 했습니다.

사용자 삽입 이미지

여기에 공유 파일 스토리지로만 사용되던 OwFS의 기능을 확장시킨 것이 ViSTO(Virtual iSCSI Storage over OwFS)입니다. 이는 OwFS 상에서 iSCSI 표준을 준수하는 블록제장장치를 제공하게 됩니다.

이는 아마존의 EBS(엘라스틱 블록 서비스)와 유사한 클라우드 서비스로, 서버 가상화 환경에서 가상머신(VM)의 운영체제(OS) 파티션이 가능하도록 하는 것이지요.

가상 볼륨 공간을 일정크기의 청크로 나눠서 OwFS 파일로 저장하고, 3중화된 복제본을 가지게 되기 때문에 VM이 고장나더라도 쉽게 페일 오버가 가능하게 됩니다.

이는 역시 NHN이 오픈소스 기반 젠으로 자체 개발한 서버 가상화 솔루션인 COVI(Common Virtual Infrastructure)랑 연결됩니다.

CoVI는 가상머신(VM) 성능의 정량화 및 장애 자동복구기능, OwFS와의 연동, VM 공급/반납 및 레거시 프레임워크와도 연동할 수 있습니다.

김 부장은 “서버 가상화 프로젝트
를 진행하면서 사실 가장 크게 고민한 것이 오픈소스를 쓸 것이냐 상용 솔루션을 사용할 것이냐였는데, 오픈소스는 비용절감에서 용이했지만 기술적인 측면과 레퍼런스 측면에서 고민이 컸다”고 했습니다.

NHN은 이러한 리스크가 있긴 하지만 내부 인력을 통해 오픈소스를 테스트 및 검증하기로 결정했고, 만약 이것이 성공한다면 원천기술 확보는 물론 이를 통해 IT인프라 경쟁력을 높일 수 있을 것으로 내다본 것이지요.

그러나 매출과 직결된 부문에는 적용하기가 쉽지 않았기 때문에, 먼저 리스크가 낮은 부분부터 가상화를 적용하기 시작했다고 합니다.

김 부장은 “어차피 VM웨어 등의 상용 솔루션을 도입한다고 해도 내부 IT 운용 인프라와 연동하기 위해 또 다시 개발을 해야 했기 때문에 차라리 자체적으로 개발하는 것이 낫다고 판단했다”고 설명했습니다.

앞에서도 언급했듯이 NHN은 ▲저사양 서버 라인업 대체 및 클라우드 컴퓨팅 기반 확보 ▲오픈소스 기반의 VM 기술 자립도 확보(CoVI) ▲가상머신(VM) 활용 가능성 및 기대 효과 검증 등을 실현하고자 했고, 이는 어느 정도 안정화 단계에 접어든 것으로 보입니
다.

이제 이를 확대시켜 나가는 과제가 남은 것으로 보이는데요.

김태웅 부장에 따르면 현재 NHN의 서버 가상화는 약 6% 정도 진행된 상태입니다. NHN에 약 2만여대 이상의 x86 서버가 있다고 봤을때 약 1500~2000대 정도 규모로 추정됩니다.

NHN은 올 연말까지 서버 가상화 비중을 10% 이상 적용시킨다는 방침입니다.

사용자 삽입 이미지

4년 후인 2012년 경 서버 가상화 비중이 40%
까지 높아졌을 때 NHN은 약 90억원의 절감 효과가 있을 것으로 전망하고 있습니다.<관련 표 참고>

“현재까지 가상화 프로젝트를 진행한 결과, 오픈소스 하이퍼바이저도 상당한 신뢰성이 있다고 판단됩니다. 이는 인프라 관리 플랫폼으로써 가치가 높고, 또한 자체 개발한 결과 대규모 환경의 파일스토리지 기술은 물론 IaaS(서비스로써의 인프라) 기반 클라우드 컴퓨팅 환경 기반 기술 내재화를 확보하게 됐습니다. 비용절감 효과도 물론 크다고 보여집니다.”

다만 NHN도 이러한 사용자들의 데이터가 10년, 20년 쌓였을 때, 향후 이를 어떻게 저장해야할지 고민이라고 했습니다.

페이스북의 경우도 연간 데이터가 500테라바이트(TB)씩 늘어나고 있다고 하는데, 앞으로 계속해서 데이터가 쌓여갈 경우, 이를 비용 효율적으로 어떻게 저장할 것이냐에 대한 것이지요. 언제든지 서비스를 제공할 수 있으면서(온라인) 장기적으로 이를 어떻게 싸게 보관할 것이냐에 대한 고민이 늘어나고 있다고 했습니다.


[백지영기자 블로그=데이터센터 트랜스포머]

백지영 기자
jyp@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널