트위터·넷플릭스도 쓰는 국산 오픈소스 ‘제플린’…인기 비결은?
[디지털데일리 백지영기자] 빅데이터 분석 환경을 제공하는 ‘제플린’은 최근 전세계에서 가장 있기 있는 오픈소스 프로젝트 중 하나로 손꼽힌다.
그런데 놀랍게도 ‘제플린’은 국내 스타트업에서 만든 프로젝트다. 콘텐츠전송네트워크(CDN)로 출발한 NF랩스라는 작은 기업에서 탄생했다.
제플린은 하둡이나 스파크와 같은 빅데이터 분석 플랫폼과 함께 사용할 수 있는 빅데이터 분석 및 시각화 도구다. 지난 5월 아파치 소프트웨어재단의 톱레벨 프로젝트(TLP)로 승격됐다. TLP에 올랐다고 해서 모두 성공적인 오픈소스 소프트웨어(SW)가 되는 것은 아니다. 그동안 국내 몇몇 오픈소스 SW도 TLP에 올랐지만, 제플린은 이중 단연 돋보인다.
제플린은 현재 인기 척도를 보여주는 깃허브 레파지토리(저장소) 별 개수는 10월 12일 기준 2027개로 12위를 기록하고 있으며 컨트리뷰터수는 153명으로 8위다. 스파크나 카산드라, 메소스 등과 같은 유명 프로젝트와 어깨를 나란히 하고 있다.
현재 제플린은 트위터나 넷플릭스와 같은 기업들이 활용하고 있으며, 호튼웍스나 아마존웹서비스(AWS)와 같은 회사들이 자사의 플랫폼 혹은 서비스와 통합해 제공하고 있기도 하다.
이와 관련, 24일부터 개최된 네이버의 기술 공유 컨퍼런스 ‘데뷰(DEVIEW) 2016’에서 만난 이문수 제플린X(구, NF랩스) 창업자<사진>는 ‘제플린’의 인기에 대해 “소스코드 뿐만 아니라 의사결정까지 모두 공개하고, 이를 통해 다양한 기업에 활용될 수 있도록 한 것에 가장 초점을 뒀다”고 말했다.
예를 들어 아파치 프로젝트가 되기 전부터 리뷰나 새 기능 추가 등을 할 때 이 과정을 모두 공개하고 사용자 커뮤니티에서 적극적으로 참여할 수 있게 했다. 이미 회사 구성원들이 원격근무 등으로 일하고 있어 온라인으로 프로젝트를 진행하는 것이 익숙했으며 러시아, 프랑스 출신의 외국인 개발자들과 함께 일하고 있어 자연스럽게 기본 의사소통은 영어로 진행된 점도 있었다.
그는 “소스코드만 공개하는 것이 오픈소스가 아니라, 의사결정 과정까지 모두 공개적으로 하는 것이 맞다고 생각했다”며 “의도적으로 이렇게 하기 위해 많은 노력을 기울였다”고 말했다.
이같은 노력 때문인지 제플린 커뮤니티는 다른 오픈소스 커뮤니티보다 분위기가 자유로운 편이다. 페이스북에 만들어진 한국 커뮤니티의 이름도 ‘제플린과 친구들-빅데이터 비행단’이다.
제플린X의 비즈니스도 여타 오픈소스 기업들과는 다르다. 보통 오픈소스 프로젝트를 운영하는 기업들은 기술지원(서포트)나 교육, 컨설팅을 제공하거나 오픈소스에 추가 기능을 붙인 엔터프라이즈 버전을 출시해 매출을 일으키는 경우가 대부분이다. 그러나 제플린X는 ‘오픈 어답션(Open adoption)’으로 일치감치 방향을 정했다.
즉, 오픈소스에서 직접 수익을 얻기보다는 이를 통한 새로운 서비스를 만드는 것에 초점을 뒀다. 깃허브와 비슷한 개념의 ‘제플린 허브’가 현재 제플린X에서 준비하고 있는 서비스다. 현재 베타 서비스를 진행 중이다. 깃허브는 오픈소스인 ‘깃’ 등을 모아놓고 쉽게 검색, 공유할 수 있는 서비스다. 제플린 허브 역시 제플린이 만든 ‘노트북’이라는 분석 환경을 모아놓는 서비스다. ‘노트북’은 애플 노트처럼 여기에 코드를 작성하고 SQL쿼리를 날려 데이터를 조회하고, 이를 시각화할 수 있는 개념이다.
그는 “기존의 오픈소스 비즈니스 행태를 보면 기능 제한이나 비즈니스를 독점을 하게 되면서 사용자가 감소하고 이는 곧 시장 크기까지 줄게 되는 악순환이 일어나는 것을 종종 목격했다”며 “그러나 다양한 비즈니스를 허용하게 되면, 사용자와 시장 크기가 증가하는 선순환이 가능하다”고 말했다.
이에 따라 호튼웍스나 AWS, 구글과 같은 써드파티 기업들이 제플린 서비스를 할 수 있도록 해 사용을 극대화할 수 있는 전략을 취하고 있다. 현재 제플린은 아마존 EMR이나 MS 애저 인사이트, 구글 데이터 프록 등에 통합돼 제공되며, 호튼웍스의 빅데이터 플랫폼 패키지에 탑재돼 있어 사용이 용이하다.
그는 “처음 오픈소스를 시작할 때부터 표준(스탠다드) SW가 되고 싶다는 생각을 했다”며 “해외 컨퍼런스를 가보면 빅데이터 관련된 수백, 수천개의 제품이 있는데, 엔터프라이즈 환경에서 사용되지 않는 이유를 보면 기능이 아니라 다른 기업들도 사용하고 있는 표준이냐가 중요했다”고 말했다.
그는 이어 “생태계가 풍부하면 SW 기능이 조금 부족해도 훨씬 강력할 것이라는 믿음이 있었다”며 “또한 이것을 통해 서비스를 하고 돈을 버는 기업들이 많아지면 대체하기 힘든 SW가 될 것이라고 생각했다”고 덧붙였다.
오픈소스이기 때문에 어떤 기업이 어느 정도 규모로 사용하는지는 파악하기 힘들지만, 제플린은 현재 트위터에서 약 1000여명이 사용하는 것으로 추정된다. 그는 “올 3월 미국 샌프란시스코 밋업(사용자 모임)때 트위터 사람을 만났는데 당시 300~400명이 사용한다고 했다. 이후 다시 만나 물어볼 때마다 약 200명씩 늘어난다”고 말했다. 이밖에 넷플릭스나 삼성전자, 라인, 현대자동차, 쿠팡, 캐시슬라이드 등의 기업이 사용 중이다.
한편 그는 조만간 미국 실리콘밸리로 건너갈 예정이다. 더 많은 해외 사용자를 만나 제플린의 확산을 꾀할 계획이다. 최근 미국에서 시리즈 A 투자도 받았다.
현재 0.6인 제플린 버전도 완성도를 높일 예정이고, 인력도 현재의 2배로 늘릴 예정이다. 현재 제플린X의 개발 인력은 18명이다. 회사 이름도 현재 아파치 프로젝트명인 ‘제플린’과 연결되는 ‘제플린X’지만, 아파치 재단 정책과 상충돼 사명 변경도 생각하고 있다.
“아직까지 성공했다고 보긴 힘듭니다. 여전히 시행착오를 겪고 있는 중입니다. 이제 시작입니다. 제플린이 더 많이 사용돼 생태계가 더 확장되기를 바랍니다.”
<백지영 기자>jyp@ddaily.co.kr
[IT백과] 생성형AI의 진화 ‘AI 에이전트’, 기존 AI 비서와 뭐가 다를까?
2024-12-21 13:27:59[종합] AI 초격차 확보 공고히 한 오픈AI…12일간 여정 끝엔 ‘쩐의전쟁’ 남았다
2024-12-21 11:15:25오픈AI, o1보다 더 강력한 o3 예고…개발자·연구자 대상 사전 테스트 실시
2024-12-21 08:02:48