e비즈*솔루션

[오픈테크넷서밋2023] 래블업, “LLM 전성시대, 누구나 만들 수 있다”

백지영 기자

신정규 래블업 대표가 14일 서울 양재동 엘타워에서 열린 ‘오픈 테크넷 서밋 2023’에서 ‘오픈소스 거대 언어 모델의 오케스트레이션 및 운영’을 주제로 발표를 진행하고 있다. 오픈 테크넷 서밋 2023은 과학기술정보통신부가 주최하고 정보통신산업진흥원과 디지털데일리가 공동 주관하는 컨퍼런스다. [ⓒ디지털데일리]

[디지털데일리 백지영 기자] 2023년은 거대 언어모델(LLM)의 대중화가 시작된 해로 기록될 전망이다. 초거대 인공지능(AI) 붐을 일으킨 챗GPT 덕분이다. 오픈AI가 발표한 챗GPT 이후, LLM 시장은 초격전지로 떠올랐다.

실제 지난 5~7월 3개월 간 1만개의 언어모델이 등장하는 등 기술적 난이도가 낮아졌다는 평가다. 올해만 해도 구글의 ‘팜2’부터 아부다비의 막대한 자금력으로 2달만에 만들어진 ‘팔콘LLM’, 앤트로픽의 ‘클로드 버전2’, 메타의 ‘라마2’ 등이 연달아 발표됐다.

특히 공개 데이터셋으로 만들어져 오픈소스로 제공 중인 ‘라마’는 사전모델훈련으로 기반 모델을 만들기 어려워하는 개인과 기업, 연구소에게 각광을 받고 있다. 또, 의료기관이나 보안이 요구되는 기업 등에 의해 온프레미스 LLM도 만들어지고 있는 상황이다.

래블업 신정규 대표는 14일 과학기술정보통신부와 정보통신산업진흥원(NIPA), 디지털데일리가개최한 ‘오픈테크넷 서밋 2023’에서 ‘오픈소스 거대 언어모델의 오케스트레이션 및 운영’라는 주제 발표를 통해 “거대 언어모델을 대형 클라우드 회사가 독점하고 이를 API 형태로 불러 사용했던 것에서 이제는 기반모델이 모두에게 주어지면서 올해 초와 지금의 상황이 많이 바뀌었다”며 LLM 대전성시대가 도래했다고 진단했다.

이에 따라 10여개의 사전훈련모델은 100여개 응용모델, 이는 다시 미세조정을 거쳐 1만여개 파인튜닝 모델로 늘어났다. 신 대표는 “보통 응용모델개발엔 약 2주, 파인튜닝은 하루면 가능할 정도로 기술적 난이도가 없어졌다”고 설명했다.

그러면서 점차 내부에서만 사용하는 온프레미스 LLM이 사내검색시스템이나 코드 베이스 기반의 프로그래밍 어시스턴트로 활용되는 추세다.

그는 “온프레미스 LLM은 아직 실용화할 타이밍은 아니”라며 “그러다보니 최근 sLLM(small LLM)과 같은 요상한 이름도 등장하고 있으나, 적정 모델 크기를 찾는 노력은 계속되고 있다”고 말했다.

래블업 역시 최근 자사의 AI 연구·개발 및 서비스 플랫폼 소프트웨어인 ‘백엔드닷AI’에서 LLM 통합 개발·서비스를 공개했다. 보안이 요구되는 기업이나 기관, 연구소, 조직에서 보다 쉽게 LLM 기반의 다양한 서비스를 개발하고 사내에 통합하는 과정을 단순화한 것이 특징이다.

실제 래블업은 지난달 열린 ‘파이콘 코리아’에서 메타의 라마2 모델을 포함한 다양한 오픈소스 LLM을 백엔드닷AI의 자동화 시스템인 패스트트랙으로 한국어에 맞춰 미세조정하고 서비스하는 데모를 선보여 참석자들의 각광을 받은 바 있다.

래블업이 보유한 엔비디아 H100 클라우드 팜에서 라마2를 12시간 만에 파인튜닝한 모델로 즉석에서 서비스로 만든 챗봇을 전용 UI를 통해 서비스한 것.

현재 백엔드닷AI는 ▲GPU 클러스터 활용도 극대화 ▲직관적인 사용자 경험 및 관리 ▲저비용/저지연 AI 모델 및 서비스 기술 ▲다양한 AI 반도체 지원 등을 제공한다. 이번 LLM 통합기능은 기존 온프레미스 고객사에게만 제공된다.

신 대표는 “모든 조직이 백엔드닷AI 를 사용해 필요에 맞는 고유한 거대 언어 모델을 쉽게 파인 튜닝하고 운영할 수 있다”며 “궁극적으로 앞으로는 모든 사람이 파인튜닝 및 커스텀 훈련 기반 특화모델을 통해 자신만의 모델을 갖는 세상이 될 것”이라며 전망했다.

백지영 기자
jyp@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널