소프트웨어

코난테크놀로지, 코난 LLM 41B 모델 학습 마쳐

이상일 기자
[ⓒ코난테크놀로지]
[ⓒ코난테크놀로지]

[디지털데일리 이상일기자] 코난테크놀로지(대표 김영섬)의 자체개발 대규모 언어모델 ‘코난 LLM’이 파라미터 410억개 학습을 마쳤다.

15일 기준 코난테크놀로지는 전체 토큰 7000억개로 총 파라미터 410억개(41 Billion) 모델의 학습을 마쳤다고 밝혔다. 한국어 학습토큰은 13.1B 모델 3000억개에서 1000억개 늘어난 4000억개다. 양질의 대규모 데이터로 학습된 41B 모델은 최적화 및 미세조정을 거쳐 고객에게 제공할 예정이다.

코난 LLM은 문서 생성뿐만 아니라 자동 도표 생성, 자동 요약, 참고문서 제공 등을 통해 문서 생산성을 크게 향상시킨다. 나아가 RAG(Retrieval Augmented Generation)에 자사의 강점인 ‘벡터 검색’을 활용함으로써 성능을 더욱 업그레이드했다 .

사용자별 권한 관리에도 신경 썼다. LLM 사용시 부서별, 직책별로 사내 문서와 데이터에 대한 열람 및 접근 권한을 부여하고, 이에 따라 반환되는 정보는 엄격하게 제어함으로써 철저한 접근제어 환경을 마련했다.

고객이 데이터규모나 예산, 용도 등에 따라 13.1B 또는 41B 파운데이션 모델 중 원하는 사양을 선택하면 기업 전용 관리 도구인 '코난 LLM 스튜디오'가 함께 제공된다. 코난 LLM 스튜디오는 고객의 내부 데이터나 문서에 대해 도메인 추가 학습부터 미세 조정에 이르기까지 AI 전문 개발자가 아니더라도 쉽고 빠르게 업무에 적용할 수 있도록 지원한다.

코난 LLM은 온프레미스로 구축되며, 라이선스 및 연간 구독 모델 방식 등 판매방식 다변화를 계획하고 있다. 또한 인공지능 컨택센터(AICC) 비즈니스를 지원하는 자사의 코난 보이스봇(Konan VoiceBot)과 같은 서비스에도 도입되는가 하면 여러 하드웨어에 LLM을 내재화함으로써 새롭게 주목 받는 온디바이스 AI 시장에 뛰어들 채비도 갖추고 있다는 설명이다.

김영섬 코난테크놀로지 대표이사는 “지속적인 모델 고도화로 연내 순차 학습을 마치게 돼 기쁘다”며 “코난 LLM을 도입해 여러 인공지능 비즈니스 수요에 적극적으로 대응하겠다”고 포부를 전했다.

이상일 기자
2401@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널