DB에서 바로 생성형 AI 사용 가능…오라클, '히트웨이브 생성형 AI' 발표
[디지털데일리 이상일기자] "히트웨이브 생성형 AI는 통합된 데이터베이스 솔루션으로 보안을 제공하며, 애플리케이션의 단순성을 제공한다. 완전 자동화되어 있으며, 생성 AI 애플리케이션 구축 비용을 낮춰준다."-니푼 아가르왈(Nipun Agarwal) 오라클 MySQL 및 히트웨이브 개발 담당 수석 부사장
오라클이 업계 최초로 인-데이터베이스 거대언어모델(LLM)과 자동화된 인-데이터베이스 벡터 저장소를 포함한 히트웨이브 생성형 AI(HeatWave GenAI)를 발표했다. 이는 AI 전문가가 아니어도 데이터 이동이나 추가 비용 없이 생성형 AI 애플리케이션을 구축할 수 있게 해준다.
히트웨이브는 트랜잭션 및 레이크하우스 규모 분석을 위해 자동화 및 통합된 생성형 AI와 머신러닝을 하나의 제품으로 제공하는 유일한 클라우드 서비스다. 이는 오라클 클라우드 인프라스트럭처와 아마존 웹서비스, 마이크로소프트 애저 등 다양한 플랫폼에서 네이티브 방식으로 활용 가능하다.
이번에 발표된 히트웨이브 생성형 AI는 개발자가 단일 SQL 명령어로 비정형 콘텐츠를 위한 벡터 저장소를 생성하고, 외부 거대언어모델(LLM)을 사용, 자연어 검색을 수행할 수 있도록 지원한다. 이 기능은 데이터베이스 내에서 안전하게 유지되며, 히트웨이브의 뛰어난 확장성과 성능을 제공한다는 것이 오라클의 설명이다.
오라클의 설명대로라면 데이터 이동 없이 AI 기능을 바로 적용할 수 있어 시간과 비용을 절약할 수 있게된다. 데이터베이스 내에서 바로 LLM과 벡터 저장소를 사용해 AI 모델을 학습하고 적용할 수 있어 개발자와 기업은 보다 신속하게 AI 솔루션을 개발하고 배포할 수 있게 되는 셈이다.
니푼 아가르왈 오라클 MySQL 및 히트웨이브 개발 담당 수석 부사장은 2일 진행된 온라인 기자간담회를 통해 "히트웨이브는 벡터 스토어 생성 및 사용을 단 한 단계로 간소화해, 기존의 9단계를 크게 줄였다. 또, 임베딩 생성 및 최적화, 삽입 등의 모든 과정이 자동화되어 성능 향상 및 비용 절감 효과를 제공한다"고 강조했다.
그는 또, "새로운 문서 추가 시 벡터 스토어를 재생성할 필요 없이 시스템이 자동으로 업데이트한다. 무엇보다 데이터가 데이터베이스를 떠나지 않아 보안이 강화된다"고 덧붙였다.
오라클 히트웨이브 생성형 AI는 MySQL에 새로운 데이터 타입인 벡터를 도입하고, 벡터 데이터 타입에서 작동하는 거리 함수와 같은 연산자를 추가해 벡터 처리를 효율적으로 수행할 수 있다는 설명이다. 이는 생성형 AI 모델이 필요한 벡터 연산을 빠르게 처리할 수 있음을 의미한다.
오라클 최고기업아키텍트 에드워드 스크리븐(Edward Screven)은 “히트웨이브 생성형 AI는 히트웨이브 기술군에 새롭게 추가되었으며, 이를 통해 개발자는 데이터를 이전하거나 AI 전문성을 확보하지 않고도 풍부한 생성형 AI 애플리케이션을 더욱 빠르게 구축할 수 있게 되었다.”라고 밝혔다.
한편 비정형 데이터(텍스트, 이미지 등)를 효과적으로 처리하고 분석할 수 있는 기능이 강화되면서 자연어 처리, 콘텐츠 생성, 요약 등 다양한 AI 애플리케이션에 유용하게 활용될 수 있을 것으로도 보인다.
성능 및 비용 효율성 면에서 히트웨이브 생성형 AI는 아마존 베드록 대비 벡터 저장소 생성 속도가 23배 빠르며, 비용은 1/4 수준으로 저렴하다는 설명이다. 다양한 벤치마크 테스트 결과, 스노우플레이크, 구글 빅쿼리, 데이터브릭스 대비 속도와 비용 효율성에서 우수한 성능을 보였다는 설명이다.
니푼 아가르왈 부사장은 "히트웨이브 생성형AI는 벡터 처리를 지원하기 위해 MySQL에 새로운 데이터 타입인 벡터를 도입하고, 벡터 데이터 타입에서 작동하는 거리 함수와 같은 연산자를 추가했다"며 "이 구현은 메모리 내에서 처리되기 때문에 매우 효율적이며, 여러 노드에 걸쳐 잘 확장된다. 스노우플레이크 대비 30배, 구글 빅쿼리 대비 18배, 데이터브릭스 대비 15배 빠른 벡터 처리 속도를 자랑한다"고 밝혔다.
그는 또, "히트웨이브는 경쟁 서비스에 비해 가장 빠를 뿐만 아니라 비용 면에서도 가장 저렴하다. 스노우플레이크에 비해 25% 저렴하고 30배 더 나은 성능을 제공하며, 데이터브릭스에 비해 비용은 1/6 수준이면서도 15배 더 빠르다"고 강조했다.
<다음은 기자 간담회 일문일답>
Q: AI 활용에 대한 우려와 데이터 프라이버시 및 데이터 편향 문제는 어떻게 해결하고 있나?
A: AI 모델은 공용 콘텐츠를 학습하여 제작된다. 하지만 기업의 비공개 콘텐츠에 대해 동일한 방식으로 학습을 시키지 않는다. 대신 벡터 도구의 결과를 AI 모델에 입력값으로 전송하는데 이는 AI 모델이 비공개 콘텐츠를 학습하지 않기 때문에 데이터 유출의 위험이 전혀 없음을 의미한다. AI 모델은 기업 콘텐츠의 히스토리를 저장하지 않고 상태를 유지하지 않는다. 따라서 기업 콘텐츠에 대한 보안이나 프라이버시 문제는 완전히 해결된다.
또, AI의 '환각(hallucination)'과 부정확한 결과에 대해 히트웨이브 벡터 처리는 메모리 내에서 이루어지며 모든 데이터를 스캔하므로 결과가 100% 정확하다. 반면, 인덱스를 사용하는 시스템은 데이터 결과가 부정확할 수 있다. 히트웨이브의 벡터 처리 결과는 항상 정확하다. AI 모델이 RAG를 사용하면 공용 콘텐츠가 아닌 RAG를 이용하기 때문에 환각이 크게 줄어들게 된다.
Q: 히트웨이브와 AI의 가격 및 라이선스 설정은 어떻게 되나?
A: 히트웨이브는 완전 관리형 서비스이므로 라이선스가 필요하지 않다. 또한 히트웨이브를 사용하는 고객에게 추가 비용 없이 모든 생성 AI 기능을 제공한다. 히트웨이브는 완전 관리형 서비스로서 추가 비용 없이 모든 처리가 가능하다.
Q: 향후 시장 상황 변화에 따른 추가 비용 발생 가능성 있지 않을지?
A: 우리는 AI를 모든 데이터와 모든 고객에게 민주화하려는 목표를 가지고 있다. 따라서 우리는 이러한 기능이 풍부한 데이터 처리 플랫폼의 필수적인 부분이 될 것이라고 믿는다. 새로운 SQL 기능을 실행하는 데 요금을 부과하지 않는 것처럼, 이러한 AI 기능에도 추가 요금을 부과하지 않는다. 앞으로도 가격을 변경할 계획이 없으며, GA 이후로 가격을 인상하거나 변경한 적이 없다. 오라클의 전략은 통합된 아키텍처를 통해 최대 가치를 제공하는 것이다.
Q: 히트웨이브와 AI 서비스의 수혜 가능성이 높은 산업은 어디라고 보는가?
A: 여러 산업이 혜택을 받을 수 있지만, 특히 비정형 데이터를 처리하는 산업이 큰 수혜를 볼 것이다. 예를 들어, 은행은 PDF 형식의 은행 명세서를 처리할 수 있으며, 보험 회사는 전자화되지 않은 레거시 문서를 처리할 수 있다. 의료 기록 및 기타 문서 처리도 이 서비스의 혜택을 받을 수 있다. 이러한 기능은 다양한 도메인에서 활용될 수 있다.
Q: 히트웨이브 명칭에 대한 리브랜딩 이유는?
A: 오라클은 최근 'MySQL 히트웨이브'의 명칭 변경과 관련해 리브랜딩을 발표했다. 이번 재브랜딩의 목적은 하트웨이브가 MySQL뿐만 아니라 다양한 데이터를 처리할 수 있음을 강조하기 위함이다. 히트웨이브는 데이터 오브젝트 스토리지에서 데이터를 처리할 수 있는 기능을 갖추고 있으며, 이는 기존 MySQL 데이터베이스를 넘어서 다양한 데이터 처리 요구를 충족시킬 수 있음을 의미한다. 따라서 새로운 이름은 이러한 다양한 기능을 포괄적으로 반영하고 있다.
Q: 한국어 지원 계획은?
A: 오라클은 라마3와 미스트랄 언어 모델을 사용하고 있으며, 이 모델들은 한국어를 지원하는 것으로 안다. 하지만 현재 테스트 결과에 따르면, 이러한 모델들이 한국어를 지원하는 정확도는 영어에 비해 다소 낮다. 다만 이러한 모델들이 빠르게 개선되고 있으며, 몇 달 내에 한국어 지원의 품질도 크게 향상될 것이라고 전망하고 있다. 따라서 한국어 지원은 가능하나, 현재는 영어에 비해 다소 품질이 낮을 수 있다는 점을 고려해 줬으면 한다.
Q: DB에서 AI를 바로 할 수 있게 된다는것은 기업의 오라클 DB에 대한 종속을 가속화할 수 있다는 우려도 있다.
A: 오라클의 철학은 고객들에게 다양한 선택권을 제공하는 것이다. 히트웨이브는 AWS, OCI, Azure 등 다양한 클라우드 환경에서 실행될 수 있어 고객들이 원하는 클라우드를 선택할 수 있는 유연성을 제공한다. 물론 오라클의 서비스가 다른 데이터베이스보다 더 혁신적이고, 성능이 뛰어나며, 간단하고, 비용이 저렴하다. 다만 고객들이 다른 서비스로 전환하고자 할 경우에도 다양한 선택지가 제공될 것이다.
임종훈 대표, 한미사이언스 주식 105만주 매각… 상속세 납부 목적, 이면에 불가피한 속사정?
2024-11-15 18:04:20최윤범 고려아연 회장 “이사회 의장직 내려놓겠다”… 삼성∙보잉 사례 참고했나
2024-11-15 17:19:23[DD퇴근길] 네이버 밴드, 美 MAU 600만 돌파…IT서비스업계, 연말인사 포인트는
2024-11-15 16:53:04비트코인이 불지른 가상화폐 ‘불장’… 금융당국, '이상거래' 모니터링 강화
2024-11-15 16:20:20