클라우드 인프라

[오라클클라우드월드2023] "생성형 AI 도입 원하는 기업에 특화", 오라클 OCI 생성형 AI 서비스 선보여

라스베이거스(미국)=이상일 기자
오라클클라우드월드 2023 행사에서 오라클의 AI전략이 발표됐다[ⓒ오라클]
오라클클라우드월드 2023 행사에서 오라클의 AI전략이 발표됐다[ⓒ오라클]

[디지털데일리 이상일기자] 오라클이 '오라클 클라우드 인프라스트럭처 생성형 AI(Oracle Cloud Infrastructure Generative AI)' 서비스를 제한적으로 출시한다고 발표했다.

새로운 생성형 AI 서비스는 대규모 언어 모델(LLM)을 지원해 기업의 엔드투엔드 비즈니스 프로세스 자동화, 의사결정 과정 개선, 고객 경험 향상 및 안전한 데이터 보호를 지원할 예정이다.

9월 18~21일(현지시간) 미국 라스베이거스 베네치안 컨벤션 센터에서 개최된 오라클의 연례 컨퍼런스인 ‘오라클 클라우드월드 2023’ 행사에서 카란 바타 오라클 수석 부사장은 “생성형 AI의 베타버전이 코히어와 파트너십을 통해 제공이 된다. 고객은 코히어 모델을 활용해 직접 계정에 접근해 배포하게 될 것이다. 기업은 자신들만의 데이터를 갖고 AI 재훈련이 가능해진 셈”이라고 전했다.

카란 바타 오라클 수석 부사장
카란 바타 오라클 수석 부사장

기업용 AI 플랫폼 제공 업체인 코히어(Cohere)와의 협업을 통해 OCI 상에 구축된 OCI 생성형 AI 서비스는 사용자가 가용한 API를 통해 거대언어모델(LLM)을 자체 애플리케이션에 통합할 수 있도록 지원하는 관리형 서비스다.

정식 출시 이후 해당 서비스와 코히어 모델은 사전 학습된 LLM과 독점 비즈니스 데이터를 결합해 더 높은 정확도로 응답을 제공하는 생성형 AI 기술인 검색 증강 생성(retrieval augmented generation; RAG)을 제공하는 오라클 데이터베이스 23c(Oracle Database 23c)의 기능인 AI 벡터 검색(AI Vector Search)과 원활하게 작동할 예정이다.

또한, OCI 생성형 AI 서비스는 오라클 퓨전 클라우드 애플리케이션 제품군(Oracle Fusion Cloud Applications Suite), 오라클 넷스위트(Oracle NetSuite) 등 오라클의 서비스형 소프트웨어(SaaS) 애플리케이션 제품군과 오라클 서너(Oracle Cerner) 등 산업용 애플리케이션 전반에 내장될 생성형 AI 기능의 기반이 될 예정이다.

그 하나의 예로 오라클은 오라클 애널리틱스 클라우드의 새로운 AI 기반 기능을 선보였다. 오라클 OCI 생성형 AI 서비스를 활용하는 이 새로운 기능은 분석 셀프서비스 사용자가 데이터 과학자나 IT 팀을 기다릴 필요 없이 보다 신속하고 효율적으로 정교한 분석을 수행하고 더 나은 비즈니스 의사결정을 내릴 수 있도록 지원한다.

T.K. 아난드 오라클 분석 부문 총괄 부사장은 “오라클은 오라클 애널리틱스 클라우드에 새로운 AI 기반 분석과 생성적 AI 상호 작용을 도입해 조직 전반의 팀이 다양한 소스 및 유형의 데이터로 더 쉽게 작업할 수 있도록 지원한다”고 밝혔다.

오라클 클레이 마고요크 OCI 총괄 부사장은 “오라클과 코히어의 파트너십을 통해 고객은 오라클의 솔루션이 그들의 가장 엄격한 데이터 보안 및 개인정보 보호 요구 사항을 충족시킨다는 확신을 갖고 생성형 AI를 기술 스택에 손쉽고 안전한 방식으로 적용할 수 있게 될 것이다. 기업 조직은 또한 자체 데이터를 사용해 이와 같은 모델을 개선할 수 있으며, 모델들은 각 조직의 내부 운영 방식을 그 누구보다 긴밀히 파악할 수 있게 될 것이다”라고 말했다.

저렴한 비용과 더불어 안전하고 빠른 AI 인프라스트럭처를 제공하는 OCI는 고객이 코히어의 모델을 기업용 사용 사례에 특화된 관리형 서비스로써 활용할 수 있게 지원할 예정이다.

OCI 생성형 AI 서비스를 사용하는 고객은 오라클의 AI 수퍼클러스터 아키텍처 기반 전용 인프라스트럭처에서 워크로드를 실행할 수 있으며, 이를 통해 고객은 자체 데이터로 모델을 미세 조정하거나 자체 커스텀 모델을 배포하는 데에 필요한 비용 및 처리량 요구 사항을 직접 관리할 수 있게 된다.

코히어의 마틴 콘(Martin Kon) 회장 겸 최고운영책임자(COO)는 “코히어는 오라클과 긴밀히 협력하고 있으며, 데이터 보안과 개인정보 보호를 우선으로 하는 접근 방식을 취함으로써 기업들이 AI를 활용해 비즈니스를 한층 강화할 수 있도록 지원하고 있다.”라고 설명했다.

오라클은 이를 위해 엔비디아 H100 텐서 코어 GPU, 엔비디아 L40S GPU 및 암페어원 CPU 기반의 새로운 오라클 클라우드 인프라스트럭처(OCI) 컴퓨트 인스턴스를 곧 출시할 예정이라고도 발표했다.

새로운 OCI 컴퓨팅 인스턴스는 트레이닝, 미세 조정, AI 모델 추론부터 클라우드 네이티브 애플리케이션 및 비디오 트랜스코딩 애플리케이션 실행에 이르기까지 다양한 워크로드를 클라우드에서 더 쉽게 실행할 수 있도록 설계되었으며, 향상된 가성비를 제공한다는 설명이다.

엔비디아 H100 텐서 코어 GPU를 사용하는 조직은 이전 세대의 엔비디아 A100 텐서 코어 GPU를 사용할 때와 비교했을 때 AI 추론 사용 사례의 성능이 30배, AI 모델 트레이닝 성능이 4배 향상되는 것을 확인했다는 것이 오라클 측의 주장이다.

크리스 메이 엔비디아 클라우드 플랫폼 엔지니어링 수석(사진 왼쪽)이 엔비디아의 클라우드를 위한 엔비디아의 기술을 설명하고 있다.
크리스 메이 엔비디아 클라우드 플랫폼 엔지니어링 수석(사진 왼쪽)이 엔비디아의 클라우드를 위한 엔비디아의 기술을 설명하고 있다.

AI 모델 트레이닝과 같은 고강도 컴퓨팅 워크로드를 실행하는 고객은 OCI 슈퍼클러스터를 통해 고성능, 초저지연 클러스터 네트워크를 통해 수만 대의 엔비디아 H100 GPU를 연결할 수 있다. 이러한 인스턴스는 올해 말 오라클 클라우드 런던 리전 및 오라클 클라우드 시카고 리전에서 일반적으로 제공될 예정이며, 다른 리전에서도 곧 제공될 예정이다.

OCI 컴퓨트 베어 메탈 인스턴스는 엔비디아 L40S GPU로 구동된다. 고객에게 AI 추론 또는 중소규모 AI 모델 트레이닝과 같은 워크로드에 대한 대안 옵션을 제공하게 되며. 이 인스턴스는 이전 세대의 엔비디아 A100 GPU에 비해 생성형 AI 워크로드에서 최대 20%, 미세 조정 모델에서 최대 70%의 성능 향상을 제공하는 것으로 테스트되었다고 설명했다.

오라클 클라우드 인프라스트럭처의 소프트웨어 개발 부문 수석 부사장 도널드 루(Donald Lu)는 "OCI에서 엔비디아 및 암페어 컴퓨팅의 프로세서에 대한 액세스를 제공함으로써, 우리는 고객이 클라우드 인프라에서 범용 워크로드부터 고성능 AI 프로젝트에 이르기까지 모든 것을 구동하는 데 필요한 성능, 효율성 및 유연성을 제공할 수 있다."라고 말했다.

엔비디아의 하이퍼스케일 및 고성능 컴퓨팅 담당 부사장인 이안 벅은 "엔비디아와 오라클의 협력은 오라클 클라우드 인프라에서 최첨단 GPU에 대한 액세스를 대중화하는 데 기여하고 있다."라며 "OCI에 탑재된 엔비디아 H100 및 L40S GPU는 모든 업종의 고객에게 전례 없는 성능, 확장성 및 보안을 갖춘 AI 혁신을 실현할 것"이라고 설명했다.

코히어(Cohere) 마틴 콘 회장은 "곧 출시될 엔비디아 GPU 기반의 OCI 컴퓨트 인스턴스는 업계를 선도하는 차세대 코히어 엔터프라이즈 AI 모델을 트레이닝하고 서비스하는 데 필요한 성능을 제공할 것이다."라고 말했다.

라스베이거스(미국)=이상일 기자
2401@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널