"파라미터 크기만 보던 AI 시대 저문다…양보다 질로 승부"
[디지털데일리 김보민기자] 내년에도 인공지능(AI) 기술에 대한 관심이 뜨거워질 전망인 가운데, 데이터 양보다 질로 승부하는 시대가 올 것이라는 예측이 나왔다.
임진국 정보통신기획평가원(IITP) 단장은 14일 서울 양재동 엘타워에서 열린 '정보통신기술(ICT) 산업전망 콘퍼런스' 무대에 올라 내년도 시장을 관통할 10대 이슈를 인프라, 핵심 엔진, 서비스, 지속가능성 등 네 가지 영역으로 나눠 소개했다.
핵심 엔진에는 ▲AI(AI 에이전트의 시대로) ▲AI 반도체(초격차 전장의 전면 확장) ▲AI 데이터(빅데이터보다 파인데이터) ▲양자기술(퀀텀, 과학에서 산업으로) 등 네 가지 이슈가 포함됐다. 인프라 영역에는 ▲네트워크(지능화가 주도하는 차세대 네트워크) ▲사이버보안(AI 창, AI 방패)이, 서비스 영역에는 ▲미디어(미디어·콘텐츠의 창의 혁명, AI 영상과 공간 컴퓨팅) ▲휴머노이드(디지털과 현실 세계 연결의 중심, SDR) ▲AI 사이언티스트(빨라지는 과학 혁명)가 최대 이슈로 꼽혔다. 지속가능성 영역에는 ▲안전·안보(디지털 미래의 힘, AI 안전과 주권)이 담겼다.
임 단장은 AI 데이터 이슈로 데이터 크기에 대한 경쟁이 저물 것으로 내다봤다. 그는 "그간 양적 진화가 계속됐지만, 최근에는 파라미터 크기가 성능 향상을 담보하지 않는다는 결과가 나오고 있다"며 "막대한 데이터 활용에 따라 학습 데이터 고갈이 시작될 전망"이라고 말했다.
파라미터는 '매개변수'를 뜻하는 말로, 단위가 높을수록 더 좋은 AI 언어모델을 만들 수 있다는 주장이 제기돼 왔다. 그러나 이제 시장에서 '우수하다'고 평가되는 모델 수가 많은 데다, 언어를 넘어 영상·이미지까지 학습하는 멀티모달이 대세로 떠오르면서 파라미터 경쟁이 무의미해졌다는 평가가 두드러지고 있다.
임 단장은 "AI 시장은 데이터를 기반으로 성장한다"며 "(학습할 수 있는) 데이터가 고갈된다고 하면 정체는 불가피해질 것"이라고 강조했다. 이어 "이러한 문제를 극복하기 위해 AI가 만들어내는 합성데이터 시장이 주목을 받았지만, 무분별한 환각이나 편향이 극복되지 않은 데이터는 'AI 데이터 붕괴' 우려를 가중시킨다"고 내다봤다.
결국 크기보다는 질에 초점을 둔 AI 접근법이 필요하다는 취지다. 임 단장은 "양질의 데이터가 필요한 시기"라며 "2025년, 다시 한번 AI가 시작한 때로 돌아가 고품질에 집중할 필요가 있다"고 제언했다. 그러면서 "막대한 데이터를 가지고 있는 플랫폼이나 콘텐츠 기업은 저작권을 강화하며 자신의 데이터를 지키려고 할 테고, 신흥기업은 콘텐츠 기업과 전략적 제휴를 높여가며 AI 성능 경쟁 이전에 데이터 확보 경쟁을 본격화할 것"이라고 예측했다.
때문에 일반인이 아닌 전문가가 참여하는 데이터 라벨링 및 성능 검증 또한 늘어날 것으로 전망했다. 임 단장은 "데이터 서비스업 또한 수요자 맞춤형으로 데이터셋을 제공하기 위한 움직임이 활발해질 것"이라고 말했다.
한편 임 단장은 학습 방법에도 변화가 시작될 수 있다고 밝혔다. 그는 "사전 및 사후 학습에 추론학습이 더해지고 있다"며 "추론 훈련이란 사람처럼 단계적, 그리고 반복적으로 생각하면서 AI 성능을 극대화하는 것을 뜻한다"고 설명했다. 이어 "실제 이런 추론을 통해 모델 크기가 10배 정도 향상됐다는 결과가 나오기도 한다"며 "고품질 데이터 대안으로 작용할 것으로 생각한다"고 말했다.
고려아연 "조건부 집중투표청구는 합법·적법”… 영풍·MBK측 문제 제기에 반박
2024-12-24 22:57:31민주당, 한덕수 권한대행 탄핵안 발의 계획 수정…"26일까지 기다린다"
2024-12-24 18:16:54'계엄'과 '탄핵'이 삼킨 겨울, 역주행 콘텐츠 살펴 보니...
2024-12-24 18:03:18집회 통신장애, 2번은 없다…과기정통부, 디지털장애 총력 대응
2024-12-24 17:30:00[DD퇴근길] '스티비' 해킹, 2차 피해 우려도…삼성, '갤S25' 가격 부담↑
2024-12-24 17:09:44