[한국정경신문=임윤희 기자] 네이버클라우드가 차세대 인공지능 패러다임으로 꼽히는 옴니모달 AI를 선점하며 현실형 AI 전환에 속도를 내고 있다.
텍스트와 이미지의 맥락을 함께 이해해 결과물을 만들어내는 HyperCLOVA X SEED 8B Omni 모델 (사진=네이버)
네이버클라우드는 29일 과학기술정보통신부의 ‘독자 AI 파운데이션 모델’ 프로젝트 일환으로 개발한 옴니파운데이션 모델의 첫 성과를 공개했다.
회사는 자체 대형언어모델(LLM) ‘하이퍼클로바X’에 기반한 ‘HyperCLOVA X SEED 8B Omni’와 ‘HyperCLOVA X SEED 32B Think’ 두 종을 오픈소스로 내놨다.
이번에 발표된 8B Omni는 텍스트, 이미지, 오디오를 단일 구조로 학습한 국내 첫 네이티브 옴니모달 모델이다. 다양한 정보형태를 한 공간에서 통합 이해할 수 있어 현실 환경에서의 활용도가 높다는 게 회사의 설명이다.
네이버클라우드는 모델 확장 전략으로 데이터 차별화와 단계적 스케일업을 제시했다. 인터넷 문서 중심의 기존 학습을 넘어 생활 맥락 데이터와 공간 데이터를 확보해 현실 세계의 다양성을 반영한다는 계획이다.
이번 모델은 텍스트 지시 기반 이미지 생성·편집 기능도 탑재했다. 글로벌 선두 AI 모델이 구현해온 멀티모달 생성 기능을 국내 기술로 구현했다는 점에서 의미가 있다.
함께 공개된 32B Think 모델은 텍스트 기반 추론형 AI에 시각·음성·도구 활용 능력을 더해 복합적 문제 해결을 지원한다. 글로벌 벤치마크 평가에서도 주요 AI 모델과 유사한 성능을 기록한 것으로 나타났다.
32B 모델은 올해 수능 실제 문제 풀이에서 전 과목 1등급 수준을 보여 영어·한국사 과목에서 만점을 기록했다. 이미지 입력 문제를 직접 이해해 푸는 방식이란 점에서 차별화됐다.
성낙호 네이버클라우드 하이퍼스케일AI 기술총괄은 “AI 감각 확장과 추론 강화가 현실 문제 해결력을 높이는 핵심임을 확인했다”며 “기본기를 갖춘 구조 위에서 점진적으로 규모를 확장하겠다”고 말했다.
네이버클라우드는 향후 검색, 커머스, 콘텐츠, 공공, 산업 영역으로 옴니모달 AI 에이전트 생태계를 확장하며 ‘모두의 AI’ 구축을 앞당긴다는 방침이다.