[한국정경신문=변동휘 기자] 엔씨 AI가 최고 성능의 초경량 멀티모달 VLM을 선보였다.
엔씨 AI는 온디바이스 환경에서 구동 가능한 초경량 멀티모달 AI 모델 ‘바르코 비전 2.0 1.7B’를 공개했다고 30일 밝혔다.
‘바르코 비전 2.0 1.7B’의 주요 벤치마크 결과 (자료=엔씨 AI)
이번 모델은 1.7B(17억) 파라미터의 작은 크기에도 불구하고 기존 경량 모델들을 뛰어넘는 수준의 성능을 보여준다. 개인 디바이스에서도 고성능 멀티모달 AI를 활용할 수 있는 길을 열었다고 자평했다.
바르코 비전 2.0은 이미지와 텍스트를 함께 이해해 질문에 답하는 차세대 인공지능 모델이다. 여러 장의 이미지를 동시에 분석할 수 있어 복잡한 문서나 표 및 차트도 효과적으로 처리할 수 있다.
이번 경량 모델 공개는 16일 공개된 중형 모델 ‘바르코 비전 2.0 14B’에 이은 후속타다. 14B 모델은 공개 후 열흘 만에 1만회 가까운 다운로드를 기록했다.
바르코 비전 2.0 1.7B는 텍스트 처리와 한국어 성능에서 글로벌 톱 오픈소스 멀티모달 모델 압도해 동급 최고 모델임을 입증했다. 다양한 벤치마크에서 글로벌 모델들의 성능을 훌쩍 넘었다. LLM은 물론 멀티모달 구축 기술력도 요구되는 국내 AI 생태계에서 매우 의미 있는 성과라는 평이다.
뿐만 아니라 바르코 비전 2.0 1.7B는 여러 주요 벤치마크에서 2배 가까이 더 큰 규모의 국내 모델들과 어깨를 나란히 하는 성능을 기록했다. MMMU 벤치마크와 AI2D 벤치마크에서 카카오와 네이버의 3B급 멀티모달 모델들과 동등하거나 오히려 더 뛰어난 성능을 보였다는 것이다.
또한 MathVista 벤치마크와 MM-Vet에서도 윗 체급 모델들 사이에서 2위를 기록했다. 모델의 크기가 성능을 결정하는 절대적 요소가 아니라는 것을 보여준 사례라는 것이 회사 측 설명이다.
1.7B 파라미터의 경량 모델은 스마트폰이나 PC 등 개인 기기에서도 원활하게 동작할 수 있도록 최적화됐다. 기존 멀티모달 AI가 대부분 클라우드 환경에서만 활용됐던 한계를 넘어 개인 디바이스에서도 고성능 멀티모달 AI를 직접 활용할 수 있도록 한다. 삼성전자와 애플 등 글로벌 IT 기업들이 온디바이스 AI에 집중하고 있는 만큼 국내 기술로 이러한 트렌드를 선도할 수 있는 경쟁력을 확보했다는 평이다.
엔씨 AI는 파운데이션 모델을 기반부터 구축하는 프롬 스크래치 방식의 LLM 개발 경험에 더해 멀티모달 및 온디바이스 모델 구축 능력까지 입증했다.
이번 1.7B 모델도 오픈소스로 공개한다. 앞서 회사 측은 국내 AI 생태계 발전과 연구 활성화에 기여하기 위해 바르코 비전 2.0 전 모델을 연구용 오픈소스로 공개한다고 밝힌 바 있다. 앞으로도 지속적으로 개발하는 모델을 오픈소스 공개할 계획이다.
뿐만 아니라 현재 정부가 추진하는 '독자 AI 파운데이션 모델 프로젝트'에 도전하고 있다. 멀티모달 모델 개발 역량과 다양한 산업군에서의 버티컬 AI 서비스 운영 경험을 바탕으로 국가 AI 경쟁력 강화에 기여한다는 계획이다.
엔씨 AI 이연수 대표는 “경량 고성능 모델 개발 능력을 통해 다양한 국내 산업군의 경쟁력을 크게 높일 것”이라며 “바르코 비전 2.0 1.7B는 AI 기술의 자립과 민주화를 위한 중요한 이정표로 앞으로도 더 많은 사람들이 쉽게 접근할 수 있는 고성능 AI 모델 개발에 최선을 다하겠다”고 밝혔다.