카카오의 자체 개발 인공지능(AI) 모델 '카나나'가 한국어 언어 모델 성능 평가에서 최상위권을 기록하며 국산 AI 모델의 기술 경쟁력을 입증했다. 이는 '소버린AI(국가주권형 AI)' 구축에 대한 국내 기업들의 역량을 보여주는 성과로 평가된다.

사진: 정신아 카카오 대표이사, 카카오
호랑이 리더보드에서 압도적 성과 26일 업계에 따르면 카카오가 최근 오픈소스로 공개한 'Kanana-1.5-8b-instruct' 모델이 미국 AI 개발자 플랫폼 웨이트앤바이어스(W&B)가 운영하는 '호랑이(Horang-i) 리더보드'에서 8B 사이즈(매개변수 80억개) 이하 모델 중 1위를 차지했다. 총점 0.691점을 기록하며 국내 모델 가운데 가장 높은 순위를 달성했고, 15B 미만 모델 중에서는 1위 'Qwen2.5-14B'와 0.04점 차이로 종합 4위를 기록했다. 특히 이번 성과는 모델의 아키텍처, 데이터셋, 학습 프로세스를 모두 처음부터 구축하는 '프롬 스크래치(From scratch)' 방식으로 개발된 국내 LLM 중 최고 순위라는 점에서 의미가 크다. 해외 모델의 단순 파인튜닝과 달리 독자적 기술력을 바탕으로 한 국산 모델임을 입증한 것이다.

이미지: 카카오
멀티모달 혁신과 오픈소스 전략 카카오는 단순한 언어모델을 넘어 혁신적인 멀티모달 기술도 선보였다. 국내 최초로 텍스트, 음성, 이미지를 동시에 처리할 수 있는 통합 멀티모달 언어모델 'Kanana-o'를 공개하며, 배경음이 섞인 음성 인식, 감정 묘사, 지역 방언 이해, 음성 통역 등 다양한 기능을 구현했다. 카나나-o는 기존 이미지-텍스트 모델 '카나나-v'와 음성 모델 '카나나-a'를 병합한 삼중 모달(tri-modal) 구조로, GPT-4o와 제미나이-1.5보다 한국어 음성에 담긴 미묘한 감정을 더 잘 이해한다고 평가됐다. 오픈소스 전략도 주목받고 있다. 카카오는 지난 5월 'Kanana 1.5' 4종 모델을 아파치 2.0 라이선스로 공개해 누구나 자유로운 수정과 상업적 활용이 가능하도록 했다. 코딩과 수학 문제 해결, 함수 호출 능력에서 이전 버전 대비 평균 1.5배 성능 향상을 달성했으며, 오픈소스 SOTA 모델 수준에 근접한 성능을 보여주고 있다.
국내 AI 생태계 경쟁 본격화 카카오의 성과는 국내 AI 생태계 전반의 경쟁력 향상을 보여준다. 네이버는 '하이퍼클로바X 시드' 시리즈를 상업용 오픈소스로 공개하며 국내 최초 상업용 오픈소스 LLM을 선언했고, LG AI연구원의 '엑사원-3.5'도 한국어와 영어에서 일관된 성능을 보이며 주목받고 있다. 업스테이지의 '솔라' 모델은 허깅페이스 오픈 LLM 리더보드에서 1~10위를 석권하며 글로벌 경쟁력을 입증한 바 있다. 이는 국내 오픈소스 기반 모델이 글로벌 리더보드 상위권을 대거 점령한 사상 첫 사례였다.
소버린 AI 경쟁력 강화의 신호탄 전문가들은 카카오의 이번 성과가 '소버린AI' 구축에 중요한 이정표가 될 것으로 평가하고 있다. 소버린AI는 국가가 독자적으로 AI 기술을 개발하고 관리하는 개념으로, 데이터 주권 보호와 기술 독립성 강화가 핵심이다. 카카오 관계자는 "한국어와 영어 모두에서 강력한 성능을 보이는 범용 언어모델이자, 성능과 비용 효율의 균형을 고려해 설계된 중형 크기의 모델"이라며 "번역과 추론, 지식·질의응답, 구문해석 등의 벤치마크에서 전체 1위를 기록해 다수의 글로벌 모델과 비교해도 뛰어난 경쟁력을 보유했다"고 밝혔다. 현재 카카오는 더욱 향상된 'Kanana 2' 개발에 박차를 가하고 있으며, 이는 한국이 글로벌 AI 경쟁에서 독자적 기술력을 바탕으로 한 주도권 확보 가능성을 보여주는 중요한 성과로 평가된다.
|
카카오의 자체 개발 인공지능(AI) 모델 '카나나'가 한국어 언어 모델 성능 평가에서 최상위권을 기록하며 국산 AI 모델의 기술 경쟁력을 입증했다. 이는 '소버린AI(국가주권형 AI)' 구축에 대한 국내 기업들의 역량을 보여주는 성과로 평가된다.
사진: 정신아 카카오 대표이사, 카카오
호랑이 리더보드에서 압도적 성과
26일 업계에 따르면 카카오가 최근 오픈소스로 공개한 'Kanana-1.5-8b-instruct' 모델이 미국 AI 개발자 플랫폼 웨이트앤바이어스(W&B)가 운영하는 '호랑이(Horang-i) 리더보드'에서 8B 사이즈(매개변수 80억개) 이하 모델 중 1위를 차지했다. 총점 0.691점을 기록하며 국내 모델 가운데 가장 높은 순위를 달성했고, 15B 미만 모델 중에서는 1위 'Qwen2.5-14B'와 0.04점 차이로 종합 4위를 기록했다.
특히 이번 성과는 모델의 아키텍처, 데이터셋, 학습 프로세스를 모두 처음부터 구축하는 '프롬 스크래치(From scratch)' 방식으로 개발된 국내 LLM 중 최고 순위라는 점에서 의미가 크다. 해외 모델의 단순 파인튜닝과 달리 독자적 기술력을 바탕으로 한 국산 모델임을 입증한 것이다.
이미지: 카카오
멀티모달 혁신과 오픈소스 전략
카카오는 단순한 언어모델을 넘어 혁신적인 멀티모달 기술도 선보였다. 국내 최초로 텍스트, 음성, 이미지를 동시에 처리할 수 있는 통합 멀티모달 언어모델 'Kanana-o'를 공개하며, 배경음이 섞인 음성 인식, 감정 묘사, 지역 방언 이해, 음성 통역 등 다양한 기능을 구현했다.
카나나-o는 기존 이미지-텍스트 모델 '카나나-v'와 음성 모델 '카나나-a'를 병합한 삼중 모달(tri-modal) 구조로, GPT-4o와 제미나이-1.5보다 한국어 음성에 담긴 미묘한 감정을 더 잘 이해한다고 평가됐다.
오픈소스 전략도 주목받고 있다. 카카오는 지난 5월 'Kanana 1.5' 4종 모델을 아파치 2.0 라이선스로 공개해 누구나 자유로운 수정과 상업적 활용이 가능하도록 했다. 코딩과 수학 문제 해결, 함수 호출 능력에서 이전 버전 대비 평균 1.5배 성능 향상을 달성했으며, 오픈소스 SOTA 모델 수준에 근접한 성능을 보여주고 있다.
국내 AI 생태계 경쟁 본격화
카카오의 성과는 국내 AI 생태계 전반의 경쟁력 향상을 보여준다. 네이버는 '하이퍼클로바X 시드' 시리즈를 상업용 오픈소스로 공개하며 국내 최초 상업용 오픈소스 LLM을 선언했고, LG AI연구원의 '엑사원-3.5'도 한국어와 영어에서 일관된 성능을 보이며 주목받고 있다.
업스테이지의 '솔라' 모델은 허깅페이스 오픈 LLM 리더보드에서 1~10위를 석권하며 글로벌 경쟁력을 입증한 바 있다. 이는 국내 오픈소스 기반 모델이 글로벌 리더보드 상위권을 대거 점령한 사상 첫 사례였다.
소버린 AI 경쟁력 강화의 신호탄
전문가들은 카카오의 이번 성과가 '소버린AI' 구축에 중요한 이정표가 될 것으로 평가하고 있다. 소버린AI는 국가가 독자적으로 AI 기술을 개발하고 관리하는 개념으로, 데이터 주권 보호와 기술 독립성 강화가 핵심이다.
카카오 관계자는 "한국어와 영어 모두에서 강력한 성능을 보이는 범용 언어모델이자, 성능과 비용 효율의 균형을 고려해 설계된 중형 크기의 모델"이라며 "번역과 추론, 지식·질의응답, 구문해석 등의 벤치마크에서 전체 1위를 기록해 다수의 글로벌 모델과 비교해도 뛰어난 경쟁력을 보유했다"고 밝혔다.
현재 카카오는 더욱 향상된 'Kanana 2' 개발에 박차를 가하고 있으며, 이는 한국이 글로벌 AI 경쟁에서 독자적 기술력을 바탕으로 한 주도권 확보 가능성을 보여주는 중요한 성과로 평가된다.