정부는 ‘K-AI(Model)’로 불리는 국산 AI 파운데이션 모델 구축을 위해 공공·민간 데이터 보유 기관을 대상으로 학습용 텍스트 데이터 공급기관을 7월 말까지 공개 모집한다고 6월 23일 밝혔다.

이번 사업은 전문 서적, 교과서, 논문 등 AI 모델 학습에 적합한 고품질 텍스트를 확보하여 이재명 정부의 국가대표 AI 모델 개발 역량을 극대화하고, 해외 모델에 대한 의존도를 줄여 "데이터 주권(Data Sovereignty)"을 강화하기 위한 핵심 전략으로 추진된다. 모집된 데이터는 8월부터 선발될 ‘AI 개발 정예팀’이 실제 수요에 따라 활용하게 되며, 한국지능정보사회진흥원(NIA)과 체결하는 데이터 이용 협약에 따라 AI허브 전용 공간이나 개발팀에 직접 전달되는 방식으로 제공된다. 정예팀으로 선정된 연구 그룹에는 최대 1,000장의 GPU 자원과 연간 30~50억 원 규모의 데이터 구축·가공비, 해외 우수 연구자 초빙을 위한 연간 20억 원의 재원이 지원되며, 데이터 공동구매를 위한 100억 원 규모의 예산도 마련된다. 기관이 무상으로 데이터를 제공하면 수집·전처리 비용을 정부가 지원하고, 유상 제공할 경우에는 사용 조건에 맞추어 적정 비용이 보전되며 AI허브를 통한 유통 기회, 관련 사업 참여 가점 등 추가 인센티브도 부여된다. 이 프로젝트는 민·관 협력체계를 통해 확보된 양질의 데이터를 바탕으로 6개월 이내에 글로벌 최신 모델 대비 95% 이상의 성능을 달성하겠다는 목표를 설정했다. 개발된 K-AI 모델은 오픈소스 형태로 공개되어 국내 스타트업과 중소기업이 자유롭게 활용할 수 있도록 하여 산업 생태계 확장과 글로벌 협업을 촉진할 예정이다. 특히 한국어와 한류 콘텐츠에 최적화된 현지화 성능은 외산 모델 대비 뚜렷한 경쟁 우위로 작용할 것으로 전망된다.
글로벌 파운데이션 모델 시장은 2023년 약 32억 달러에서 2030년 533억 달러 규모로 성장할 것으로 예상되며, 주요 사업자는 OpenAI, Microsoft, AWS, Google, Anthropic 등 상위 3개사가 약 70%의 시장 점유율을 차지할 전망이다. 그러나 국내에서 개발된 K-AI 모델이 언어·문화적 맥락을 반영하는 현지화 경쟁력과 윤리·안전성 강화 측면에서 우위를 확보한다면 글로벌 경쟁 구도에 의미 있는 변화를 불러올 수 있다. 
다만 데이터 편향성 문제와 글로벌 AI 인재 유출, GPU 등 핵심 컴퓨팅 자원에 대한 해외 의존도 등의 리스크 관리가 과제로 남아 있다. 정부는 규제 샌드박스 등 유연한 제도를 통해 데이터 제공과 연구 환경을 개선하고, 국내 연구자 유출을 방지하기 위한 지원 대책을 마련할 계획이다. 결국 K-AI 모델 구축 사업은 데이터·인프라·인재를 결집하여 한국이 AI 주권을 확보하고, 스마트 제조, 언어 서비스, 스타트업 혁신 등 다양한 산업 분야에서 경쟁 우위를 확보하는 발판이 될 것으로 기대된다.
|
정부는 ‘K-AI(Model)’로 불리는 국산 AI 파운데이션 모델 구축을 위해 공공·민간 데이터 보유 기관을 대상으로 학습용 텍스트 데이터 공급기관을 7월 말까지 공개 모집한다고 6월 23일 밝혔다.
이번 사업은 전문 서적, 교과서, 논문 등 AI 모델 학습에 적합한 고품질 텍스트를 확보하여 이재명 정부의 국가대표 AI 모델 개발 역량을 극대화하고, 해외 모델에 대한 의존도를 줄여 "데이터 주권(Data Sovereignty)"을 강화하기 위한 핵심 전략으로 추진된다. 모집된 데이터는 8월부터 선발될 ‘AI 개발 정예팀’이 실제 수요에 따라 활용하게 되며, 한국지능정보사회진흥원(NIA)과 체결하는 데이터 이용 협약에 따라 AI허브 전용 공간이나 개발팀에 직접 전달되는 방식으로 제공된다.
정예팀으로 선정된 연구 그룹에는 최대 1,000장의 GPU 자원과 연간 30~50억 원 규모의 데이터 구축·가공비, 해외 우수 연구자 초빙을 위한 연간 20억 원의 재원이 지원되며, 데이터 공동구매를 위한 100억 원 규모의 예산도 마련된다. 기관이 무상으로 데이터를 제공하면 수집·전처리 비용을 정부가 지원하고, 유상 제공할 경우에는 사용 조건에 맞추어 적정 비용이 보전되며 AI허브를 통한 유통 기회, 관련 사업 참여 가점 등 추가 인센티브도 부여된다.
이 프로젝트는 민·관 협력체계를 통해 확보된 양질의 데이터를 바탕으로 6개월 이내에 글로벌 최신 모델 대비 95% 이상의 성능을 달성하겠다는 목표를 설정했다. 개발된 K-AI 모델은 오픈소스 형태로 공개되어 국내 스타트업과 중소기업이 자유롭게 활용할 수 있도록 하여 산업 생태계 확장과 글로벌 협업을 촉진할 예정이다. 특히 한국어와 한류 콘텐츠에 최적화된 현지화 성능은 외산 모델 대비 뚜렷한 경쟁 우위로 작용할 것으로 전망된다.
글로벌 파운데이션 모델 시장은 2023년 약 32억 달러에서 2030년 533억 달러 규모로 성장할 것으로 예상되며, 주요 사업자는 OpenAI, Microsoft, AWS, Google, Anthropic 등 상위 3개사가 약 70%의 시장 점유율을 차지할 전망이다. 그러나 국내에서 개발된 K-AI 모델이 언어·문화적 맥락을 반영하는 현지화 경쟁력과 윤리·안전성 강화 측면에서 우위를 확보한다면 글로벌 경쟁 구도에 의미 있는 변화를 불러올 수 있다.
다만 데이터 편향성 문제와 글로벌 AI 인재 유출, GPU 등 핵심 컴퓨팅 자원에 대한 해외 의존도 등의 리스크 관리가 과제로 남아 있다. 정부는 규제 샌드박스 등 유연한 제도를 통해 데이터 제공과 연구 환경을 개선하고, 국내 연구자 유출을 방지하기 위한 지원 대책을 마련할 계획이다.
결국 K-AI 모델 구축 사업은 데이터·인프라·인재를 결집하여 한국이 AI 주권을 확보하고, 스마트 제조, 언어 서비스, 스타트업 혁신 등 다양한 산업 분야에서 경쟁 우위를 확보하는 발판이 될 것으로 기대된다.