공간 AI, LLM을 만나다 : ‘어디’라는 질문이 ‘왜’라는 인사이트가 되기까지
‘어디’라는 질문이 대화가 될 때
인류가 공간 정보를 다루는 방식은 정적인 종이 지도에서 시작하여, 클릭과 터치로 상호작용하는 디지털 지도를 거쳐, 이제는 대화형 지능의 시대로 진입하고 있다. 이는 단순히 기술적 진보를 넘어, 우리가 물리적 세계와 관계를 맺고 이해하는 방식의 근본적인 패러다임 전환을 의미한다. 과거에는 “이 위치에 무엇이 있는가?” 라는 객관적 사실을 묻는데 그쳤다면, 이제는 “나와 같은 사람에게 이곳은 어떤 의미를 가지는가?”와 같은 주관적이고 맥락적인 질문에 답을 구할 수 있는 시대가 열리고 있다.
이러한 변화의 중심에는 두가지 혁신적인 기술의 융합이 자리 잡고 있다. 첫 번째는 공간 AI (Spatial AI 또는 Geo AI)이다. 공간 AI는 컴퓨터 비전, 머신러닝 등을 통해 기계가 3차원의 현실 세계를 인간처럼 인식하고, 그안의 객체, 패턴, 관계를 이해하도록 만드는 기술이다. 이는 컴퓨터에 ‘어디’라는 공간적 맥락을 이해하는 능력을 부여하는 과학이다. 두 번째는 대규모 언어 모델 (Large Language Models, LLMs)이다. LLM은 방대한 텍스트 데이터를 학습하여 인간의 언어를 전례 없는 수준으로 이해하고 생성하며, 나아가 논리적 추론까지 수행하는 인공지능의 비약적인 발전이다. LLM은 ‘무엇’과 ‘왜’라는 질문에 대한 답을 찾는 강력한 엔진이다.
공간 AI가 제공하는 물리적 세계에 대한 깊이있는 맥락적 이해와 LLM의 정교한 추론 및 자연어 인터페이스가 결합될 때, 이는 단순한 점진적 개선이 아닌 위치 데이터로부터 가치를 창출하는 방식을 근복적으로 재편하는 번혁을 이끌어낸다. 과거에는 숙련된 분석가만이 접근할 수 있었던 복잡한 공간 분석이 이제는 자연스러운 대화를 통해 누구나 접근 가능한 인사이트로 전환되고 있다. 이러한 변화는 경제적, 전략적 가치의 중심이 원시 데이터 자체에서 개인화되고 실행 가능한 대화형 인사이트를 생성하는 능력으로 이동하고 있음을 시사한다. 역사적으로 지도 데이터의 소유가 중요했던 시대를 지나, 이를 처리하고 시각화하는 플랫폼의 시대를 거쳐, 이제는 이 모든 기술 스택을 자연어라는 인터페이스 뒤로 추상화하는 새로운 단계에 이르렀다. 새로운 가치는 지도나 예측 알고리즘이 아닌, 인간의 복잡하고 주관적인 질문에 답할 수 있는 대화형 에이전트 그 자체에 있다.
기술의 융합 - 공간 AI와 LLM은 어떻게 만나는가
공간 AI와 LLM의 융합은 단순히 두 기술을 나란히 놓는 것을 넘어, 서로의 강점을 극대화하고 약점을 보완하는 유기적인 아키텍쳐를 통해 구현된다. 공간 AI가 현실 세계의 데이터를 구조화 된 지능으로 변환하면, LLM은 이 지능을 인간의 언어로 해석하고 추론하여 새로운 차원의 가치를 창출한다.
1. 두 개의 기둥 : 공간 AI와 LLM의 핵심
이 기술 융합의 근간을 이루는 두 축은 각각 공간 AI와 LLM의 독자적인 작동 원리에 기인한다.
공간 AI (Geo AI)의 작동 원리
공간 AI는 물리적 세계를 디지털 데이터로 변환하고, 그 안에서 의미 있는 정보를 추출하는 일련의 과정을 포함한다.
- 데이터 수집 (Data Acquisition) : 공간AI의 분석은 풍부하고 다층적인 데이터에서 시작된다. 위성 및 항공 이미지, GNSS 신호, 차량이나 드론에 장착된 라이다 센서 데이터는 물론, 구글 스트리트 뷰와 같은 크라우드 소싱 이미지 데이터에 이르기까지 다양한 소스로부터 공간 정보가 수집된다.
- 데이터 표현 (Data Representation) : 수집된 데이터는 분석 목적에 맞게 두 가지 기본 형태로 표현된다. 벡터 (Vector) 데이터는 도로, 건물, 행정 구역처럼 명확한 경계를 가진 개체를 점, 선, 다각형으로 표현하는 방식인다. 반면 레스터 (Raster) 데이터는 지형의 고도나 기온처럼 연속적인 값을 갖는 현상을 격자 형태의 픽셀 값으로 표현한다.
- 분석 및 인사이트 추출 (Analysis & Insight Generation) : 이 구조화 된 데이터에 머신러닝 및 딥러닝 모델이 적용되어 비로소 ‘지능’이 생성된다. 예를 들어, 위성 이미지에서 건물을 찾아내는 객체 탐지 (Object Detection), 토지의 용도 (주거, 사업, 녹지 등)를 식별하는 분류 (Classification), 특정 지역의 교통량을 예측하거나 농작물 수확량을 전망하는 예측 (Prediction) 등의 분석이 수행된다. 이 단계를 통해 원시 데이터는 의사결정에 활용 될 수 있는 구조화 된 정보로 변환 된다.
대규모 언어 모델 (LLM)의 구조
LLM은 인간의 언어를 기계가 이해하고 생성할 수 있도록 설계된 정교한 신경망 아키텍쳐에 기반한다.
- 트랜스포머 아키텍쳐 (Transformer Architecture) : 현대 LLM의 핵심은 트랜스포머 아키텍쳐, 특히 그 안에 포함된 셀프 어텐션 (Self-attention) 메커니즘이다. 이 메커니즘은 문장 내의 단어들이 서로에게 미치는 영향의 정도를 계산하여 문맥상 중요한 단어에 더 높은 가중치를 부여한다. 이를 통해 모델은 단순한 단어의 나열이 아닌, 문장 전체의 복잡한 의미 구조를 깊이 있게 파악할 수 있다.
- 사전 훈련과 미세 조정 (Pre-training and Fine-tuning) : LLM의 학습은 크게 두 단계로 이루어진다. 첫 번빼 사전 훈련 단계에서는 인터넷 등의 방대한 텍스트 데이터를 학습하여 언어의 일반적인 패턴, 문법, 그리고 세상에 대한 광범위한 지식을 습득한다. 두 번째 미세 조정 단계에서는 특정 도메인 (예: 의료, 법률)이나 특정 작업에 맞춰진 더 작고 정제된 데이터셋으로 추가 학습을 진행한다. 이 과정을 통해 범용 모델은 특정 분야에 고도로 전문화된 성능을 발휘하게 된다.
2. 기술적 가교 : RAG와 벡터 데이터베이스의 역할
공간 AI와 LLM을 실질적으로 연결하는 것은 ‘검색 증강 생성 (Retrieval-Augmented Generation, RAG) 이라는 아키텍쳐와 이를 뒷받침하는 벡터 데이터베이스 기술이다. 이 조합은 LLM의 본질적인 한계를 극복하고, 공간 데이터와의 실시간 연동을 가능하게 하는 핵심적인 역할을 수행한다.
LLM의 한계와 RAG의 등장
LLM은 강력하지만 명확한 한계를 지닌다. 모델은 학습 데이터가 생성된 시점에 지식이 고정되어 있어 최신 정보를 반영하지 못하여, 학습 데이터에 없는 사실에 대해 질문을 받으면 그럴듯한 거짓 정보를 만들어내는 환각(Hallucination) 현상을 보이기도 한다. RAG는 이러한 한계를 극복하기 위해 LLM을 외부의 최신 또는 전문 지식 베이스에 실시간으로 연결하는 기술적 해법이다.
RAG의 작동 방식
RAG는 사용자의 질문을 LLM에 직접 전달하기 전에, 관련 정보를 외부 데이터베이스에서 검색하여 보강하는 방식으로 작동한다. 사용자가 질의한 내용을 외부 지식 베이스 (공간 AI의 경우 공간정보 데이터베이스)에서 관련 정보를 검색한다. 가령 특정 객체의 위치 정보, 건물의 속성 데이터 등이 검색 대상이 된다. 검색된 최신 데이터는 증간 (Augmentation)이라는 과정을 통해 LLM에 전달될 프롬프트 (Prompt)에 컨텍스트 정보로 추가 된다. 즉 LLM은 질문과 사실 기반의 참고 자료를 제공받는다. 이 사실적인 컨텍스트를 바탕으로 “A 아파트는 B 공원에서 5분 거리에 있으며, 소음 수준이 낮고 반려동물 친화 정책을 시행하고 있습니다” 와 같은 정확하고 유용한 답변을 생성한다.
벡터 데이터베이스 : 의미 기반 검색의 핵심
RAG의 검색 단계에서 핵심적인 역할을 하는 것이 바로 벡터 데이터베이스다. 기존의 키워드 기반 검색과 달리, 벡터 데이터베이스는 데이터의 ’의미‘를 기반으로 검색을 수행한다.
- 임베딩 (Embeddings) : 텍스트, 이미지, 위치 정보 등 다양한 형태의 데이터를 그 의미적 본질을 포착하는 고차원의 숫자 벡터로 변환하는 기술이다.
- 유사도 검색 (Similarity Search) : 벡터 데이터베이스는 이러한 임베딩 벡터들을 저장하고, 특정 쿼리 벡터와 가장 ’가까운‘ 벡터 들을 신속하게 찾아낸다. 여기서 ’가깝다‘는 것은 의미적으로 유사하다는 뜻이다. 예를 들어 “조용한 오후에 책 읽기 좋은곳”이라는 쿼리는 ’도서관‘, ’식물원‘, ’한적한 카페‘ 등의 벡터와 가깝게 위치하게 된다.
- 공간 데이터 검색의 혁신 : 벡터 데이터베이스는 RAG의 검색 단계에서 자연어 쿼리의 의도를 벡터로 변환한 뒤, 방대한 공간 데이터베이스 내에서 의미적으로 가장 부합하는 데이터를 찾아내는 역할을 수행한다. 이는 과거에 PostGIS와 같은 전문적인 쿼리 언어로만 가능했던 복잡한 공간 검색을 일반 사용자의 자연어 질문으로 간으하게 만드는 혁신이다. 결국 RAG와 벡터 데이터베이스는 인간의 유연하고 비정형적인 언어 세계와 컴퓨터의 엄격하고 구조화된 데이터 세계를 잇는 범용 번역기이자 ‘현실을 위한 API’로 기능하며, 정교한 위치 기반 애플리케이션 개발의 진입 장벽을 극적으로 낮추고 있다.

그림 1. 공간정보 분야 인공지능 모델의 발전
글로벌 선구자들과 혁신 사례
공간 AI와 LLM의 융합은 이미 다양한 산업 분야에서 구체적인 서비스와 플랫폼으로 구현되며, 그 가치를 입증하고 있다. 글로벌 기술 기업들은 이 새로운 시장을 선점하기 위해 각기 다른 전략적 접근을 통해 혁신을 주도하고 있다.
1. 대화형 내비게이션과 차량 내 경험 (Mapbox MapGPT)
글로벌 위치 데이터 플랫폼 기업인 맵박스 (Mapbox)가 선보인 MapGPT는 이러한 변화를 상징적으로 보여주는 사례다. MapGPT는 소비자가 직접 사용하는 애플리케이션이 아니라, 자동차 제조사들이 자사의 차량에 맞춤형 AI 비서를 탑재할 수 있또록 제공하는 B2B 플랫폼이다. 핵심 기능은 맵박스의 핵심 역량인 실시간 위치 데이터와의 깊은 통합에서 나온다
- 실시간 데이터 연동 : 실시간 교통 정보, 관심 장소 (POI) 데이터 등 맵박스의 살아있는 데이터를 기반으로 상황에 맞는 답변을 제공한다
- 자연어 상호 작용 : “코엑스로 가자”와 같은 명확한 명령뿐만 아니라, “이 근처에 주차기 편하고 평점 좋은 이탈리엔 레스토랑 좀 찾아줘”와 같은 모호하고 복합적인 질문도 이해하고 처리한다.
- 차량 시스템 통합 : 차량의 배터리 잔량, 실내 온도 등 차량 시스템과 연동하여 “가장 가까운 급속 충전소를 찾아주고, 도착할 때 쯤 실내 온도를 22도로 맞춰줘” 와 같은 차량 제어 명령까지 수행할 수 있다.
- 오프라인 기능 : 인터넷 연결이 끊긴 상황에서도 내장된 ‘소형 LLM’을 통해 집으로 길안내와 같은 필수적인 기능을 수행한다.
MapGPT는 단순한 길 안내 도구를 넘어, 운전자의 여정 전반을 지원하는 ‘대화형 부조종사 (Conversational Copilot)’를 지향한다. 이는 모빌리티 내의 서비스 패러다임을 바꾸고 있다.

그림 2. Mapbox의 MapGPT 이미지
2. Google의 Geospatial Reasoning Framework
구글은 자사의 방대한 자산을 결합하여 이 분야를 선도하고 있다. ‘Geospatial reasoning’ 프레임워크는 구글의 파운데이션 모델 (Gemini 등)과 거대한 공간 데이터 플랫폼 (Google Earth, Google Maps)를 통합하려는 연구 프로젝트다. 이 프레임워크의 핵심은 에이전트 워크플로우 (Agentic Workflow)이다. 사용자가 “최근 허리케인으로 인한 이 지역 재산 피해액을 추산해줘”와 같은 복잡한 질문을 던지면, Gemini가 계획을 수립하고, 위성 이미지 분석, 인구 통계 데이터 조회, 부동산 가치 데이터 분석 등 여러 단계를 순차적으로 실행한 후 종합적인 답변을 생성한다. 이는 AI가 스스로 문제를 해결하기 위해 여러 도구와 데이터를 자율적으로 사용하는 능동적인 에이전트로서 기능함을 보여준다. 최근에는 구글 딥마인드에서 새로운 AI 모델인 알파어스 파운데이션 (AlphaEarth Foundations)을 공개하여 지구 관측 각종 데이터를 분석해 과학자와 연구자가 지구를 더 정확하고 효율적으로 지도화(매핑)하고 모니터링할 수 있도록 하고 있다.

그림 3. Deepmind Earth Foundation Model 데이터
3. 산업별 적용 예시
공간 AI와 LLM의 융합 기술은 특정 플랫폼을 넘어 다양한 산업 현장에서 구체적인 문제 해결에 기여하고 있다.
- 스마트시티 : AI 기반 교통 관리 시스템은 실시간 교통량에 따라 신호 체계를 최적화하고, 재난 관리 시스템은 과거 데이터와 실시간 센서 정보를 분석하여 침수나 산사태 위험이 높은 지역을 예측하고 최적의 대피 경로를 제시한다. 여기에 LLM이 결합되면, 도시 계획가나 일반 시민이 "새로운 쇼핑몰이 들어설 경우, 주변 지역의 교통량과 소음에 어떤 영향을 미칠지 시뮬레이션해줘"와 같은 질문을 통해 도시 정책 결정 과정에 더 쉽게 참여할 수 있게 된다. 최근 서울시는 대화형 S-Map을 시범 서비스로 출시하여 LLM과 공간정보를 융합하여 시 행정에 이용하고 있다.

그림 4. 서울시의 대화형 S-Map 서비스
- 물류 및 공급망 최적화 : UPS의 'ORION' 시스템과 FedEx의 'Sense Aware'는 실시간 교통, 날씨, 차량 상태 데이터를 종합하여 최적의 배송 경로를 동적으로 계산한다. 월마트와 DHL은 AI를 활용해 재고 수준을 예측하고 스마트 물류 센터의 자동화 로봇을 제어한다. LLM의 융합은 "싱가포르 항구 폐쇄와 인도양 기상 예보를 고려할 때, 우리 선단의 탄소 배출을 최소화하는 대체 항로는 무엇인가?"와 같은 더욱 복잡하고 전략적인 질문에 대한 답을 찾는 것을 가능하게 한다.
공간 AI와 LLM의 융합은 디지털 정보와 물리적 공간이 ‘대화형 현실’이라는 새로운 인터페이스를 통해 매끄럽게 연결되는 패러다임의 시작을 알린다. 이는 단순한 기술적 결합을 넘어, 우리의 일상과 산업. 그리고 사회 시스템 전반에 걸쳐 혁신을 촉발할 잠재력을 지나고 있다. 글로벌 GeoAI 시장은 2033년까지 약 11억 달러 규모로 성장할것으로 예측되며, 연평균 성장률 (CAGR)은 약 30%에 달할 것으로 전망된다. 이 거대한 시장의 주도권을 확보하기 위한 경쟁은 이미 시작되엇다.
궁극적으로 공간 AI – LLM 시대의 경쟁력은 각국의 고유하고 문화적으로 미묘한 차이를 담은 데이터를 기반으로 한 파운데이션 모델을 직접 소유하고 훈련시킰 있는 능력, 즉 데이터 및 모델 주권 (Data and Model Sovereignty)에 의해 좌우될 것이다. 북미 데이터로 주로 학습된 모델은 한국의 도시 구조, 사회적 규범, 언어적 맥락을 온전히 이해하기 어렵다. 공공 안전. 도시 계획, 국방과 같은 국가 핵심 분야에서 해외 기업이 통제하는 모델에 의존하는 것은 심각한 안보 및 전략적 리스크를 야기할 수 있다.
*참고 문헌
- GeoAI, Esri (https://www.esri.com/ko-kr/capabilities/geoai/overview)
- LLM 이란 무엇인가, Amazon (https://aws.amazon.com/ko/what-is/large-language-model/)
- 2025년 기술 트렌드: 공간 컴퓨팅과 앰비언트 인텔리전스, 한국과학기술기획평가원, (https://www.kistep.re.kr/gpsBoardDownload.es?board_se=issue&list_no=49141&seq=1)
- Building a Large Geospatial Model to Achieve Spatial Intelligence, Niantic (https://nianticlabs.com/news/largegeospatialmodel)
- Mapbox Debuts MapGPT, Allowing Automakers to Take Control of Their Voice Assistants, MapBox (https://www.mapbox.com/blog/mapbox-debuts-mapgpt-allowing-automakers-to-take-control-of-their-voice-assistants)
- AlphaEarth Foundations helps map our planet in unprecedented detai, DeepMind (https://deepmind.google/discover/blog/alphaearth-foundations-helps-map-our-planet-in-unprecedented-detail/)l
공간 AI, LLM을 만나다 : ‘어디’라는 질문이 ‘왜’라는 인사이트가 되기까지
‘어디’라는 질문이 대화가 될 때
인류가 공간 정보를 다루는 방식은 정적인 종이 지도에서 시작하여, 클릭과 터치로 상호작용하는 디지털 지도를 거쳐, 이제는 대화형 지능의 시대로 진입하고 있다. 이는 단순히 기술적 진보를 넘어, 우리가 물리적 세계와 관계를 맺고 이해하는 방식의 근본적인 패러다임 전환을 의미한다. 과거에는 “이 위치에 무엇이 있는가?” 라는 객관적 사실을 묻는데 그쳤다면, 이제는 “나와 같은 사람에게 이곳은 어떤 의미를 가지는가?”와 같은 주관적이고 맥락적인 질문에 답을 구할 수 있는 시대가 열리고 있다.
이러한 변화의 중심에는 두가지 혁신적인 기술의 융합이 자리 잡고 있다. 첫 번째는 공간 AI (Spatial AI 또는 Geo AI)이다. 공간 AI는 컴퓨터 비전, 머신러닝 등을 통해 기계가 3차원의 현실 세계를 인간처럼 인식하고, 그안의 객체, 패턴, 관계를 이해하도록 만드는 기술이다. 이는 컴퓨터에 ‘어디’라는 공간적 맥락을 이해하는 능력을 부여하는 과학이다. 두 번째는 대규모 언어 모델 (Large Language Models, LLMs)이다. LLM은 방대한 텍스트 데이터를 학습하여 인간의 언어를 전례 없는 수준으로 이해하고 생성하며, 나아가 논리적 추론까지 수행하는 인공지능의 비약적인 발전이다. LLM은 ‘무엇’과 ‘왜’라는 질문에 대한 답을 찾는 강력한 엔진이다.
공간 AI가 제공하는 물리적 세계에 대한 깊이있는 맥락적 이해와 LLM의 정교한 추론 및 자연어 인터페이스가 결합될 때, 이는 단순한 점진적 개선이 아닌 위치 데이터로부터 가치를 창출하는 방식을 근복적으로 재편하는 번혁을 이끌어낸다. 과거에는 숙련된 분석가만이 접근할 수 있었던 복잡한 공간 분석이 이제는 자연스러운 대화를 통해 누구나 접근 가능한 인사이트로 전환되고 있다. 이러한 변화는 경제적, 전략적 가치의 중심이 원시 데이터 자체에서 개인화되고 실행 가능한 대화형 인사이트를 생성하는 능력으로 이동하고 있음을 시사한다. 역사적으로 지도 데이터의 소유가 중요했던 시대를 지나, 이를 처리하고 시각화하는 플랫폼의 시대를 거쳐, 이제는 이 모든 기술 스택을 자연어라는 인터페이스 뒤로 추상화하는 새로운 단계에 이르렀다. 새로운 가치는 지도나 예측 알고리즘이 아닌, 인간의 복잡하고 주관적인 질문에 답할 수 있는 대화형 에이전트 그 자체에 있다.
기술의 융합 - 공간 AI와 LLM은 어떻게 만나는가
공간 AI와 LLM의 융합은 단순히 두 기술을 나란히 놓는 것을 넘어, 서로의 강점을 극대화하고 약점을 보완하는 유기적인 아키텍쳐를 통해 구현된다. 공간 AI가 현실 세계의 데이터를 구조화 된 지능으로 변환하면, LLM은 이 지능을 인간의 언어로 해석하고 추론하여 새로운 차원의 가치를 창출한다.
1. 두 개의 기둥 : 공간 AI와 LLM의 핵심
이 기술 융합의 근간을 이루는 두 축은 각각 공간 AI와 LLM의 독자적인 작동 원리에 기인한다.
공간 AI (Geo AI)의 작동 원리
공간 AI는 물리적 세계를 디지털 데이터로 변환하고, 그 안에서 의미 있는 정보를 추출하는 일련의 과정을 포함한다.
- 데이터 수집 (Data Acquisition) : 공간AI의 분석은 풍부하고 다층적인 데이터에서 시작된다. 위성 및 항공 이미지, GNSS 신호, 차량이나 드론에 장착된 라이다 센서 데이터는 물론, 구글 스트리트 뷰와 같은 크라우드 소싱 이미지 데이터에 이르기까지 다양한 소스로부터 공간 정보가 수집된다.
- 데이터 표현 (Data Representation) : 수집된 데이터는 분석 목적에 맞게 두 가지 기본 형태로 표현된다. 벡터 (Vector) 데이터는 도로, 건물, 행정 구역처럼 명확한 경계를 가진 개체를 점, 선, 다각형으로 표현하는 방식인다. 반면 레스터 (Raster) 데이터는 지형의 고도나 기온처럼 연속적인 값을 갖는 현상을 격자 형태의 픽셀 값으로 표현한다.
- 분석 및 인사이트 추출 (Analysis & Insight Generation) : 이 구조화 된 데이터에 머신러닝 및 딥러닝 모델이 적용되어 비로소 ‘지능’이 생성된다. 예를 들어, 위성 이미지에서 건물을 찾아내는 객체 탐지 (Object Detection), 토지의 용도 (주거, 사업, 녹지 등)를 식별하는 분류 (Classification), 특정 지역의 교통량을 예측하거나 농작물 수확량을 전망하는 예측 (Prediction) 등의 분석이 수행된다. 이 단계를 통해 원시 데이터는 의사결정에 활용 될 수 있는 구조화 된 정보로 변환 된다.
대규모 언어 모델 (LLM)의 구조
LLM은 인간의 언어를 기계가 이해하고 생성할 수 있도록 설계된 정교한 신경망 아키텍쳐에 기반한다.
- 트랜스포머 아키텍쳐 (Transformer Architecture) : 현대 LLM의 핵심은 트랜스포머 아키텍쳐, 특히 그 안에 포함된 셀프 어텐션 (Self-attention) 메커니즘이다. 이 메커니즘은 문장 내의 단어들이 서로에게 미치는 영향의 정도를 계산하여 문맥상 중요한 단어에 더 높은 가중치를 부여한다. 이를 통해 모델은 단순한 단어의 나열이 아닌, 문장 전체의 복잡한 의미 구조를 깊이 있게 파악할 수 있다.
- 사전 훈련과 미세 조정 (Pre-training and Fine-tuning) : LLM의 학습은 크게 두 단계로 이루어진다. 첫 번빼 사전 훈련 단계에서는 인터넷 등의 방대한 텍스트 데이터를 학습하여 언어의 일반적인 패턴, 문법, 그리고 세상에 대한 광범위한 지식을 습득한다. 두 번째 미세 조정 단계에서는 특정 도메인 (예: 의료, 법률)이나 특정 작업에 맞춰진 더 작고 정제된 데이터셋으로 추가 학습을 진행한다. 이 과정을 통해 범용 모델은 특정 분야에 고도로 전문화된 성능을 발휘하게 된다.
2. 기술적 가교 : RAG와 벡터 데이터베이스의 역할
공간 AI와 LLM을 실질적으로 연결하는 것은 ‘검색 증강 생성 (Retrieval-Augmented Generation, RAG) 이라는 아키텍쳐와 이를 뒷받침하는 벡터 데이터베이스 기술이다. 이 조합은 LLM의 본질적인 한계를 극복하고, 공간 데이터와의 실시간 연동을 가능하게 하는 핵심적인 역할을 수행한다.
LLM의 한계와 RAG의 등장
LLM은 강력하지만 명확한 한계를 지닌다. 모델은 학습 데이터가 생성된 시점에 지식이 고정되어 있어 최신 정보를 반영하지 못하여, 학습 데이터에 없는 사실에 대해 질문을 받으면 그럴듯한 거짓 정보를 만들어내는 환각(Hallucination) 현상을 보이기도 한다. RAG는 이러한 한계를 극복하기 위해 LLM을 외부의 최신 또는 전문 지식 베이스에 실시간으로 연결하는 기술적 해법이다.
RAG의 작동 방식
RAG는 사용자의 질문을 LLM에 직접 전달하기 전에, 관련 정보를 외부 데이터베이스에서 검색하여 보강하는 방식으로 작동한다. 사용자가 질의한 내용을 외부 지식 베이스 (공간 AI의 경우 공간정보 데이터베이스)에서 관련 정보를 검색한다. 가령 특정 객체의 위치 정보, 건물의 속성 데이터 등이 검색 대상이 된다. 검색된 최신 데이터는 증간 (Augmentation)이라는 과정을 통해 LLM에 전달될 프롬프트 (Prompt)에 컨텍스트 정보로 추가 된다. 즉 LLM은 질문과 사실 기반의 참고 자료를 제공받는다. 이 사실적인 컨텍스트를 바탕으로 “A 아파트는 B 공원에서 5분 거리에 있으며, 소음 수준이 낮고 반려동물 친화 정책을 시행하고 있습니다” 와 같은 정확하고 유용한 답변을 생성한다.
벡터 데이터베이스 : 의미 기반 검색의 핵심
RAG의 검색 단계에서 핵심적인 역할을 하는 것이 바로 벡터 데이터베이스다. 기존의 키워드 기반 검색과 달리, 벡터 데이터베이스는 데이터의 ’의미‘를 기반으로 검색을 수행한다.
- 임베딩 (Embeddings) : 텍스트, 이미지, 위치 정보 등 다양한 형태의 데이터를 그 의미적 본질을 포착하는 고차원의 숫자 벡터로 변환하는 기술이다.
- 유사도 검색 (Similarity Search) : 벡터 데이터베이스는 이러한 임베딩 벡터들을 저장하고, 특정 쿼리 벡터와 가장 ’가까운‘ 벡터 들을 신속하게 찾아낸다. 여기서 ’가깝다‘는 것은 의미적으로 유사하다는 뜻이다. 예를 들어 “조용한 오후에 책 읽기 좋은곳”이라는 쿼리는 ’도서관‘, ’식물원‘, ’한적한 카페‘ 등의 벡터와 가깝게 위치하게 된다.
- 공간 데이터 검색의 혁신 : 벡터 데이터베이스는 RAG의 검색 단계에서 자연어 쿼리의 의도를 벡터로 변환한 뒤, 방대한 공간 데이터베이스 내에서 의미적으로 가장 부합하는 데이터를 찾아내는 역할을 수행한다. 이는 과거에 PostGIS와 같은 전문적인 쿼리 언어로만 가능했던 복잡한 공간 검색을 일반 사용자의 자연어 질문으로 간으하게 만드는 혁신이다. 결국 RAG와 벡터 데이터베이스는 인간의 유연하고 비정형적인 언어 세계와 컴퓨터의 엄격하고 구조화된 데이터 세계를 잇는 범용 번역기이자 ‘현실을 위한 API’로 기능하며, 정교한 위치 기반 애플리케이션 개발의 진입 장벽을 극적으로 낮추고 있다.
그림 1. 공간정보 분야 인공지능 모델의 발전
글로벌 선구자들과 혁신 사례
공간 AI와 LLM의 융합은 이미 다양한 산업 분야에서 구체적인 서비스와 플랫폼으로 구현되며, 그 가치를 입증하고 있다. 글로벌 기술 기업들은 이 새로운 시장을 선점하기 위해 각기 다른 전략적 접근을 통해 혁신을 주도하고 있다.
1. 대화형 내비게이션과 차량 내 경험 (Mapbox MapGPT)
글로벌 위치 데이터 플랫폼 기업인 맵박스 (Mapbox)가 선보인 MapGPT는 이러한 변화를 상징적으로 보여주는 사례다. MapGPT는 소비자가 직접 사용하는 애플리케이션이 아니라, 자동차 제조사들이 자사의 차량에 맞춤형 AI 비서를 탑재할 수 있또록 제공하는 B2B 플랫폼이다. 핵심 기능은 맵박스의 핵심 역량인 실시간 위치 데이터와의 깊은 통합에서 나온다
- 실시간 데이터 연동 : 실시간 교통 정보, 관심 장소 (POI) 데이터 등 맵박스의 살아있는 데이터를 기반으로 상황에 맞는 답변을 제공한다
- 자연어 상호 작용 : “코엑스로 가자”와 같은 명확한 명령뿐만 아니라, “이 근처에 주차기 편하고 평점 좋은 이탈리엔 레스토랑 좀 찾아줘”와 같은 모호하고 복합적인 질문도 이해하고 처리한다.
- 차량 시스템 통합 : 차량의 배터리 잔량, 실내 온도 등 차량 시스템과 연동하여 “가장 가까운 급속 충전소를 찾아주고, 도착할 때 쯤 실내 온도를 22도로 맞춰줘” 와 같은 차량 제어 명령까지 수행할 수 있다.
- 오프라인 기능 : 인터넷 연결이 끊긴 상황에서도 내장된 ‘소형 LLM’을 통해 집으로 길안내와 같은 필수적인 기능을 수행한다.
MapGPT는 단순한 길 안내 도구를 넘어, 운전자의 여정 전반을 지원하는 ‘대화형 부조종사 (Conversational Copilot)’를 지향한다. 이는 모빌리티 내의 서비스 패러다임을 바꾸고 있다.
그림 2. Mapbox의 MapGPT 이미지
2. Google의 Geospatial Reasoning Framework
구글은 자사의 방대한 자산을 결합하여 이 분야를 선도하고 있다. ‘Geospatial reasoning’ 프레임워크는 구글의 파운데이션 모델 (Gemini 등)과 거대한 공간 데이터 플랫폼 (Google Earth, Google Maps)를 통합하려는 연구 프로젝트다. 이 프레임워크의 핵심은 에이전트 워크플로우 (Agentic Workflow)이다. 사용자가 “최근 허리케인으로 인한 이 지역 재산 피해액을 추산해줘”와 같은 복잡한 질문을 던지면, Gemini가 계획을 수립하고, 위성 이미지 분석, 인구 통계 데이터 조회, 부동산 가치 데이터 분석 등 여러 단계를 순차적으로 실행한 후 종합적인 답변을 생성한다. 이는 AI가 스스로 문제를 해결하기 위해 여러 도구와 데이터를 자율적으로 사용하는 능동적인 에이전트로서 기능함을 보여준다. 최근에는 구글 딥마인드에서 새로운 AI 모델인 알파어스 파운데이션 (AlphaEarth Foundations)을 공개하여 지구 관측 각종 데이터를 분석해 과학자와 연구자가 지구를 더 정확하고 효율적으로 지도화(매핑)하고 모니터링할 수 있도록 하고 있다.
그림 3. Deepmind Earth Foundation Model 데이터
3. 산업별 적용 예시
공간 AI와 LLM의 융합 기술은 특정 플랫폼을 넘어 다양한 산업 현장에서 구체적인 문제 해결에 기여하고 있다.
- 스마트시티 : AI 기반 교통 관리 시스템은 실시간 교통량에 따라 신호 체계를 최적화하고, 재난 관리 시스템은 과거 데이터와 실시간 센서 정보를 분석하여 침수나 산사태 위험이 높은 지역을 예측하고 최적의 대피 경로를 제시한다. 여기에 LLM이 결합되면, 도시 계획가나 일반 시민이 "새로운 쇼핑몰이 들어설 경우, 주변 지역의 교통량과 소음에 어떤 영향을 미칠지 시뮬레이션해줘"와 같은 질문을 통해 도시 정책 결정 과정에 더 쉽게 참여할 수 있게 된다. 최근 서울시는 대화형 S-Map을 시범 서비스로 출시하여 LLM과 공간정보를 융합하여 시 행정에 이용하고 있다.
그림 4. 서울시의 대화형 S-Map 서비스
- 물류 및 공급망 최적화 : UPS의 'ORION' 시스템과 FedEx의 'Sense Aware'는 실시간 교통, 날씨, 차량 상태 데이터를 종합하여 최적의 배송 경로를 동적으로 계산한다. 월마트와 DHL은 AI를 활용해 재고 수준을 예측하고 스마트 물류 센터의 자동화 로봇을 제어한다. LLM의 융합은 "싱가포르 항구 폐쇄와 인도양 기상 예보를 고려할 때, 우리 선단의 탄소 배출을 최소화하는 대체 항로는 무엇인가?"와 같은 더욱 복잡하고 전략적인 질문에 대한 답을 찾는 것을 가능하게 한다.
공간 AI와 LLM의 융합은 디지털 정보와 물리적 공간이 ‘대화형 현실’이라는 새로운 인터페이스를 통해 매끄럽게 연결되는 패러다임의 시작을 알린다. 이는 단순한 기술적 결합을 넘어, 우리의 일상과 산업. 그리고 사회 시스템 전반에 걸쳐 혁신을 촉발할 잠재력을 지나고 있다. 글로벌 GeoAI 시장은 2033년까지 약 11억 달러 규모로 성장할것으로 예측되며, 연평균 성장률 (CAGR)은 약 30%에 달할 것으로 전망된다. 이 거대한 시장의 주도권을 확보하기 위한 경쟁은 이미 시작되엇다.
궁극적으로 공간 AI – LLM 시대의 경쟁력은 각국의 고유하고 문화적으로 미묘한 차이를 담은 데이터를 기반으로 한 파운데이션 모델을 직접 소유하고 훈련시킰 있는 능력, 즉 데이터 및 모델 주권 (Data and Model Sovereignty)에 의해 좌우될 것이다. 북미 데이터로 주로 학습된 모델은 한국의 도시 구조, 사회적 규범, 언어적 맥락을 온전히 이해하기 어렵다. 공공 안전. 도시 계획, 국방과 같은 국가 핵심 분야에서 해외 기업이 통제하는 모델에 의존하는 것은 심각한 안보 및 전략적 리스크를 야기할 수 있다.
*참고 문헌