[AI]KAIST, 세계 최초 한국어 AI 댓글 탐지 기술 개발…98.5% 정확도로 여론 조작 차단

jyseo@gscampus.net
2025-07-02
조회수 1627


한국과학기술원(KAIST)이 인공지능(AI)이 생성한 한국어 댓글을 98.5%의 정확도로 탐지할 수 있는 세계 최초의 기술 'XDAC'을 개발했다고 발표했다. 김용대 KAIST 전기·전자공학부 교수와 고우영 국가보안기술연구소 선임연구원이 공동 개발한 이 기술은 급속도로 확산되는 AI 기반 여론 조작 문제에 대한 획기적 해결책으로 주목받고 있다.


AI 댓글, 360개를 360원에 생성하는 시대

연구진이 이번 기술을 개발하게 된 배경에는 생성형 AI의 급속한 발전과 이를 악용한 여론 조작 우려가 있다. 현재 OpenAI GPT-4o API를 기준으로 댓글 1개 생성 비용은 약 1원에 불과하다. 국내 주요 뉴스 플랫폼의 하루 평균 댓글 수인 20만 개를 생성하는 데 단 20만 원만 있으면 가능하다. 고우영 선임연구원은 "10초 만에 감정과 언어를 바꿔가며 360개의 댓글을 생성할 수 있고, 비용은 360원에 불과하다"고 설명했다.

더욱 심각한 문제는 사람조차 AI 생성 댓글을 정확히 구별하기 어려운 수준에 이르렀다는 점이다. 연구팀이 210개 댓글을 대상으로 실험한 결과, AI 생성 댓글의 67%를 사람이 작성한 것으로 착각했다. 오히려 AI 생성 댓글이 기사 맥락 관련성(95% vs 87%), 문장 유창성(71% vs 45%), 편향성 인식(33% vs 50%)에서 사람 작성 댓글보다 더 좋은 평가를 받았다.

1572745ae85d0.jpg


"ㅋㅋㅋ" vs 이모지, AI 댓글의 결정적 차이점

기존 AI 생성 글 탐지 기술은 대부분 영어로 된 장문의 정형화된 글을 기반으로 개발돼 평균 51자의 짧은 한국어 댓글에는 적용이 어려웠다. 연구팀은 14종의 다양한 LLM(대규모 언어모델)을 활용해 실제 이용자 스타일을 모방한 한국어 AI 생성 댓글 데이터셋을 구축하고, 설명 가능한 AI(XAI) 기법을 적용해 언어 표현을 정밀 분석했다.

그 결과 AI 댓글에는 사람과 구분되는 고유한 말투 패턴이 존재함을 확인했다. AI는 "~것 같다", "~에 대해" 등 형식적 표현과 높은 접속어 사용률을 보인 반면, 사람은 반복 문자(ㅋㅋㅋㅋ), 감정 표현, 줄바꿈, 특수기호 등 자유로운 구어체 표현을 즐겨 사용했다. 특히 서식 문자(줄바꿈, 여러 칸 띄어쓰기 등) 사용에서 사람 작성 댓글의 26%는 이런 서식 문자를 포함했지만, AI 생성 댓글은 단 1%만 사용했다.

특수문자 사용에서도 차이가 뚜렷했다. AI는 전 세계적으로 통용되는 표준화된 이모지를 주로 사용하는 반면, 사람은 한국어 자음(ㅋ, ㅠ, ㅜ 등)이나 특수 기호(♡, ★ 등) 등 문화적 특수성이 담긴 다양한 문자를 활용했다. 반복 문자(ㅋㅋㅋㅋ, ㅎㅎㅎㅎ 등) 사용 비율도 사람 작성 댓글이 52%로, AI 생성 댓글(12%)보다 훨씬 높았다.


현실에서도 확인된 AI 댓글 공작의 실체

연구진이 XDAC 기술로 2023년 1월부터 2024년 8월까지 수집된 네이버 뉴스 댓글 524만 개를 실제 분석한 결과, 약 2.1%인 10만 8000여 개가 AI 생성 댓글로 판명됐다. 이 중 높은 확률로 분류된 2만 7000개의 댓글이 AI 생성 댓글로 최종 식별됐다. 특정 사용자 ID군이 반복적으로 댓글을 생성한 정황도 포착됐다.

XDAC 기술은 AI 생성 댓글 탐지에서 98.5% F1 점수를 기록해 기존 연구 대비 68% 성능을 향상시켰으며, 어떤 AI 모델이 댓글을 생성했는지도 84.3%의 확률로 식별할 수 있다. 이 가운데 LG 엑사원 모델은 댓글 작성 레이블 재현율에서 88.7%의 높은 수치를 기록했고, 챗GPT는 레이블 예측 정밀도에서 86.3%로 우수한 성능을 보였다.


923e635711a44.jpg


글로벌 AI 탐지 기술과의 차별화

해외에서도 AI 생성 텍스트 탐지 기술 개발이 활발하다. 오픈AI는 자체적으로 GPT 사용 여부를 탐지할 수 있는 기술을 개발해 99.9% 정확도를 주장하고 있지만, 영어 기반에 최소 250자 이상을 요구한다는 한계가 있다. 국내에서도 무하유가 2023년 6월 한국어 기반 생성형 AI 감지 서비스 'GPT 킬러'를 선보였지만, 주로 긴 문서 작성에 특화되어 있어 짧은 댓글에는 적용이 어려웠다.

미국 캔자스대학교 연구진이 개발한 논문 탐지 도구는 99% 정확도로 AI 생성 논문을 구분할 수 있지만, 이 역시 장문의 학술 논문에 국한된다. 반면 XDAC는 평균 51자의 한국어 댓글에 특화되어 설계된 최초의 탐지 기술로, 기존 도구들과 차별화된다.


한계와 향후 발전 방향

XDAC 기술도 일정한 한계가 있다. 줄바꿈, 띄어쓰기, 특수문자 등을 인위적으로 조작하면 탐지율이 낮아질 수 있다. 고우영 선임연구원은 "한국인의 표현 패턴을 수작업으로 조건에 맞춰 입력하면 탐지가 어려워질 수 있다"면서도 "그럼에도 AI 악용을 억제하고, 악용 시 추가 작업이 필요하게끔 만드는 '심리적 저항선'을 형성했다는 점에서 큰 의미가 있다"고 강조했다.

연구팀은 현재 기술의 확장 가능성을 놓고 후속 연구를 검토 중이다. 뉴스 포털뿐만 아니라 유튜브 등 동영상 플랫폼에 달린 댓글에도 이 기술을 적용하고, 시스템을 더욱 정교하게 고도화할 계획이다. 향후에는 댓글뿐 아니라 대댓글, '좋아요' 등의 반응 요소까지 포함해 AI 에이전트의 행동 특성을 분석하고, 나아가 AI가 인간을 설득할 수 있는지 여부까지 실험할 계획이다.

김용대 KAIST 교수는 "LLM이 계속 진화하는 만큼 이번 연구는 그 첫걸음에 불과하다"며 "향후 상용화 가능성뿐만 아니라, AI가 사람의 생각을 변화시킬 수 있는지에 대한 근본적인 질문에도 답을 찾기 위해 후속 연구를 이어갈 것"이라고 밝혔다.


이번 연구 결과는 다음 달 오스트리아 빈에서 열리는 컴퓨터 분야 국제학술대회 'ACL 2025'에서 발표될 예정이며, 궁극적으로는 AI를 이용한 여론 조작을 막는 데 기여할 것으로 기대된다