top of page

ESB Research 2024년 8월호

이화여대 경영연구소

이 달의 논문_M. Park and S. Chai, "Constructing a User-Centered Fake News Detection Model by Using Classification Algorithms in Machine Learning Techniques," in IEEE Access, vol. 11, pp. 71517-71527, 2023, (채상미 교수(경영정보시스템 전공))

콘텐츠 기반 추천 시스템은 사용자에게 맞춤형 콘텐츠를 제공하며, 그동안 사용자 만족도를 높이는 데 큰 역할을 해왔습니다. 그러나 최근 이 시스템이 가짜 뉴스 확산의 주요 원인 중 하나로 지목되고 있습니다. 사용자가 과거에 '좋아요'나 댓글을 남긴 콘텐츠와 유사한 내용을 지속적으로 추천하는 방식 때문에, 뉴스의 진위 여부와 상관없이 가짜 뉴스가 반복적으로 피드에 노출되는 문제가 발생하고 있습니다. 특히, ChatGPT와 같은 생성형 AI의 등장으로 인해 가짜 뉴스는 더욱 정교하게 작성되며, 실제 뉴스와 구분하기가 점점 더 어려워지고 있습니다.

기존 연구들은 주로 가짜 뉴스의 언어적 특징이나 기사 구조를 분석하여 이를 탐지하려고 했습니다. 하지만 이런 접근법은 가짜 뉴스를 수용하거나 확산시키는 사용자들의 행동 특성과 가짜 뉴스가 퍼지는 소셜 미디어 네트워크의 복잡성을 충분히 반영하지 못하는 한계를 지니고 있습니다. AI 기술의 발전은 가짜 뉴스를 진짜 뉴스처럼 보이게 만드는 것을 매우 쉽게 만들었기 때문에, 단순히 표면적인 언어적 특징만으로는 가짜 뉴스를 효과적으로 탐지하기가 더욱 어려워지고 있습니다.

이러한 배경에서, 본 연구는 가짜 뉴스 탐지의 정확성을 높이기 위해 기존의 언어적 분석을 넘어서고자 했습니다. 연구에서는 콘텐츠의 시각적 특징, 가짜 뉴스를 생성하고 공유하는 사용자의 특성, 그리고 가짜 뉴스가 확산되는 소셜 미디어 네트워크의 특성을 종합적으로 고려한 새로운 탐지 모델을 제안했습니다. 다양한 기계 학습 기법을 적용하여 가짜 뉴스 탐지 성능을 극대화하는 것이 이 모델의 목표입니다.

이 연구에서는 먼저, XGBoost 알고리즘을 활용하여 가짜 뉴스 탐지에 유의미한 변수를 도출했습니다. 그런 다음, 도출된 변수를 바탕으로 로지스틱 회귀, 신경망, 랜덤 포레스트, 서포트 벡터 머신, 분류 및 회귀 나무와 같은 다양한 머신 러닝 모델을 사용해 가짜 뉴스를 구분하는 모델을 구축했습니다. 또한, 각 모델의 성능을 평가하기 위해 k-겹 교차 검증을 수행하고, 모델의 견고성을 강화하기 위한 에블레이션 연구도 진행했습니다. XGBoost는 변수의 중요도와 기여도를 반영하여 예측 성능을 향상시키는 데 효과적이었으며, 이를 통해 트위터 기반 가짜 뉴스 탐지에 필요한 주요 요인들을 파악하고 최적의 모델을 구축할 수 있었습니다.

연구 결과, 가짜 뉴스 탐지에 있어 감정 분석이 중요한 역할을 한다는 점이 밝혀졌습니다. 특히, 가짜 뉴스는 독자의 부정적인 감정을 자극하는 단어를 더 많이 사용하는 경향이 있어, 이런 감정적 성향을 분석하는 것이 매우 중요한 요소임을 확인했습니다. 또한, 랜덤 포레스트 모델이 다른 모델들보다 우수한 성능을 보였으며, 이를 통해 앙상블 모델이 단일 모델보다 더 높은 정확도를 가질 수 있음을 보여주었습니다. 하지만 이러한 앙상블 모델은 복잡성이 증가하고 해석이 어려울 수 있다는 점에서, 향후 설명 가능한 AI(XAI)와 같은 접근법을 통해 모델의 해석 가능성을 높이는 것이 필요하다고 봅니다.

이번 연구는 트위터를 통해 확산되는 가짜 뉴스를 탐지하기 위한 모델을 구축했지만, 다른 소셜 미디어 플랫폼에서는 다른 특성을 보일 수 있습니다. 따라서 향후 연구에서는 다양한 플랫폼에서 가짜 뉴스 데이터를 수집해 플랫폼 간의 차이를 줄이고, 연구 결과의 일반화를 도모할 필요가 있습니다. 또한, 연구는 영어로 작성된 가짜 뉴스 메시지에 초점을 맞췄기 때문에, 다양한 문화적 배경을 고려하지 못한 한계가 있었습니다. 향후 연구에서는 다양한 언어와 문화적 배경을 고려한 가짜 뉴스 탐지 모델의 개발이 필요합니다.

이 연구는 가짜 뉴스 탐지에 중요한 요소들을 반영한 AI 모델을 제안함으로써, 자동화된 가짜 뉴스 탐지 시스템 개발에 중요한 기초 자료로 활용될 수 있을 것입니다. 연구의 시사점은 감정 분석의 중요성, 변수의 상대적 중요성, 앙상블 모델의 우수성, 그리고 플랫폼 간의 데이터 차이를 극복하는 데 있습니다. 이를 통해 향후 더욱 정교하고 정확한 가짜 뉴스 탐지 시스템 개발이 가능할 것입니다.

bottom of page