대용량 스팸 메일 처리를 위한 Hadoop 기반 분산 필터링 서비스 모델

정보사회의 급속한 발전으로 인하여 전자메일의 사용은 일반화 되었다. 하지만 현재 전자메일 사용량과 스팸 메일 증가는 여러 가지 문제점을 수반하고 있다. 수많은 정보를 교환하는 데에서 나타나는 대용량 데이터 처리 문제와 개인정보 악용에 따른 스팸 메일 관리의 어려움이 그 이유이다. 따라서 본 논문에서는 대량의 파일을 처리할 수 있는 프레임 워크인 하둡(Hadoop)을 이용하여 보다 효율적이고 향상된 성능을 갖는 스팸 메일 필터링 서비스 모델을 제안한다. 이를 위해 본 논문에서는 가장 많이 사용되고 있는 메일 서버인 샌드메일(Sendmail)과 하둡 프레임워크를 접목하여, 하둡 기반 분산 필터링 서비스 모델을 설계하였다.