내용 기반 색인 및 검색을 위한 실시간 뉴스 비디오 파서의 설계 및 구현

뉴스 비디오 파싱(parsing)이란 내용 기반 뉴스 비디오 검색을 위한 핵심 기술로서, 대용량의 뉴스 비디오를 효율적으로 저장, 관리하고 사용자가 원하는 뉴스를 쉽게 검색할 수 있는 환경의 제공을 목적으로 하고 있다. 이러한 뉴스 비디오 파싱은 키 프레임의 자동 추출, 키 프레임의 자동 색인, 그리고 전체 뉴스 비디오의 구조화 등을 요소 기술로 하고 있다. 일반적으로 뉴스 비디오는 시간적으로 앵커 장면과 에피소드 장면(사건이 소개되는 장면)의 반복적인 구조로 정형화되어 있으며, 앵커 장면을 구성하고 있는 각 프레임은 공간적으로 앵커 부분과 소개될 사건에 대한 뉴스 아이콘 부분으로 구조화되어 있다는 특성이 있다. 본 논문에서는 이러한 뉴스 비디오의 시간적, 공간적 특성을 이용한 실시간 뉴스 비디오 파서를 제안하였다. 제안된 뉴스 비디오 파서는 크게 장면 분류, 뉴스 자막 인식, 계층적 뉴스 검색 도구 구성의 세 부분으로 구성된다. 장면 분류 부분에서는 뉴스 비디오로부터 키프레임을 추출하고, 에피소드 단위로 장면을 분류하기 위하여 뉴스 구성의 기준이 되는 앵커프레임을 추출한다. 뉴스 자막 인식 부분에서는 자막이 들어 있는 텍스트 프레임을 검출하고, 자막 부분의 문자열을 추출한 후, 각 문자를 인식한다. 마지막으로 계층적 뉴스 검색 도구의 구성 단계에서는 장면 분류 단계와 뉴스 자막 인식 단계에서 생성된 정보를 사용하여 뉴스를 계층적으로 구조화함으로써 사용자에게 효율적인 검색 환경을 제공한다.