Design of Information Search Integration Module Using Regular Expression and Correlation Analysis

1. 서론 PC속 정보들을 DB화하고 설정의 변경에 따라 원 하는 정보를 추출하는 것은 정보 검색 분야에서 가 장 기본적이며 핵심적인 부분이다. 그러나 지금까지 의 문자열 검색기법에 대한 연구는 문서의 특성에 따라 재설계하지 않고 기존의 알고리즘을 약간 수정 하거나 수정없이 결합하는 하이브리드 방식이 제안 되고 있다. 그러나 지식정보화로 인해 검색 대상이 되는 용량이 기하급수적으로 증가하고 필요한 자료 를 검색하는데 많은 시간이 낭비되고 있다. 또한, 기 존 패턴 및 데이터베이스 검색, 페이지 단위 문자열 검색기법은 단순 검색으로 오탐율이 많아 검색 결과 에 대한 신뢰성이 떨어지고, 동일 조건을 다른 검색 기법에 추가로 시행함으로 인해 자원 낭비 및 시간 낭비를 초래하고 있는 실정이다[1][2]. 최근에는 PC속 정보들의 검색에서 보안 기능이 추가, 강화된 기술은 새로운 수익원으로 부상하고 있으며 치열한 경쟁으로 성장기를 보이고 있는 기존 의 PC 검색 시장에서 정보들을 효율적으로 관리, 검 색하는 기술로 시장을 주도할 전망이다. 이와 같은 정보 검색 분야의 기술적 흐름속에서 IT 솔루션의 대부분 검색을 통해 추출하고자 하는 자료를 찾아내 는 기술의 도입에 있어 정규식 구문 기법과 상관 분 석 기법의 통합적 연계 개발 기술이 가져오는 파급 효과는 상당히 많을 것으로 판단된다. 또한, 정규식 구문 기법과 상관 분석 기법의 활용방안은 페이지 또는 파일, 블록 단위 검색에 대한 정책화를 통하여 개발사 의존적인 검색 알고리즘을 사용자 중심으로 전환할 수 있을 것이다[3][4]. 따라서 본 논문에서는 정규식 구문 기법과 상관 분석 기법의 통합적 연계 방식을 적용시켜 보안형 검색 모듈을 개발함으로써 기존의 문자열 검색 기법 의 문제로 지적되어 온 오탐율을 줄임으로써 경제적 인 효과 및 신뢰성을 확보하는 보안형 검색기술의 필요성을 충족시킬 수 있는 검색 모듈을 설계하고자 한다.