연속성 데이터 분석을 위한 스트리밍 데이터 마이닝 연구
暂无分享,去创建一个
데이터 마이닝(Data Mining)은 환경으로부터 수집된 데이터에서 패턴을 추출하고 의미 있는 정보를 발견하기 위하여 주로 사용된다. 하지만, 기존의 방법은 데이터가 수집이 완료된 상태에서 분석하는 것을 기반으로 하고 있다. 본 논문은 연속성(Continuity data), 대량성(Large scale) 그리고 패턴의 가변성(Changed pattern)과 같은 특성을 가지는 스트림 데이터(Stream Data)의 분석을 위한 스트리밍 의사결정 트리(Streaming Decision Tree : SDT) 방법을 소개한다. SDT는 임계구역에 따라 의사결정트리 학습을 이용하여 규칙을 추출하고, 규칙의 발생 시간, 빈도 그리고 모순 요소를 이용하여 결합에 반영하였다. 실험에서는 시계열 데이터를 이용하여 분석하였고, 유효성을 확인하였다.