DW모델링

DW모델링의 정의
대용량의 데이터를 다양한 관점에서 빠른 성능으로 분석할 수 있도록 구성하는
데이터분석관점의 모델링기법입니다.
데이터웨어하우스 구성
데이터웨어하우스 영역을 업무 및 기능별로 ODS 영역, DW 영역, DM 영역 등으로 구성합니다.
이는 데이터웨어하우스 독립성을 보장함으로써, 영업분석시스템의 데이터 측면의 일관성 및 유지보수 편의성을
극대화하기 위한 방안입니다.
데이터마트 모델링 절차
데이터마트 구축을 위해서는 우선적으로 보고서의 분류항목, 분류세부항목 및 대상항목을
구분된 마트영역을 정리하여 분석 관점(Dimension)과 관심 항목(Fact)를 도출합니다.
이후 공통 차원을 설계하여 요건별 통합된 마트 및 요약설계를 진행 합니다.
  • DW모델링의 특징
  • DW자체에 대한 데이터모델을 일반적인 ERD형태로 표현할 수도 있고 Star Schema 와 Snow Flake Schema로 표현할 수도 있습니다. 일반적으로는 Star Schema와 Snow Flake Schema등의 다차원모델링 기법을 사용하여 설계합니다. OLTP 데이터 모델은 비즈니스 수행 과정에서의 트랜잭션 처리를 원활하게 처리하고 관리하는 것을 목표로 합니다.
  • DW모델링 유형
  • EDW : ER모델링 기법을 적용하지만 차이점은 운영계시스템으로부터 Reverse Modeling 과정을 거침
  • Data Mart : 다차원 모델링 기법 적용
  • Reverse Modeling의 목적
  • 현행 시스템의 형상화로 운영계 시스템의 데이터실체와 데이터구조 파악 가능
  • 사용되고 있는 물리적인 스키마로부터 리버스 모델링을 수행하는 과정에서 변경,추가된 항목을 도출 가능
  • EDW Data Model의 기초자료로 이용하여 분석작업의 효율화를 이룰 수 있음
  • DW모델링시 고려사항
  • 운영DB나 업무규칙을 바탕으로 정확한 Business Rule을 추출하여 데이터웨어하우스 데이터모델의 기본 골격을 결정
  • 정보요구나 보고서를 바탕으로 데이터의 정보요건을 추출
  • DW 데이터모델이 데이터마트의 정보요건을 적절히 지원할 수 있도록 모델 정비
  • ODS 영역
  • 소스 시스템으로부터 분석 계층의 최하위 레벨의 데이터 보관
  • 최소한의 정제 작업 수행
  • DW 영역
  • 주제영역별 데이터 분류
  • 기준정보, 이력정보, Snapshot 등의 데이터를 저장하는 공간
  • 고차원 분석을 위한 기반 데이터 제공
  • DM 영역
  • OLAP/ 비정형 데이터 지원을 위한 다양한 목적별마트를 제공하여 분석의 효율성을 높이기 위한 분석 영역
  • 정형, 비정형 분석 지원
  • 모델링 기법 – 다차원모델 (Star Schema, Snowflake Schema)
  • 목적별로 Aggregation된 Fact 제공
  • 분석 요건
    기준 팩트 테이블
  • 분석화면 요건을 기준으로 팩트 테이블을 설계
    (차원,속성 및 Measure 정의)
  • -> 데이터의 수준에 따라 통합(비정규화)
  • 차원 테이블의
    설계
  • 차원 테이블을 정의하며 DM에서 필요한 경우 코드를 추가하여 코드로 관리
  • -> 일반적으로 Master Table을 차원화
  • 공통 차원의
    구현
  • 분석영역 또는 Fact 테이블간 공통 차원을 설계하여 반영
  • -> Fact-Fact 조인을 통한 교차분석 기능의 제공하는 모델링
  • 팩트 테이블의
    데이터 변환
  • Transaction 데이터의 변환 및 차원 테이블의 정규화(Snow-flake 모델)
  • -> 이력 데이터를 위해 속성 정보가 팩트 테이블에 존재
  • 요약 설계
  • 팩트 테이블에 대해 조회 성능을 높이기 위한 요약 테이블 (기간별, 조직별 등)
  • -> 대량의 Fact Table을 대상