Data Governance Study - Data Current Status Analysis

데이터 현황 분석

성공적인 데이터 거버넌스 구축을 위한 기반을 마련하는 중요한 과정이다
저자

Kwangmin Kim

공개

2024년 08월 10일

0.1 데이터 거버넌스 구현 단계

현황 분석 및 요구사항 정의

  • 분석 범위 및 목표 설정
    • 목적: 분석의 범위와 목표를 명확히 정의
    • 활동
      • 분석 대상 데이터 영역 정의 (예: 고객 데이터, 재무 데이터 등)
      • 분석의 깊이와 기간 설정
      • 주요 이해관계자와 목표 합의
    • example
      • 다른 거버넌스 프로젝트의 실폐 사례로 많이 언급되는 것이 광범위한 범위 설정으로 인해 실무진들이 수습을 못함
      • 본인의 경우, 자사에서 실현가능한 범위를 설정하기 위해 전사보다는 3개의 system과 연관된 데이터에 대해서 표준화를 진행
      • 범위 축소: 3개의 system과 연관된 데이터베이스 (전사보다는 8개의 팀이 사용하는 DB에 한정시킴)
      • 각 system에 속해있는 DB를 조사 및 파악하여 정보계 DB와 운영계 DB로 구분한다.
      • 범위 축소: 운영계 DB는 SCOPE에서 제외시키고 정보계 DB 표준화에 집중
      • 이 축소된 범위의 표준화를 성공하여 업무에 대한 효율성 best practice를 타부서에 제시하여 data governance에 대한 협조를 얻고 거버넌스 문화를 조성
      • 다른 시스템으로 점차적으로 확대함
  • 데이터 인벤토리 작성
    • 목적: 조직 내 모든 주요 데이터 자산을 파악
    • 활동
      • 데이터 소스 식별 (데이터베이스, 파일 시스템, 외부 소스 등)
      • 데이터 세트별 메타데이터 수집 (소유자, 용도, 볼륨, 갱신 주기 등)
    • 도구: 데이터 카탈로그 도구, 스프레드시트
    • example
      • NAS 및 local에 있는 데이터 및 file은 우선 순위 설정에서 3순위로 지정
      • DBMS에 정의된 데이터를 1순위로 지정하여 inventroy 작성
      • Database 정보 작성 (DBMS 종류, 실무자, url, password, account 정보 등)
  • 데이터 프로파일링
    • 목적: 데이터의 구조, 내용, 품질을 분석
    • 활동
      • 데이터 구조 분석 (스키마, 데이터 타입 등)
      • 기술 통계 생성 (유니크 값 수, 최소/최대값, 평균, 중앙값 등)
      • 데이터 패턴 및 이상치 식별
    • 도구: IBM InfoSphere Information Analyzer, Informatica Data Quality, Talend Open Studio
  • 데이터 흐름 맵핑
    • 목적: 데이터의 생성, 이동, 변환, 소비 과정을 파악
    • 활동:
      • 데이터 흐름도 작성
      • 주요 데이터 통합 지점 식별
      • 데이터 중복 및 불일치 지점 파악
    • 도구: 데이터 흐름 다이어그램 도구 (예: Lucidchart, draw.io)
    • example
      • 본인은 회사에서 A Query Tool을 사용하여 이를 활용하고 있음
  • 데이터 관리 프로세스 평가
    • 목적: 현재의 데이터 관리 프로세스의 효과성을 평가
    • 활동:
      • 데이터 생성, 저장, 사용, 폐기 프로세스 검토
      • 데이터 품질 관리 프로세스 평가
      • 데이터 보안 및 접근 제어 프로세스 검토
    • 방법: 프로세스 워크숍, 인터뷰, 문서 리뷰
  • 규제 준수 상태 점검
    • 목적: 현재의 데이터 관리 관행이 관련 규제를 준수하는지 확인
    • 활동:
      • 관련 데이터 규제 식별 (예: GDPR, CCPA, 산업별 규제)
      • 현재의 준수 상태 평가
      • 주요 갭 및 리스크 식별
    • 방법: 규제 체크리스트, 컴플라이언스 감사
  • 기술 인프라 평가
    • 목적: 현재의 데이터 관리 기술 인프라를 평가
    • 활동:
      • 데이터 저장 및 처리 시스템 인벤토리 작성
      • 데이터 통합 및 품질 관리 도구 평가
      • 메타데이터 관리 및 데이터 보안 도구 검토
    • 방법: IT 인프라 평가 체크리스트, 기술 스택 다이어그램
  • 조직 및 거버넌스 구조 분석
    • 목적: 현재의 데이터 관련 의사결정 및 책임 구조를 파악
    • 활동
      • 데이터 관련 역할 및 책임 맵핑
      • 현재의 데이터 거버넌스 체계 (있다면) 평가
      • 데이터 관련 의사결정 프로세스 분석
    • 도구: 조직도, RACI 매트릭스
  • 이해관계자 인터뷰 및 설문조사
    • 목적: 다양한 이해관계자의 관점과 요구사항을 수집
    • 활동:
      • 주요 이해관계자 그룹 식별 (경영진, 데이터 소유자, 사용자 등)
      • 인터뷰 및 설문 설계
      • 결과 분석 및 주요 인사이트 도출
    • 방법: 구조화된 인터뷰, 온라인 설문조사
  • 분석 결과 종합 및 보고서 작성
    • 목적: 모든 분석 결과를 종합하여 현황을 포괄적으로 파악
    • 활동:
      • 주요 발견사항 정리
      • 강점, 약점, 기회, 위협 (SWOT) 분석
      • 개선 영역 및 우선순위 도출
    • 산출물: 종합 현황 분석 보고서, 경영진 요약 보고서

Subscribe

Enjoy this blog? Get notified of new posts by email: