Data Governance Study - Data Standard Governance

데이터 표준 관리: 조직의 데이터 품질과 일관성을 위한 핵심 전략

이 블로그 포스트에서는 데이터 표준 거버넌스의 중요성과 구성 요소를 이야기한다. 데이터 표준관리의 목적과 정의, 주요 정제 및 개선 사항을 소개하고, 데이터 표준화의 필요성을 다각도로 살펴본다. 또한 데이터 표준화 요소 간의 관계를 설명하며, 표준 데이터와 구조 데이터의 개념을 설명한다.
Data Governance
저자

Kwangmin Kim

공개

2024년 08월 11일

1 Data Standard Governance

1.1 데이터 표준관리 목적

  • 각 데이터 항목에 대한 명명 규칙을 정의
  • 표준단어 및 표준용어, 표준도메인, 표준코드 등을 전사관리기준 형태로 정의
  • 이러한 표준들을 변경 및 관리하는 활동 수행

1.2 데이터 표준관리 정의

데이터 표준관리는 데이터 항목들에 대해서 전사적으로 일관된 명명과 정의를 부여하고 이를 정제, 개선하는 활동이다.

1.3 주요 정제 및 개선 사항

데이터 표준관리에서 중점적으로 다루는 정제 및 개선 사항은 다음과 같다:

대상 정제 및 개선 결과물
명칭 + 정의 단어 및 용어
형식 도메인
규칙 코드

이러한 표준화 활동을 통해 조직 전체에서 일관된 데이터 관리가 가능해진다.

1.4 필요성

1.4.1 메타데이터 관리

  • 각 용어에 대한 부가 정보(예: 데이터 타입, 길이, 허용 값 등)를 관리할 수 있다.
  • 데이터의 의미와 구조에 대한 종합적인 이해를 제공한다.

1.4.2 커뮤니케이션 개선

  • 비즈니스 사용자와 IT 전문가 사이의 의사소통을 원활하게 한다
  • 동일한 데이터에 대해서는 동일한 명칭을 사용함으로써 개발자-현업, 운영자-현업, 운영자-운영자 등 다양한 계층간에 명확하고 신속한 의사소통이 가능
  • 편의나 관습에 따라 동일한 의미로 사용되는 이음동의어를 대표성을 지닌 한 개의 단어로 정의함으로써 의사소통과 데이터에 대한 인식의 오류를 방지할 수 있다
  • 용어의 오해로 인한 프로젝트 지연이나 오류를 방지한다.

1.4.3 데이터 정보 접근성 향상

  • 데이터 소재 파악의 시간 및 노력 감소
  • 즉, 정보 사용자는 데이터의 의미와 데이터의 위치 등을 신속하게 파악할 수 있어 적시에 정확한 정보를 활용

1.4.4 규정 준수

  • 데이터 관련 규제 요구사항을 충족하는 데 도움을 준다.
    • 데이터 관련 규제 요구사항: 데이터의 수집, 저장, 처리, 공유, 및 폐기와 관련된 법적, 규범적 기준을 의미
    • 데이터 보안, 개인정보 보호, 데이터 품질, 및 데이터 관리의 투명성을 보장하기 위한 규제
  • 데이터의 의미와 사용에 대한 명확한 문서화를 제공한다.
  • 데이터 규제 종류
    • GDPR (General Data Protection Regulation)
      • EU의 개인정보 보호법
      • 예시: 개인 데이터의 수집 및 처리에 대한 명시적 동의 요구, 데이터 삭제 권리(잊힐 권리) 보장
    • CCPA (California Consumer Privacy Act)
      • 캘리포니아 주의 소비자 개인정보 보호법
      • 예시: 소비자의 개인정보 접근 권리, 개인정보 판매 거부 권리
    • HIPAA (Health Insurance Portability and Accountability Act)
      • 미국의 의료정보 보호법
      • 예시: 환자 의료 정보의 비밀성 보장, 의료 정보 접근 로그 유지
    • PCI DSS (Payment Card Industry Data Security Standard)
      • 신용카드 정보 보호 표준
      • 예시: 카드 소지자 데이터의 암호화, 정기적인 보안 시스템 및 프로세스 검사
    • SOX (Sarbanes-Oxley Act)
      • 미국의 기업 회계 개혁법
      • 예시: 재무 보고의 정확성과 신뢰성을 보장하기 위한 데이터 관리 요구사항
    • 개인정보 보호법
      • 한국
      • 예시: 개인정보 수집 시 동의 획득, 개인정보의 안전한 보관 및 파기
    • 전자금융거래법
      • 한국
      • 예시: 전자금융 거래 기록의 보관 및 보안 요구사항
    • 정보통신망법
      • 한국
      • 예시: 개인정보 유출 시 신고 의무, 정보보호 관리체계 인증
    • 데이터 현지화 법률
      • 여러 국가
      • 예시: 러시아의 데이터 현지화법, 중국의 사이버보안법에 따른 데이터 현지 저장 요구
  • 이러한 규제 요구사항을 충족하기 위해서는 데이터의 정의, 분류, 처리 방법 등이 명확히 문서화되고 관리되어야 한다.
  • 표준 단어 사전은 데이터 요소를 일관되게 정의하고 분류하는 데 도움을 줌으로써, 규제 준수를 위한 기반을 제공한다.
  • 예를 들어, 개인식별정보(PII)가 무엇인지, 어떤 데이터 필드가 이에 해당하는지를 명확히 정의하고 관리할 수 있게 해준다.

1.4.5 데이터 품질 향상

  • 일관된 데이터 정의와 사용으로 전반적인 데이터 품질을 개선한다.
  • 데이터의 입력 오류를 예방함으로써 데이터의 품질을 향상
  • 데이터 통합과 분석의 정확성을 높인다.

1.4.6 지식 관리

  • 조직의 데이터 관련 지식을 체계적으로 축적하고 공유할 수 있다.
  • 신규 직원의 온보딩과 지식 전달을 용이하게 한다.

1.4.7 시스템 통합 지원

  • 서로 다른 시스템 간의 데이터 매핑과 통합을 지원한다.
  • 시스템 간 데이터 불일치 문제를 줄인다.
  • 데이터 변환, 정제 비용 감소: 데이터의 전송, 공유, 가공을 위해 정보시스템 간 또는 정보시스템 내에서 별도의 포맷 변환이나 정제 작업 불 필요

1.5 데이터 표준화 요소 간 관계

1.5.1 데이터 표준화의 기본 구성 요소

  • 데이터 표준관리 지침
  • 데이터 관리 가이드
  • 표준 데이터
  • 구조 데이터

각 요소는 서로 밀접하게 연관되어 있으며, 전체적인 데이터 거버넌스 체계를 형성한다.

1.5.2 데이터표준관리 지침

  • 데이터 표준을 정의하고 변경 관리하는 데 필요한 지침을 제공한다.
  • 조직 내에서 데이터 표준을 어떻게 설정하고, 유지하며, 업데이트할 것인지에 대한 가이드라인을 제시한다.

1.5.3 데이터 관리가이드

  • 데이터 표준, 구조, 흐름을 관리하기 위한 프로세스, 조직, 역할을 정의한다.
  • 이는 데이터 거버넌스의 실행 측면을 다루며, 누가 어떤 책임을 지고 데이터 표준화 활동을 수행할지 명확히 한다.

1.5.4 표준 데이터

표준 데이터는 실제 데이터 요소들을 표준화하는 핵심 부분이다. 여기에는 다음과 같은 세부 요소들이 포함됩니다

  • 표준 단어
    • 명칭 (한글/영문)
    • 영문약어
    • 단어 정의
    • 표준 단어를 기반으로 자료형을 정의하여 표준 단어 금칙어를 만든다.
  • 표준 도메인
    • 표준 단어를 기반으로 자료형을 정의하여 표준 도메인을 작성한다.
    • 데이터 타입 결정
    • 데이터 길이 결정
  • 표준 용어
    • 표준 단어, 자료형, 표준 도메인을 기반으로 용어를 정의한다.
    • 표준 단어 2개 이상의 조합으로 용어를 생성한다.
    • 표준 용어는 1개의 표준 도메인으로 구성된다.
  • 표준코드
    • 표준 도메인을 기반으로 유효값을 정의한다.
    • 유효값을 기반으로 코드값을 만들어낸다.
  • 제작 순서
    • 표준 단어 \(\rightarrow\) 표준 도메인 \(\rightarrow\) 표준 용어 \(\rightarrow\) 표준 코드 \(\rightarrow\) 코드 값

표준 단어와 표준 용어는 한국어에만 존재하는 개념으로 다른 외국어에는 없는 개념이다. 외국어는 형태소 분석이 한국어 만큼 세분화되어 있지 않아 표준 단어와 표준 용어가 합쳐진 개념인 데이터 카탈로그란 용어를 사용한다.

1.5.5 구조 데이터

  • 데이터 모델링의 영역이다.
  • 표준 데이터가 정의되면, 이를 바탕으로 실제 데이터 모델을 구축합니다. 이 과정은 크게 세 단계로 나뉜다:
    • 개념 데이터 모델
    • 논리 데이터 모델
    • 물리 데이터 모델
  • 개념 데이터 모델 + 논리 데이터 모델링을 통해 주제영역, 엔티티, 속성을 차례로 규명한다.
  • 물리 데이터 모델을 통해 엔티티를 물리적으로 구현한 테이블과 속성을 물리적으로 구현한 컬럼을 만들어낸다.

Subscribe

Enjoy this blog? Get notified of new posts by email: