1 Data Standard Governance > Data Standard Glossary
1.1 데이터 표준 용어 사전이란?
- 조직에서 사용되는 모든 데이터 관련 용어의 공식적인 정의를 제공하는 중앙 집중식 저장소이다.
- 업무상 사용되는 용어를 정보시스템에서 사용하는 기술적인 용어로 전환하여 이것을 일관되게 사용 할 수 있도록 정의한 것을 지칭한다.
- 각 용어의 의미, 사용 맥락, 형식 등을 명확히 기술한다.
- 표준용어는 표준단어와 표준도메인을 조합하여 구성하며 한 개의 표준도메인으로 구성된다.
- 모델링에서는 속성명으로 사용되며 전사관점에서 유일하다.
- 예시
- 표준 단어 (주제어): 장기
- 표준 단어 (수식어): 대여
- 표준 단어 (분류단어): 금액
- 표준 용어 : 장기대여금액
- 데이터 모델 (속성명): 장기대여금액 with datatype = NUMBER(10)
- 도메인: 금액N10
1.1.1 목적
- 데이터의 일관성을 확보하고 품질을 향상
- 조직 전체에서 데이터 용어를 일관되게 사용할 수 있도록 한다.
- 즉, 전사적으로 표준화된 용어를 사용함으로써 데이터 모델 구성 요소의 명칭을 부여하는데 일관성을 유지할 수 있다
- 시스템 간 데이터 통합과 매핑을 용이하게 한다.
- 표준화된 명칭을 부여함으로써 데이터의 중복 정의 방지와 의미 전달의 명확성을 확보하여 의사 소통을 원활하게 한다
1.1.2 주요 구성 요소
용어 논리명 (보통 한글)
- 논리명은 데이터의 의미를 나타내는 명칭으로 표준단어 명으로 구성된다.
- 용어 논리명의 최대길이는 30자로 한다. 단 20자 이내로 작성할 것을 권장한다
- 표준속성 구성 시 5개 단어를 넘지 않도록 하며, 구분자나 띄어쓰기 없이 한 단어로 붙인다 (월_계좌잔액(X) → 월계좌잔액)
용어 물리명 (보통 영어)
- 물리명은 단어의 영문 약어 조합으로 이루어지며 단어의 영문약어들끼리 연결 할 때는 언더바(_)를 사용한다.
- 용어의 물리명은 최종적으로 데이터베이스를 구성 할 때 테이블의 컬럼명으로 사용한다.
- 용어 물리명의 최대길이는 28자로 한다. 단 20자 이내로 작성할 것을 권장한다. (단, 용어 논리 및 물리명의 길이는 DBMS에 따라 달라질 수 있음)
정의
- 용어가 업무적으로 사용되는 의미를 기술한 내용이다.
도메인 정보
- 특정 비즈니스 컨텍스트에서 데이터 값의 허용 범위를 정의
- 즉, 데이터 값의 범위를 한정하는 데이터 타입과 길이,소수점을 의미한다.
- 데이터 타입을 포함하며, 추가적인 제약조건이나 비즈니스 규칙을 포함할 수 있습니다.
- 비즈니스 로직과 데이터 무결성 규칙을 포함할 수 있다.
- 예시
- 나이: INTEGER, 0-150 사이의 값만 허용
- 이메일: VARCHAR(100), 이메일 형식 검증 규칙 포함
- 급여: DECIMAL(10,2), 0보다 큰 값만 허용
데이터 타입 및 형식
- 데이터의 기본적인 저장 형태와 구조를 나타낸다.
- 일반적이고 기본적인 데이터 유형을 지정
- 보통 도메인 정보가 데이터 타입 및 형식 정보를 모두 포함한다.
- 예시
- 문자열(VARCHAR, CHAR)
- 숫자(INTEGER, DECIMAL)
- 날짜/시간(DATE, TIMESTAMP)
- 불리언(BOOLEAN)
코드
- 입력할 수 있는 유효 값 데이터 값을 정의할 수 있다면 용어는 코드와 매핑 한다.
관련 업무 영역
- 해당 용어가 주로 사용되는 비즈니스 또는 조직 내의 특정 부서나 기능 영역을 나타낸다.
- 목적: 용어의 사용 맥락을 제공하고, 해당 용어가 어떤 비즈니스 프로세스나 기능과 관련있는지 이해하는 데 도움을 준다.
- 예시
- “고객ID” - 관련 업무 영역: 고객 관리, 마케팅, 영업
- “재고수량” - 관련 업무 영역: 재고 관리, 물류, 구매
- “급여액” - 관련 업무 영역: 인사, 재무
사용 예시 등
- “생년월일” - 사용 예시: “1990-05-15”
- “주문상태” - 사용 예시: “접수”, “처리중”, “배송완료”
- “계좌잔액” - 사용 예시: “1,000,000원”
용어 사전 예시
용어 논리명 용어 물리명 도메인(인포타입) 코드 정의 관련 업무 영역 사용 예시 실험종료일자 EXPR_END_DATE 일자VC8 PCR 실험의 종료일자이다. YYYYMMDD로 작성한다. 실험관리, 품질관리 “20240315” 기기시리얼번호 INSTRMNT_SERIAL_NO 문자열VC30 Real Time PCR 기기의 고유 시리얼 번호이다. 장비관리, 실험관리 “787BR13738_BR205241” 시약제품명 REAG_PROD_NM 문자열VC30 실험에 사용되는 시약의 제품 이름이다. 실험관리, 제품관리, 품질관리 “SARS-CoV-2 D Plus”
1.1.3 기본 원칙
- 표준용어 작성 시 누구나 이해하기 쉽도록 간결하되 명확하고 모호함 없이 표현하도록 해야 하며, 다음과 같은 기본 원칙에 위배되지 않도록 한다.
| 순번 | 원칙 및 설명 | 예시 |
|---|---|---|
| 1 | • 표준용어는 관용적으로 사용하는 용어를 우선적으로 사용한다 | |
| 2 | • 표준용어를 구성할 때에는 가독성을 높이고, 의미를 명확히 전달하기 위해 수식어를 사용하여 구성하도록 한다. | 등록일자(X) → 장비자산등록일자(O) |
| 3 | • 용어 구성 시 단어는 반드시 표준 단어 사전에 등록된 단어를 사용하며, 단어 사전에 등록되어 있지 않은 경우에는 표준 담당자와 협의 후에 신규 단어로 등록하도록 한다. | 단어 부재 시 신규 요청 요망 |
| 4 | • 일반적인 의미와 전혀 다르게 사용된 용어는 적절한 다른 용어로 대체하고, 유사한 의미의 용어가 중복 개발되어 혼재되지 않도록 하며 새로운 용어의 개발은 자제한다. | 반환일자(X) 반납일자(O) |
| 5 | • 표준용어로 등록된 명칭의 전사적으로 사용되어야 함으로 명 선정 시 신중하게 고려하여야 한다 | |
| 6 | • 표준용어는 표준단어와 표준도메인을 조합하여 구성하며 한 개의 표준도메인으로 구성된다 | 렌탈 + 가능(X) 렌탈 + 가능 + 금액(O) |
| 7 | • 표준용어 명명 규칙 - 표준용어는 누구나 이해하기 쉽도록 구체적이고 명확하고 간결하게 정의한다 - 복합어를 단일어 보다 우선 적용한다 - 복합어가 중첩되어 사용될 경우 도메인이 포함된 복합어를 우선 적용한다 - 의미 있는 숫자를 포함한 용어의 경우에는 숫자를 포함하여 하나의 표준단어를 등록한 후 그 표준 단어를 사용하여 용어를 정의한다 - 용어의 의미를 모호하게 하는 의미 없는 일련번호를 부여하기 위한 숫자는 사용하지 않으며 용어에 수식어를 사용하여 용어가 유일하게 식별되도록 정의하는 것을 원칙으로 한다 |
1.1.4 구성 원칙
표준 용어 = 수식어 (표준 단어) + 주제어 (표준 단어) + \(\dots\) + 수식어 (표준 단어) + 주제어 (표준 단어) + 분류어
수식어 예시
수식어 예시 기간 수식어 최초, 최종, 과거, 최근 등 기간/시간 6개월, 당월, 월말, 년초, 년말 등 장소 국외, 국내, 지점, 본점 등 특징 순수, 사용, 처리, 거래 등 계산 합계: 한데 모아서 합산함
누계: 계속하여 덧붙여 합산함표준 용어 = 표준 용어 + 표준 도메인
원칙 항목 및 설명
순번 원칙 및 설명 예시 1 • 용어는 수식과 수식의 대상이 되는 단어가 여러 개 존재할 수 있고 도메인을 수식하는 분류어는 용어의 끝에 위치한다 2 • 수식어는 기간, 장소, 특징, 계산의 성격을 가지는 단어가 순서대로 위치하고 기간을 수식하는 단어는 맨 앞에 위치한다 3 • 수식어 중 계산의 성격을 가진 단어는 합계, 누계, 총합계, 총누계, 소계 중 하나를 선택하여 사용해야 한다. (도메인 그룹이 금액과 수량과 같이 계산이 필요한 도메인을 수식함) 4 • 대상이 되는 단어가 여러 개일 때는 중 범위가 큰 것 순서대로 용어의 앞부분에 위치한다 주의 사항
AS-IS 용어 (비권장) TO-BE 용어(권장) 비고 회사에게 하고 싶은 말 내용 사용자건의사항 서술형용어 공임금액구분별금액 공임구분별금액 단어 반복 법인번호 ?+법인등록번호 주제어 누락 및 약어 사용 상세순번 ?+상세일련번호 주제어 누락 수정자 ?+수정자+? 주제어 및 분류어 누락 스케줄추가(청구)정보 수정여부 스케줄추가정보수정여부 특수문자사용 요청일 장기렌트입고요청일자 주제어누락 운전자 렌트카운전자성명 주제어 및 분류어 누락
1.1.5 활용 원칙
| 순번 | 원칙 및 설명 | 예시 |
|---|---|---|
| 1 | • 표준용어에 적절한 명칭을 부여하고 전사적 공유가 가능하기 위해서는 구체적인 정의가 반드시 있어야 한다 - 표준용어정의는 활동을 나타내는 단어와 그 주체가 되는 단어와 무엇을 어떻게 했는지의 내용이 담겨 있어야 한다. |
대여차량입고일자: 렌트차량이 반환되어 차고지에 입고 된 일자이다. |
| 2 | • 표준용어의 명칭이 주는 의미가 불분명하면 좀더 상세하게 정의해야 한다. | 유효기간(X) → 회원멤버쉽유효기간(O) |
| 3 | • 동일한 의미의 용어가 중복되지 않도록 표준용어 구성 순서를 고려해 생성한다 | 현금서비스최종3개월 총합계금액(X) → 최종3개월 현금서비스 총합계금액(O) |
| 4 | • 표준용어의 한글명 또는 영문명 길이 제한으로 인해 축약된 형태로 사용해야 하는 경우 용어를 구성하는 단어 중 연관도와 활용도가 높은 단어들을 합하여 복합어를 정의해야 한다 | 고객차량등급^코드 → 고객차량등급코드 |
| 5 | • 표준용어 중 ‘여부’ 도메인으로 끝나는 것들은 대표로 하나의 코드명과 코드 값(Y, N)을 등록하여 모든 공통적으로 사용하도록 한다. | 코드일련번호 : B011 |
| 6 | • ‘계약번호’ 자체로는 그 의미가 불분명하여 대차계약번호, 유지보수계약번호 등으로 좀더 상세화하여 표준용어를 정의한다 | |
| 7 | • 일반적으로 ‘렌탈’은 ’자동차대여’를 말하는 것이나 ’렌탈’ 자체로는 그 의미가 불분명하여 단기렌탈, 장기렌탈 등으로 좀더 상세화하여 표준용어를 정의한다 | |
| 8 | • 신청사용자아이디 → 사용자아이디 에서 ’신청’의 단어처럼 생략해도 의미가 통하는 경우에는 표준용어는 축약된 형태로 정의한다 |
1.2 제작 과정
1.2.1 용어 수요 파악
- 각 업무 영역에서 필요한 용어들을 수집
- 기존 시스템, 문서, 보고서 등에서 사용 중인 비표준 용어들을 식별
1.2.2 용어 분석
- 수집된 용어들의 의미와 사용 맥락을 분석
- 유사하거나 중복된 용어들을 식별
1.2.3 표준 단어 매핑
- 분석된 용어들을 기존의 표준 단어 사전과 매핑
- 각 용어를 구성하는 단어들이 표준 단어 사전에 있는지 확인
1.2.4 용어 구성
- 표준 단어들을 조합하여 새로운 표준 용어를 구성
- 용어 구성 원칙(예: 수식어 순서, 도메인 위치 등)을 따른다.
1.2.5 용어 검증
- 구성된 용어가 의미를 명확히 전달하는지 확인
- 기존 표준 용어와 중복되지 않는지 검토
- 전문가나 제 3의 부서와 cross check
1.2.6 메타데이터 정의
- 용어의 정의, 사용 예시, 관련 업무 영역 등 상세 정보를 작성
- 용어와 관련된 도메인 정보를 지정
1.2.7 검토 및 승인
- 구성된 용어에 대해 관련 부서와 데이터 관리자의 검토를 받는다.
- 필요시 수정하고 최종 승인을 받는다.
1.2.8 표준 용어 등록
- 승인된 용어를 표준 용어 사전에 등록
- 용어의 물리명(영문명)을 생성
1.2.9 공지 및 교육
- 새로 등록된 표준 용어를 조직 내에 공지
- 필요시 사용 방법에 대한 교육을 실시
1.2.10 사용 모니터링
- 새로 등록된 표준 용어의 사용 현황을 모니터링
- 사용자 피드백을 수집
1.2.11 지속적인 관리
- 정기적 검토 및 피드백 수집
- 분기별로 용어 사전 검토 일정을 수립
- 사용자로부터 피드백을 수집하고, 사용 현황을 모니터링
- 변경 관리 프로세스 운영
- 용어 추가, 수정, 폐기를 위한 공식적인 변경 요청 프로세스를 구축
- 변경 요청에 대한 영향 분석을 수행하고, 승인 절차를 거친다.
- 업데이트 및 버전 관리
- 승인된 변경사항을 용어 사전에 반영
- 버전 관리를 통해 변경 이력을 추적하고, 주요 변경사항을 공지
- 교육 및 홍보
- 변경된 용어나 새로운 용어에 대한 교육을 실시
- 내부 커뮤니케이션 채널을 통해 주요 업데이트 사항을 공유
- 성과 측정 및 개선
- 용어 표준화로 인한 데이터 품질 개선, 업무 효율성 증가 등의 성과를 측정
- 측정 결과를 바탕으로 용어 관리 전략을 지속적으로 개선
1.3 표준 용어 사전 예시
- 예시
| 용어ID | 용어논리명 | 용어물리명 | 도메인 | 정의 | 관련업무영역 | 사용예시 | 표준단어구성 | 승인상태 | 등록일 |
|---|---|---|---|---|---|---|---|---|---|
| T001 | 고객번호 | CUST_NO | 일련번호VC10 | 고객을 유일하게 식별하는 번호 | 고객관리, 영업 | “C0001234567” | 고객(주제어) + 번호(분류어) | 승인 | 2023-01-15 |
| T002 | 장기렌트계약시작일자 | LTRM_RENT_CNTR_STRT_DT | 일자VC8 | 장기 렌트 계약이 시작되는 날짜 | 계약관리, 렌트관리 | “20230107” | 장기(수식어) + 렌트(주제어) + 계약(주제어) + 시작(수식어) + 일자(분류어) | 승인 | 2023-01-16 |
| T003 | 월별렌탈등록비합계금액 | MTHLY_RENT_RGST_FEE_TOT_AMT | 금액N15 | 한 달 동안의 렌탈 등록비 총액 | 재무, 렌트관리 | “5000000” | 월별(수식어) + 렌탈(주제어) + 등록(주제어) + 비(주제어) + 합계(수식어) + 금액(분류어) | 검토중 | 2023-01-17 |
* VC10: Variable Character의 약자로 가변 길이 문자열을 나타냄 (최대 10 자리)
* N15: N은 숫자(Numeric) 데이터 타입, 최대 15자리의 숫자
* D: Date (날짜)
* T: Time (시간)
* B: Boolean (참/거짓)
- 칼럼 설명
- 용어ID: 각 용어의 고유 식별자
- 용어논리명: 업무에서 사용되는 한글 용어명 (최대 30자, 권장 20자 이내)
- 용어물리명: 데이터베이스 등에서 사용되는 영문 약어명 (최대 28자, 권장 20자 이내)
- 도메인: 해당 용어의 데이터 타입과 제약조건
- 정의: 용어에 대한 명확한 설명
- 관련업무영역: 해당 용어가 주로 사용되는 업무 분야
- 사용예시: 실제 데이터 예시
- 표준단어구성: 용어를 구성하는 표준 단어들과 각 단어의 역할 (수식어, 주제어, 분류어)
- 승인상태: 용어의 현재 승인 상태 (예: 승인, 검토중, 폐기 등)
- 등록일: 용어가 사전에 처음 등록된 날짜
- 최종수정일: 용어 정보가 마지막으로 수정된 날짜