728x90
반응형
1. 데이터 표준화 정의
- 시스템별로 산재해 있는 데이터 정보 요소에 대한 명칭, 정의, 형식, 규칙에 대한 원칙을 수립하여 이를 전사적으로 적용하는 것을 의미.
- 데이터의 정확한 의미를 파악할 수 있게 할 뿐만 아니라 데이터에 대한 상반된 시각을 조정하는 역할을 수행한다.
가) 데이터 명칭 : 해당 기업 내에서 데이터를 유일하게 구별해 주는 이름이다.
- 유일성
- 하나의 개념에 대해 모든 사용자들이 통일된 용어를 사용할 수 있도록 오직 하나의 명칭만을 허용해야 한다.
- ex) 고객 계좌번호, 고객 구좌번호 -> ‘고객 계좌번호’로 통일 - 업무적 관점의 보편성
- 구성원들이 해당 개념을 지칭할 때 가장 많이 사용하는 업무 용어를 그대로 사용하는 것이 바람직하다. - 의미 전달의 충분성
- 업무나 사용자의 관점에 따라 의미가 달라질 수 있는 이름은 수식어 등을 사용함으로써 구체화하는 것이 좋다.
나) 데이터 정의 : 데이터 정의는 해당 데이터가 의미하는 범위 및 자격 요건을 규정한다.
- 데이터 사용자가 데이터의 의미를 잘 이해할 수 있도록 관련 업무를 모르는 제삼자의 입장에서 기술한다.
- 서술식 정의만으로 데이터의 의미 전달이 어려울 경우에 실제 발생할 수 있는 데이터의 값도 같이 기술한다.
- 데이터 명칭을 그대로 서술하거나 약어 또는 전문 용어를 이용한 정의 기술은 가급적 사용하지 않는다.
다) 데이터 형식 : 데이터 형식은 업무 규칙 및 사용 목적과 일관되도록 정의한다.
- 데이터 타입
- Numeric
- Text
- Data
- Char
- Timestamp 등 - 데이터 길이 및 소수점 자리
- 도메인을 정의하여 데이터 표준에 적용함으로써 성격이 유사한 데이터 간의 데이터 형식을 통일화한다.
- 데이터의 최댓값 또는 최대 길이가 고정되어 있지 않을 경우 충분히 여유 있게 정의한다.
- 특수 데이터 타입(CLOB, Long Raw 등)은 데이터 조회, 백업, 이행 등에 있어서 제약 사항이 존재하는 경우가 많아 가급적 사용 x
라) 데이터 규칙 : 발생 가능한 데이터 값을 사전에 정의해 데이터의 입력 오류와 통제 위험을 최소화하는 역할
- 기본 값
- 사용자가 화면이나 프로그램으로부터 값의 입력도 없는 경우 데이터 타입에 따라 미리 정의된 기본값이 입력될 수 있도록 한다.
- 데이터 값의 입력을 생략했을 경우 자동으로 입력되는 데이터 값을 의미한다. - 허용 값
- 업무 규칙과 일관성을 갖도록 입력이 가능한 데이터 값을 제한하는 것으로 표준 코드 중 데이터 항목별로 가질 수 있는 코드 값을 사전에 정의하는 경우가 이에 해당한다. - 허용 범위
- 업무 규칙과 일관성을 갖도록 입력이 가능한 데이터 값을 범위로 제한하는 경우이다.
2. 데이터 표준
- 데이터 표준화를 추진하기 위해 수립해야 할 표준화 구성요소는 데이터 표준, 데이터 관리 조직, 데이터 표준화 절차이다.
가) 데이터 표준 : 일반적으로 데이터 표준으로 관리되는 대상에는 용어, 단어, 도메인, 코드가 있다.
- 표준 용어
- 업무적으로 사용하는 용어에 대한 표준을 정의함으로써 용어 사용 및 적용에 대한 혼란을 방지하고 원활한 커뮤니케이션을 촉진.
- 업무적 용어와 기술적 용어가 있다. - 업무적 용어
- 일상 업무에서 사용하는 용어로써 보고서나 업무 매뉴얼상에서 많이 나타난다.
- 업무적 용어의 표준화는 데이터 표준화 작업을 수월하게 해주는 장점이 있다.
- 업무적 용어 표준화의 예는 색인(INDEX)을 들 수 있다. - 기술적 용어
- 정보시스템에서 사용하는 용어를 지칭한다.
- 데이터 모델 또는 데이터베이스 스키마에서 나타나는 테이블명 및 칼럼명 등이 기술적 용어에 해당한다. - 표준 단어
- 표준 용어를 구성하는 단어에 대한 표준을 정의함으로써 용어에 대한 한글명과 영문명을 일관되게 정의할 수 있게 한다.
- 표준 단어를 관리함으로써 동일한 개념을 의미하는 용어(또는 표준용어)의 생성을 예방한다.
- 테이블 및 칼럼의 한글명만 작성하면 영문명은 표준 단어에 의해 자동으로 결정된다. - 표준 도메인
- 칼럼에 대한 성질을 그룹핑한 개념이다.
- 도메인은 크게는 문자형, 숫자형, 일자형, 시간형으로 분류할 수 있다.
- 도메인에 대한 표준을 정의함으로써 동일한 성질을 가진 칼럼의 데 이터 타입 및 데이터 길이를 일관되게 관리할 수 있다. - 표준 코드
- 코드는 도메인의 한 유형으로서 특정 도메인 값(코드값)이 이미 정의되어 있는 도메인이다.
- 코드에 대한 표준은 다른 표준과는 달리 데이터 값, 즉 코드값까지 미리 정의해야 한다. - 기타 데이터 표준 관련 요소
- 필요에 따라서 데이터 모델에서 정의하는 주제영역, 관계명과 데이터베이스에서 정의하는 데이터베이스, 데이터베이스 스키마, TABLESPACE, INDEX, CONSTRAINT 등에 대한 표준을 관리한다.
나) 데이터 표준 관리 조직
- 전사적으로 수립된 데이터 표준 원칙, 데이터 표준, 데이터 표준 준수 여부 관리 등을 위해서는 데이터 관리자(DA, Data Administrator)의 역할이 요구된다.
- 데이터 관리자 주요 역할
- 데이터에 대한 정책과 표준 정의
- 부서 간 데이터 구조 조율
- 데이터 보안 관리
- 데이터 모델 관리
- 데이터의 효율적인 활용 방안 계획 - 데이터 관리자 세부 역할
- 데이터베이스 관리자와 비교
다) 데이터 표준화 절차
728x90
반응형
'자격증 > 데이터아키텍처 준전문가(DAsP)' 카테고리의 다른 글
DAsP(3과목) 2-1. 데이터 표준화 원칙 정의 (32) | 2023.08.29 |
---|---|
DAsP(3과목) 1-3. 데이터 표준 관리 도구 (38) | 2023.08.28 |
DAsP(3과목) 1-1. 데이터 표준화 필요성 (37) | 2023.08.27 |
DAsP(2과목) 4-3. 정보 요구 보완 및 확인 (34) | 2023.08.25 |
DAsP(2과목) 4-2. 추가 및 삭제 정보 요구 사항 도출 (32) | 2023.08.25 |