728x90
반응형
1. 속성 개념
가) 속성 정의
- 엔터티에서 관리되는 구체적인 정보 항목으로 더 이상 분리될 수 없는 최소의 데이터 보관 단위이다.
- 예시로 엔터티 사원에 속하는 모든 엔터티는 이름을 갖고 있다. 또한 모든 사원 에는 입사일자, 사원번호, 생년월일 등의 특성을 가짐
나) 속성 특징
- 속성의 어원적 의미
- 고유한 성질이란 의미를 가지고 있는다. 즉, 남의 도움을 받지 않더라도 독자적인 성질이 반드시 있어야 함을 뜻함. - 속성도 일종의 집합이다.
- 물리 데이터 모델링 단계에서 엔터티는 테이블이 되고, 속성은 칼럼이 된다. 결국 속성에는 데이 터 값이 들어가게 되며, 그 값들은 여러 종류를 가지게 된다. - 속성들 간은 서로 독립적이다.
- 속성들은 반드시 식별자에 직접 종속되어야 한다. 이 말은 정규화의 제2 정규형에 해당하는 말이다.
- 만약 속성들 간에 종속성이 존재한다면 이들은 별도의 엔터티로 분리되어야 한다. 이것이 바로 제3 정규형이다. - 릴레이션십도 속성이다.
- 물리 데이터 모델링 단계에 가서 보면 릴레이션십 또한 결국은 일종의 속성이 될 수밖에 없다.
2. 속성 후보 도출
- 속성을 결정할 때에도 다양한 후보를 준비하고 이들 중에서 속성의 검증 규칙에 부합하는 것을 속성으로 최종 결정하게 된다.
가) 속성 후보 수집처
- 구 시스템의 문서자료
- 가동 중인 기존 시스템의 데이터 구조 및 프로세스 명세들이 나타나 있는 설계 자료에서부터 사 용자를 위한 지침서에 이르기까지 다양한 도큐먼트가 있을 것이다. - 현업 장표/보고서
- 현업에서 사용하고 있는 각종 장표나 보고 자료들을 수집해서 조사해 보는 것이다.
- 현업 업무 중 에는 업무를 효과적으로 처리하기 위하여 많은 장표와 각종 보고 자료를 만들고 있다. - 사용자와 협의
- 데이터 모델링 과정에서부터 시종일관 현업 담당자들과 같이 진행하는 것이 데이터를 모델링하는 최상의 방법이다. - DFD의 DD(Data Dictionary)
- 자료 흐름도를 작성할 때 생성되는 자료 저장소는 비록 테이블처럼 표현되지만 사실 은 이러한 내용의 데이터가 저장되어야 한다는 데이터의 추상화된 집합이라 할 수 있다. - 전문 서적 및 자료
- 동일한 업무에 대한 전문 서적 또는 자료를 통해서도 속성의 후보를 도출할 수 있다. - 다른 시스템 자료
- 우리가 개발할 시스템의 주변을 살펴보면 사내 외에 이와 관련된 시스템이나 유사한 시스템을 찾을 수 있을 것이다.
나) 속성 후보 선정 원칙
- 원시(Source) 속성으로 보이는 후보는 버리지 않는다.
- 소그룹별로 후보군(Pool)을 만들고 가장 근접한 엔터티에 할당한다.
다) 속성의 기본 구성요소
- 속성명
- 속성의 내용이나 목적이 무엇인지 알려주는 명사 또는 명사구이다.
- 해당 업무에서 일반적으로 사용하는 용어를 사용한다.
- 실체명은 속성명으로 사용하지 말아야 한다.
- 필요시 표준 약어를 제정하여 속성명을 생성하고 그 속성명을 단 하나의 실체에만 속하도록 하는 것이 바람직하다. - 도메인
- 속성이 지닐 수 있는 값에 대한 업무적인 제약 조건으로 파악된 일련의 특성이다. - 선택성
- 모든 건의 해당 속성이 반드시 값을 가져야 하는지 여부를 나타낸다.
- 선택성 조건 => 선택성이 다른 속성 값에 의해 영향을 받는 경우
- 필요조건 / 금지조건 / 무관계조건
3. 속성 검증 및 확정
- 다양한 경로를 통해 수집된 속성 후보를 엔터티에 배정시킨 후 이제 우리가 해야 할 일은 이들을 검증하여 제자리를 찾게 해주는 일이다.
가) 최소 단위(Atomic Value)까지 분할하라
- 집합 개념의 속성은 단순 개념으로 분할한다.
- 가능한 최소 단위까지 분할한 후 관리 필요에 따라 통합한다.
- 일자, 시간, 성명, 주민등록번호, 우편번호 등은 일반적으로 분할하지 않는 것이 좋다.
- 분할 및 통합의 기준은 업무의 요구 사항에 따른다.
나) 하나의 값(Single Value)만을 가지는지 검증한다.
- 엔터티에 들어가는 개체마다 반드시 하나의 값만 보유하고 있어야 한다.
- 여러 값을 가지거나 반복되는 속성은 잘못된 속성이다.
- 반복되는 속성은 새로운 엔터티로 분할해야 할 1차 정규화의 대상이 된다.
4. 추출 속성 규칙
- 다른 엔터티나 속성으로부터 유도되거나 계산된 속성들은 유도 또는 계산에 사용된 기준 속성 (Base Attribute)에 대한 종속성과 함께 그 방법이 데이터 모델에 표현되어야 데이터 가공에 따른 연관관계를 명확하게 전달하고 기록으로서 의미를 가질 수 있다.
- 추출(Derived) 속성이란 하나 이상의 다른 데이터 속성에 축적된 여러 사례의 값을 토대로 어떤 추가 계산 작업을 수행함으로써 선택적으로 주제를 도출하는 속성에 대하여 새로운 값을 창출하는 속성이다.
- 계산(Calculated) 속성은 엔터티의 단일 사례에 대한 어떤 특성을 기술하며, 일반적으로 관련 속성의 또 다른 단일 사례로부터 계산된다.
- 추출 속성은 경영층이 진실로 원하고 필요로 하는 정보를 대표한다.
- 추출 속성은 사용자들의 데이터 요구 사항을 나타낸다.
- 데이터 모델에 추출 속성을 포함시키는 것은 그들의 물리적 구현에 대한 어떤 것도 내포하지 않는다.
- 추출 속성은 향후 과정에서 결코 기본키(Primary Key)로서의 역할을 맡지 않아야 한다.
5. 속성 정의 시 유의사항
- 데이터 모델링을 진행하는 과정에서 속성의 정의 시 흔히 범하는 오류는 필요할지도 모른다고 생각되는 속들을 필요할 때마다 나열해 두는 방법으로 속성을 정의하는 것.
가) 의미가 명확한 속성 명칭을 부여한다.
- 속성의 명칭을 명확히 하는 것은 매우 중요하다. 이 말의 진정한 의미는 그 속성의 개념을 정확히 부여한다는 것을 뜻한다.
나) 유일한 복합 명사 사용
- 보편적인 용어를 적절히 결합한 복합명사를 만듦으로써 구체적인 표현 할 수 있다.
다) 단수형으로 속성명을 사용한다.
- 속성은 단일 값만을 저장하기 때문에 단수형으로 적는 것이 바람직하다.
라) 표준 단어 제정
- 표준 용어 사전을 데이터 모델링을 하기 이전에 생성하여 두면 데이터 모델의 각 객체들(엔터티, 속성, 테이블, 칼럼 등)이 최대한 그 기준을 준수하도록 유도하기가 용이하며 뚜렷한 일관성이 생길 것이다.
728x90
반응형
'자격증 > 데이터아키텍처 준전문가(DAsP)' 카테고리의 다른 글
DAsP(4과목) 3-4. 이력관리 정의 (43) | 2023.09.10 |
---|---|
DAsP(4과목) 3-3. 엔터티 상세화 (41) | 2023.09.10 |
DAsP(4과목) 2-6. 개념 데이터 모델 작성 (49) | 2023.09.08 |
DAsP(4과목) 2-5. 관계 정의 (49) | 2023.09.08 |
DAsP(4과목) 2-4. 핵심 엔터티 정의 (50) | 2023.09.07 |