본문 바로가기
자격증/데이터아키텍처 준전문가(DAsP)

DAsP(4과목) 3-2. 속성 정의

by 김엉배 2023. 9. 10.
728x90
반응형

1.   속성 개념


가) 속성 정의

  • 엔터티에서 관리되는 구체적인 정보 항목으로 더 이상 분리될 수 없는 최소의 데이터 보관 단위이다.
  • 예시로 엔터티 사원에 속하는 모든 엔터티는 이름을 갖고 있다. 또한 모든 사원 에는 입사일자, 사원번호, 생년월일 등의 특성을 가짐

나) 속성 특징

  • 속성의 어원적 의미
    - 고유한 성질이란 의미를 가지고 있는다. 즉, 남의 도움을 받지 않더라도 독자적인 성질이 반드시 있어야 함을 뜻함.

  • 속성도 일종의 집합이다.
    - 물리 데이터 모델링 단계에서 엔터티는 테이블이 되고, 속성은 칼럼이 된다. 결국 속성에는 데이 터 값이 들어가게 되며, 그 값들은 여러 종류를 가지게 된다.

  • 속성들 간은 서로 독립적이다.
    - 속성들은 반드시 식별자에 직접 종속되어야 한다. 이 말은 정규화의 제2 정규형에 해당하는 말이다.
    - 만약 속성들 간에 종속성이 존재한다면 이들은 별도의 엔터티로 분리되어야 한다. 이것이 바로 제3 정규형이다.

  • 릴레이션십도 속성이다.
    - 물리 데이터 모델링 단계에 가서 보면 릴레이션십 또한 결국은 일종의 속성이 될 수밖에 없다.

 

 

 

 

2.  속성 후보 도출

- 속성을 결정할 때에도 다양한 후보를 준비하고 이들 중에서 속성의 검증 규칙에 부합하는 것을 속성으로 최종 결정하게 된다.


가) 속성 후보 수집처

  • 구 시스템의 문서자료
    - 가동 중인 기존 시스템의 데이터 구조 및 프로세스 명세들이 나타나 있는 설계 자료에서부터 사 용자를 위한 지침서에 이르기까지 다양한 도큐먼트가 있을 것이다.

  • 현업 장표/보고서
    - 현업에서 사용하고 있는 각종 장표나 보고 자료들을 수집해서 조사해 보는 것이다.
    - 현업 업무 중 에는 업무를 효과적으로 처리하기 위하여 많은 장표와 각종 보고 자료를 만들고 있다.

  • 사용자와 협의
    - 데이터 모델링 과정에서부터 시종일관 현업 담당자들과 같이 진행하는 것이 데이터를 모델링하는 최상의 방법이다.

  • DFD의 DD(Data Dictionary)
    - 자료 흐름도를 작성할 때 생성되는 자료 저장소는 비록 테이블처럼 표현되지만 사실 은 이러한 내용의 데이터가 저장되어야 한다는 데이터의 추상화된 집합이라 할 수 있다.

  • 전문 서적 및 자료
    - 동일한 업무에 대한 전문 서적 또는 자료를 통해서도 속성의 후보를 도출할 수 있다.

  • 다른 시스템 자료
    - 우리가 개발할 시스템의 주변을 살펴보면 사내 외에 이와 관련된 시스템이나 유사한 시스템을 찾을 수 있을 것이다.

 

나) 속성 후보 선정 원칙

  • 원시(Source) 속성으로 보이는 후보는 버리지 않는다.
  • 소그룹별로 후보군(Pool)을 만들고 가장 근접한 엔터티에 할당한다.

다) 속성의 기본 구성요소

  • 속성명
    - 속성의 내용이나 목적이 무엇인지 알려주는 명사 또는 명사구이다.
    - 해당 업무에서 일반적으로 사용하는 용어를 사용한다.
    - 실체명은 속성명으로 사용하지 말아야 한다.
    - 필요시 표준 약어를 제정하여 속성명을 생성하고 그 속성명을 단 하나의 실체에만 속하도록 하는 것이 바람직하다.

  • 도메인
    - 속성이 지닐 수 있는 값에 대한 업무적인 제약 조건으로 파악된 일련의 특성이다.

  • 선택성
    - 모든 건의 해당 속성이 반드시 값을 가져야 하는지 여부를 나타낸다.
    - 선택성 조건 => 선택성이 다른 속성 값에 의해 영향을 받는 경우
    - 필요조건 / 금지조건 / 무관계조건

 

 

3.  속성 검증 및 확정

- 다양한 경로를 통해 수집된 속성 후보를 엔터티에 배정시킨 후 이제 우리가 해야 할 일은 이들을 검증하여 제자리를 찾게 해주는 일이다.


가) 최소 단위(Atomic Value)까지 분할하라

  • 집합 개념의 속성은 단순 개념으로 분할한다.
  • 가능한 최소 단위까지 분할한 후 관리 필요에 따라 통합한다.
  • 일자, 시간, 성명, 주민등록번호, 우편번호 등은 일반적으로 분할하지 않는 것이 좋다.
  • 분할 및 통합의 기준은 업무의 요구 사항에 따른다.

 

나) 하나의 값(Single Value)만을 가지는지 검증한다.

  • 엔터티에 들어가는 개체마다 반드시 하나의 값만 보유하고 있어야 한다.
  • 여러 값을 가지거나 반복되는 속성은 잘못된 속성이다.
  • 반복되는 속성은 새로운 엔터티로 분할해야 할 1차 정규화의 대상이 된다.

 

 

 

4.  추출 속성 규칙

- 다른 엔터티나 속성으로부터 유도되거나 계산된 속성들은 유도 또는 계산에 사용된 기준 속성 (Base Attribute)에 대한 종속성과 함께 그 방법이 데이터 모델에 표현되어야 데이터 가공에 따른 연관관계를 명확하게 전달하고 기록으로서 의미를 가질 수 있다.


  • 추출(Derived) 속성이란 하나 이상의 다른 데이터 속성에 축적된 여러 사례의 값을 토대로 어떤 추가 계산 작업을 수행함으로써 선택적으로 주제를 도출하는 속성에 대하여 새로운 값을 창출하는 속성이다.
  • 계산(Calculated) 속성은 엔터티의 단일 사례에 대한 어떤 특성을 기술하며, 일반적으로 관련 속성의 또 다른 단일 사례로부터 계산된다.
  • 추출 속성은 경영층이 진실로 원하고 필요로 하는 정보를 대표한다.
  • 추출 속성은 사용자들의 데이터 요구 사항을 나타낸다.
  • 데이터 모델에 추출 속성을 포함시키는 것은 그들의 물리적 구현에 대한 어떤 것도 내포하지 않는다.
  • 추출 속성은 향후 과정에서 결코 기본키(Primary Key)로서의 역할을 맡지 않아야 한다.

 

 

 

 

5.  속성 정의 시 유의사항

- 데이터 모델링을 진행하는 과정에서 속성의 정의 시 흔히 범하는 오류는 필요할지도 모른다고 생각되는 속들을 필요할 때마다 나열해 두는 방법으로 속성을 정의하는 것.


가) 의미가 명확한 속성 명칭을 부여한다.

  • 속성의 명칭을 명확히 하는 것은 매우 중요하다. 이 말의 진정한 의미는 그 속성의 개념을 정확히 부여한다는 것을 뜻한다.

나) 유일한 복합 명사 사용

  • 보편적인 용어를 적절히 결합한 복합명사를 만듦으로써 구체적인 표현 할 수 있다.

다) 단수형으로 속성명을 사용한다.

  • 속성은 단일 값만을 저장하기 때문에 단수형으로 적는 것이 바람직하다.

라) 표준 단어 제정

  • 표준 용어 사전을 데이터 모델링을 하기 이전에 생성하여 두면 데이터 모델의 각 객체들(엔터티, 속성, 테이블, 칼럼 등)이 최대한 그 기준을 준수하도록 유도하기가 용이하며 뚜렷한 일관성이 생길 것이다.
728x90
반응형