sql

[sqld] 데이터 모델링의 이해

iiixyn 2023. 2. 1. 02:28

✦ 데이터 모델링

· 추상화(Abstraction) - 현실세계를 데이터베이스로 표현
· 단순화(Simplication) - 누구나 쉽게 이해할 수 있도록 표현
· 명확성(Clarity) - 명확하게 의미가 해석되어야 하고 한 가지 의미를 가져야 한다.

개념적 모델링(Conceptual Data Modeling)
- 고객의 비즈니스 프로세스를 분석하고 업무 전체에 대해 모델링을 정한다. 업무적 관점에서 모델링하며 기술적인 용어는 가급적 사용하지 않는다.
- 엔터티(Entity)와 속성(Attribute)을 도출하고 개념적 erd를 작성한다.
- 엔터티란 실체, 객체라는 의미로 업무에 필요하고 유용한 정보를 저장하고 관리하기 위한 집합(사람, 장소, 물건 등의 명사에 해당)

> 업무상 관리가 필요한 관심사에 해당
- 추상화 수준이 가장 높은 수준의 모델링

논리적 모델링(Logical Data Modeling)
- 식별자를 도출하고 필요한 모든 릴레이션 정의
- 정규화를 수행하여 데이터 모델의 독립성 확보, 정규화 - "테이블 간 중복된 데이터를 허용하지 않는다"
> 무결성 유지, 재사용성 ⇡
- 특정 데이터베이스 모델에 종속

물리적 모델링(Physical Modeling)
- 데이터베이스를 실제 구축한다. 즉, 테이블, 인덱스, 함수 등을 생성
- 성능, 보안, 가용성을 고려하여 구축

데이터모델링 관점
데이터 - 비즈니스 프로세스에서 사용되는 데이터. 구조 분석, 정적 분석
프로세스 - 비즈니스 프로세스에서 수행하는 작업. 시나리오 분석, 도메인 분석, 동적 분석
데이터와 프로세스 - 프로세스와 데이터 간의 관계, CRUD 분석

데이터모델링을 위한 ERD(Entity Relationship Diagram)
- 1976 피터첸이 erd 표기법을 만들었으며 데이터 모델링의 표준으로 사용되고 있다.
- 인터티와 엔터티 간의 관계를 정의
* 작성 절차
1 엔터티를 도출한 후 엔터티를 배치한다. <중요한 엔터티를 왼쪽 상단에 배치>
2 엔터티 간의 관계 설정
3 관계명 서술
4 관계 참여도 표현
5 관계의 필수 여부 표현

데이터모델링 고려사항
- 독립성 : 독립성이 확보된 모델은 업무변화에 능동적 대응이 가능하다. 독립성을 확보하기 위해 중복된 데이터를 제거한다. ->정규화
- 고객 요구사항의 표현 : 고객의 요구사항을 간결하고 명확하게 표현
- 데이터 품질 확보 : 데이터 표준을 정의하고 표준 준수율을 관리

3층 스키마(3-Level Schema)
- 사용자, 설계자, 개발자가 데이터베이스를 보는 관점에 따라 데이터베이스를 기술하고 이들 간의 관계를 정의한 ANSI(미국표준협회) 표준이다.
독립성을 확보하기 위한 방법으로 독립성을 확보하면 데이터 복잡도 감소, 데이터 중복 제거, 사용자 요구사항 변경에 따른 대응력 향상, 관리 및 유지보수 비용 절감 등의 장점을 갖늗다. 3단계 계층으로 분리하여 독립성을 확보하는 방법으로 각 계층을 "뷰"[가상테이블]라고도 한다.

논리적 독립성 - 개념스키마가 변경되더라도 외부 스키마가 영향을 받지 않는 것이다.
물리적 독립성 - 내부스키마가 변경되더라도 개념 스키마가 영향을 받지 않는 것이다.

외부스키마
- 사용자 관점, 업무상 관련이 있는 데이터 접근
- 관련 데이터베이스의 뷰를 표시
- 응용 프로그램이 접근하는 데이터베이스 정의

개념스키마
- 설계자 관점, 사용자 전체 집단의 데이터베이스 구조
- 전체 데이터베이스 내의 규칙과 구조 표현
- 통합 데이터베이스 구조

내부스키마
- 개발자 관점, 데이터베이스의 물리적 저장 구조
- 데이터 저장 구조, 레코드 구조, 필드 정의, 인덱스 등을 의미


엔터티
> 엔터티의 특징 <
식별자 - 엔터티는 유일한 식별자가 있어야 한다. 예) 회원id, 계좌번호
인스턴스 집합 - 2개 이상의 인스턴스가 있어야 한다.
속성 - 엔터티는 반드시 속성을 가진다. 예) 고객 엔터티에 회원id, 패스워드, 이름
관계 - 엔터티는 다른 엔터티와 최소한 한 개 이상의 관계가 있어야 한다.
업무 - 엔터티는 업무에서 관리되어야 하는 집합

릴레이션과 테이블, 인스턴스
- 릴레이션과 테이블은 같은 의미로 해석하면 된다. 릴레이션에 기본키 및 제약조건을 설정하면 테이블이 된다.
인스턴스는 릴레이션이 가질 수 있는 값을 의미한다, 간단하게 생각하면 행의 수를 의미

> 엔터티 종류 <
유형과 무형에 따른 엔터티 종류
- 유형 엔터티 : 업무에서 도출되며 지속적으로 사용되는 엔터티 예) 고객, 사원
- 개념 엔터티 : 유형 엔터티는 물리적 형태가 있지만 개념 엔터티는 물리적 형태가 없다. 예) 거래소 종목, 생명보험 상품
- 사건 엔터티 : 비즈니스 프로세스를 실행하면서 생성되는 엔터티 예)주문, 체결, 수수료 청구

발생시점에 따른 엔터티 종류
- 기본 엔터티 : 키 엔터티라고도 하며 다른 텐터티로부터 영향을 받지 않고 독립적으로 생성되는 엔터티 예) 고객, 상품
- 중심 엔터티 : 기본 엔터티와 행위 엔터티 간의 중간, 기본 엔터티로부터 발생하고 행위 엔티티를 생성 예) 계좌, 주문, 취소
- 행위 엔터티 : 2개 이상의 엔터티로부터 발생 예) 주문 이력, 체결 이력

속성
업무에서 필요한 정보인 엔터티가 가지는 항목. 더 이상 분리되지 않는 단위로 업무에 필요한 데이터를 저장
인스턴스의 구성요소이고 의미적으로 더 이상 분해되지 않는다.
> 속성의 특징 <
- 업무에서 관리되는 정보
- 하나의 값만 가진다
- 주식별자에게 함수적으로 종속된다. 즉 기본키가 변경되면 속성의 값도 변경된다.
> 속성의 종류 <
분해 여부에 따른 속성의 종류
- 단일 속성 : 하나의 의미로 구성된 것 예)회원id, 이름
- 복합 속성 : 여러 개의 의미가 있는 것 예)주소 (시, 군, 동 등으로 분해될 수 있음)
- 다중값 속성 : 속성에 여러개의 값을 가질 수 있는 것 예) 상품 리스트, 다중값 속성은 엔터티로 분해된다.

특성에 따른 속성의 종류
- 기본 속성 : 비즈니스 프로세스에서 도출되는 본래속성 예)회원id,이름
- 설계 속성 : 데이터 모델링 과정에서 발생 되는 속성, 유일한 값 부여 예)상품속성, 지점 코드
- 파생 속성 : 다른 속성에 의해 만들어지는 속성 예) 합계, 평균

도메인
- 도메인은 속성이 가질 수 있는 값의 범위
- 예) 성별이라는 속성의 도메인은 남자와 여자이다.

관계(RelationShip)
- 관계는 엔터티 간의 관련성을 의미하며 존재 관계와 행위 관계로 분류된다.
- 존재 관계는 두 개의 엔터티가 존재 여부의 관계가 있는 것이고 행위 관계는 두 개의 엔터티가 어떤 행위에 의한 관련성이 있는 것
> 관계의 종류 <
- 존재 관계 : 존재 관계는 엔터티 간의 상태를 의미. 예) 고객이 은행에 회원가입하면 관리점이 할당되고 할당된 관리점에서 고객을 관리
- 행위 관계 : 행위 관계는 엔터티 간에 어떤 행위가 있는 것. 예)증권회사는 계좌를 개설하고 주문을 발주하는 것
관계 차수(cardinality) : 관계 차수는 두 개의 엔터티 간에 관계에 참여하는 수를 의미
1대1 관계 - 완전 1대1, 선택적 1대1
1대n 관계 - 엔터티에 행이 하나 있을 때 다른 엔터티의 값이 여러 개 있는 관계. 예) 고객은 여러개의 계좌를 가질 수 있다.
m대n 관계 - 두 개 엔터티가 서로 여러 개의 관계를 가지고 있는 것. 예) 한 학생이 여러 과목을 수강할 수 있다. 반대로 한 과목은 여러 명의 학생이 수강한다. 관계형 데이터베이스에서 m대n 관계의 조인은 카테시안 곱이 발생한다. 그래서 1대n, n대1로 해소해야 한다.
필수적 관계와 선택적 관계 - 필수적 관계는 반드시 하나는 존재해야 하는 관계이고 선택적 관계는 없을 수도 있는 관계.
> 필수적 관계는 "|", 선택적 관계는 "0"으로 표현
식별 관계
- 고객과 계좌 엔터티에서 고객은 독립적으로 존재할 수 있는 강한 개체이다.
- 강한 개체는 어떤 다른 엔터티에게 의존하지 않고 독립적으로 존재한다.
- 강한 개체는 다른 엔터티와 관계를 가질 때 다른 엔터티에게 기본키를 공유한다.
- 강한 개체는 식별 관계로 표현한다.
- 고객 엔터티의 기본키인 회원id를 계좌 엔터티의 기본키의 하나로 공유하는 것
- 강한 개체의 기본키 값이 변경되면 식별관계에 있는 엔터티의 값도 변경 된다.
- 계좌 엔터티는 약한 개체가 된다.

비식별 관계
- 비식별 관계는 강한 개체의 기본키를 다른 엔터티의 기본키가 아닌 일반 칼럼으로 관계를 가지는 것
- 관리점 엔터티의 기본키는 지점 코드이고 고객 엔터티와 비식별 관계를 가지면, 지점 코드는 고객 엔터티의 기본키가 아닌 일반 칼럼으로 참조된다. 비식별 관계는 점선으로 표현

엔터티 식별자
엔터티를 대표할 수 있는 유일성을 만족하는 속성

주식별자(기본키, primary key)
-최소성 : 주식별자는 최소성을 만족하는 키이다.
-대표성 : 엔터티를 대표
-유일성 : 엔터티의 인스턴스를 유일하게 식별
-불변성 : 자주 변경되지 않아야 한다.

키의 종류
기본키 (primary key) - 후보키 중에서 엔터티를 대표하는 키
후보키 (candidate key) - 유일성과 최소성을 만족하는 키
슈퍼키 (super key) - 유일성은 만족하지만 최소성을 만족하지 않는 키
대체키 (alternate key) - 여러개의 후보키 중 기본키를 선정하고 남은 키
외래키 (foreign key) - 하나 혹은 다수의 다른 테이블의 기본 키 필드를 가리키는 것으로 참조 무결성을 확인하기 위해 사용되는 키
> 허용된 데이터 값만 데이터베이스에 저장하기 위해 사용

식별자의 대표성
- 주식별자는 엔터티를 대표할 수 있는 식별자, 다른 엔터티와 참조 관계로 연결될 수 있다. 보조 식별자는 유일성과 최소성은 만족하지만 대표성을 만족하지 못하는 식별자이다. (후보키)
- 생성 여부에 따른 식별자는 내부 식별자와 외부 식별자로 나뉜다. 내부 식별자는 엔터티 내부에서 스스로 생성되며 외부 식별자는 다른 엔터티와의 관계로 만들어지는 식별자이다.
- 속성의 수에 따른 식별자는 단일 식별자와 복합 식별자로 나뉜다. 단일 식별자는 하나의 속성으로 구성되며 복합 식별자는 두 개 이상의 속성으로 구성된다.
- 대체 여부에 따른 식별자는 본질 식별자와 인조 식별자로 나뉜다. 본질 식별자는 비즈니스 프로세스에서 만들어지는 식별자이며 인조 식별자는 인위적으로 만들어지는 식별자이다. 주식별자로 선정할 것이 없거나 주식별자가 너무 많은 컬럼으로 되어 있는 경우 사용한다. 예) 순서번호를 사용한 식별자

'sql' 카테고리의 다른 글

[sqld] sqld 정리 2과목  (0) 2023.03.04
[sqld] sqld 정리 1과목  (1) 2023.03.04
[oracle] sqldeveloper 단축키  (1) 2023.03.03
[sqld] SQL 기초  (1) 2023.02.01
[sqld] 데이터 모델과 성능  (1) 2023.02.01