물리 데이터 모델
논리 데이터 모델을 DBMS 특성 및 성능을 고려해 구체화시킨 모델
물리 데이터 저장소 설계
DBMS 선정 후 물리 데이터 저장소 구성 위한 설계 활동
- 테이블 제약조건 설계
- 인덱스 설계
- 뷰 설계
- 클러스터 설계
- 파티션 설계
1) 테이블 제약조건 설계
테이블 유지하기 위해 반드시 무결성 제약조건 유지해야 함
개체무결성 제약조건 | 기본키는 결코 NULL값이나 중복값 가질 수 없음 |
참조무결성 제약조건 | 외래키는 참조할 수 없는 값 가질 수 없음 |
도메인 무결성 제약조건 | 속성 값은 그 속성이 정의된 도메인에 속한 값이어야 함 |
2) 인덱스 설계
- 인덱스는 데이터베이스 자료를 신속하게 검색하기 위한 물리적 데이터 구조
- <키값, 포인터> 필드 쌍으로 구성
- 인덱스 적용기준, 칼럼 (column) 선정 등 고려
인덱스 (Index)
- 데이터 레코드 (튜플)에 빠르게 접근하기 위해 <키 값, 포인터> 쌍으로 구성되는 데이터 구조
- 기본키 위한 인덱스를 기본 인덱스라 하고, 대부분 관계형 데이터베이스 관리 시스템에서는 모든 기본키에 대해 자동적으로 기본 인덱스 생성
- 대표적인 인덱스로는 트리 기반, 비트맵, 함수 기반, 비트맵 조인 등 있음
인덱스 적용 기준
- 분포도를 분석해 선정
- 분포도는 특정 컬럼 데이터가 테이블에 평균적으로 분포되어 있는 정도로 인덱스에 적정한 분포도는 10% ~ 15%임
- 분포도가 좋다는 의미는 서로 다른 데이터 값들이 중복없이 존재한다는 것을 "분포도 값이 낮으면서 데이터가 일정하게 분포되어 있다"라는 의미
분포도 = (1 / 컬럼값 종류) * 100
= (컬럼 값 평균 Rows) / (테이블 전체 Rows) * 100
인덱스 컬럼 선정
- 인덱스 컬럼 분포도가 좋은 컬럼
- WHERE 절에 자주 사용되는 컬럼
- 자주 조합되어 사용되는 컬럼의 경우 결합인덱스 생성 고려
- 수정 빈번하게 일어나지 않는 컬럼
- 정렬기준, 그룹기준으로 자주 사용되는 컬럼
결합 인덱스
- 두 개 이상 컬럼 합쳐서 인덱스 만드는 것
- WHERE 절 조건 컬럼이 2개 이상 AND로 연결되어 있는 경우 사용
인덱스 설정 시 고려사항
- 인덱스는 추가적인 공간 필요로 함
- 인덱스는 여러 개 설정 가능하나 너무 많은 인덱스는 오버헤드 초래
- 넓은 범위 인덱스 처리 시, 전체 처리 시보다 더 많은 오버헤드 발생할 수 있음
- 인덱스와 데이터 테이블 저장 공간 적절히 분리하도록 설계
3) 뷰 (View) 설계
뷰는 하나 이상의 기본 테이블로 유도된 가상 테이블로 필요한 데이터만 뷰로 정의해 처리할 수 있기 때문에 관리 용이
뷰 (View)
- 사용자에게 접근 허용된 자료만 제한적으로 보여주기 위해, 하나 이상의 기본 테이블로부터 유도된 가상의 테이블
- 저장장치 내 물리적으로 존재하지 않지만 사용자에게는 있는 것처럼 간주
- 뷰 통해서만 데이터에 접근하게 하면 뷰에 나타나지 않는 데이터 안전하게 보호하는 효율적인 기법으로 사용할 수 있음
뷰 설계 순서
① 대상 테이블 선정
- 외부시스템과 인터페이스에 관여하는 테이블
- 조인 연산에 자주 사용되는 테이블
- 서브 쿼리가 인라인 뷰 방식으로 접근하는 테이블
② 대상 컬럼 선정
- 보안 유지 컬럼은 주의해 선택
뷰 설계 시 고려사항
- 반복적으로 조인 사용하거나 동일한 조건절 사용하는 테이블을 대상으로 뷰 생성해야 함
- 업무에 따라 사용할 데이터 다양한 봔점에서 뷰 생성해야 함
- 중요한 자료는 보안 고려해 설계
4) 클러스터 (Cluster) 설계
- 클러스터는 동일한 성격 데이터를 동일한 데이터 블록에 저장하는 군집화 방법으로 데이터 엑세스 효율 향상시킴
- 클러스터 적용 기준 및 고려사항 참조해 설계
클러스터 적용 기준
- 인덱스와 반대로 클러스터는 데이터 분포도가 넓을 때 적용
- ORDER BY, GROUP BY, UNION 빈번한 테이블 선정
- 수정 자주 발생하지 않는 테이블과 컬럼 고려
- 대량 범위 자주 액세스하는 경우 적용
- 여러 개 테이블 빈번하게 조인하는 경우 적합
클러스터 설계 시 고려사항
- 검색 속도 향상 되지만 입력, 수정, 삭제 시 성능 저하됨 고려
- 분포도 넓은 테이블 클러스터링은 저장 공간 절약 가능
- 처리 범위 넓어 문제 발생하는 경우 단일 테이블 클러스터링 고려
- 조인 많아 문제 발생되는 경우 다중 테이블 클러스터링 고려
- 전체 테이블 스캔하는 경우 빈번할 때 클러스터링 수행 안함
- 클러스터링된 테이블에 클러스터드 인덱스 생성하면 접근 성능 향상
5) 파티션 (Partition) 설계
- 파티션은 대용량 테이블이나 인덱스 관리하기 쉬운 작은 단위로 분할하는 것 의미
- 파티션 요구를 고려해 파티션 종류와 장점에 맞게 설계
파티션 종류
범위분할 (Range Partitioning) |
- 연속적인 숫자나 날짜 기준으로 분할 - 관리 용이해 관리시간 단축 가능 |
해시분할 (Hash Partitioning) |
- 해시함수 적용한 결과 값에 따라 데이터 분할 - 데이터 고르게 분산할 시 유용 |
조합분할 (Composite Partitioning) |
- 범위분할, 해시분할 등 2개 이상 파티셔닝 결합 - 큰 파티션에 대한 I/O 요청을 여러 파티션으로 분산 가능 |
파티션 장, 단점
장점 | - 데이터 접근 시 액세스 범위 줄여 쿼리 성능 향상 - 파티션 별로 데이터 분산되어 저장되므로 디스크 성능 향상 - 파티션 별로 백업 및 복구 수행하므로 가용성 향상 - 시스템 장애 시 데이터 손상 정도 최소화할 수 있음 - 파티션 단위로 입·출력 분산시킬 수 있음 |
단점 | - 하나의 테이블 세분화해 관리하므로 세심한 관리 요구 - 테이블 간 조인에 대한 비용 증가 - 용량 작은 테이블에 파티셔닝 수행시 오히려 성능 저하 |
'Study > 정보처리기사 실기' 카테고리의 다른 글
[정보처리기사 실기] 통합구현 _ 연계 데이터 구성 및 연계 메커니즘 (0) | 2025.02.25 |
---|---|
[정보처리기사 실기] 데이터 입출력 구현 _ 데이터베이스 트렌드 (0) | 2025.02.25 |
[정보처리기사 실기] 데이터 입출력 구현 _ 논리 데이터 저장소 (2) (0) | 2025.02.19 |
[정보처리기사 실기] 데이터 입출력 구현 _ 논리 데이터 저장소 (1) (0) | 2025.02.17 |
[정보처리기사 실기] 3장 데이터 입출력 구현 _ 데이터베이스 기초 (0) | 2025.02.13 |