DB 기본 개념
DB란
전자적으로(electronically) 저장되고 사용되는 관련있는 데이터들의 조직화된 집합
조직화를 시킴으로 데이터의 불일치, 중복 데이터 관리 등 다양한 데이터 관리를 좀 더 효율적으로 할 수 있다.
DBMS : 사용자에게 DB를 정의하고 만들고 관리하는 기능을 제공하는 소프트웨어 프로그램 (MySQL, ORACLE 등)
DBMS로 DB를 정의하다 보면 부가적인 데이터가 발생한다. 그것을 metadate
라고 부른다.
metadata (data about data)
- database를 정의하거나 기술하는 data
- catalog라고도 부름
- e.g.) 데이터 유형, 구조, 제약 조건, 보안, 저장, 인덱스 등등
- metadata 또한 DBMS를 통해 저장되고 관리
data models
data models란
- DB의 구조(structure)를 기술하는데 사용될 수 있는 개념들이 모인 집합
- DB 구조를 추상화해서 표현할 수 있는 수단을 제공
- data model은 여러 종류가 있으며 추상화 수준과 DB 구조화 방식이 조금씩 다르다
- DB에서 읽고 쓰기 위한 기본적인 동작들(operations)도 포함한다
data models는 크게 3가지로 분류할 수 있다.
- conceptual (or high-level) data models
- logical (or repreentational) data models
- physical (or low-level) data models
conceptual data models
일반 사용자
들이 쉽게 이해할 수 있는 개념들로 이뤄진 모델- 추상화 수준이 가장 높음
- 비즈니스 요구 사항을 추상화하여 기술할 때 사용
- entity-relationship model이 대표적이다.
logical data models
- 이해하기 어렵지 않으면서도 디테일하게 DB를 구조화 할 수 있는 개념들을 제공
- 데이터가 컴퓨터에 저장될 때의 구조와 크게 다르지 않게 DB 구조화를 가능하게
- 특정 DBMS나 storage에 종속되지 않는 수준에서 DB를 구조화할 수 있는 모
- 보통 개발자는 logical data model을 많이 사용하게 되는데 그 중에서도 가장 많이 사용되는 것이 relational data model이다. relational data model은 데이터를 테이블 형태로 저장하게 된다.
physical data models
- 컴퓨터에 데이터가 어떻게 파일 형태로 저장되는지를 기술할 수 있는 수단을 제공, 실제로 컴퓨터에 저장되는 형태에 가장 근접
- data format, data orderings, access path 등이 있다.
- access path : 데이터 검색을 빠르게 하기 위한 구조체를 뜻 한다. ex) index
schema & state
database schema
- data mode을 바탕으로
database의 구조를 기술한 것
- schema는 database를 설계할 때 정해지며 한번 정해진 후에는 자주 바뀌지 않음
database state
- database에 있는 실제 데이터는 꽤 자주 바뀔 수 있다
특정 시점
에 database에 있는 데이터를 database state 혹은 snapshot이라고 한다- 혹은 database에 있는 현재 instances의 집합이라고도 한다
three-schema architecture
- database system을 구축하는 architecture 중의 하나
- user application 으로부터 물리적인 database를 분리시키는 목적
- 물리적인 database는 자주 바뀔 수 있는데 그때 실제 database를 사용하는 user application에 영향을 주지 않도록 하는
- 세가지 level이 존재하며 각각의 level마다 schema가 정의되어 있다
- external schemas (or user views) at external (or view) level
- conceptual schemas at conceptual level
- internal schemas at internal level
internal schema
저장장치에 가장 가까운 schema
- 물리적으로 데이터가 어떻게 저장되는지 physical data model을 통해 표현
- data storage, data structure, access path 등 실체가 있는 내용 기술
external schema
- 실제 사용자가 바라보는 schema
- 특정 유저들이 필요로 하는 데이터만 표현
- 그 외 알려줄 필요가 없는 데이터는 숨김
- logical data model을 통해 표현
초창기에는 위의 두 schema만 존재했다.
이렇게 하다보니 문제점이 발생했는데, 각각의 유저마다 필요로 하는 데이터들이 달라지다보니 중복되는 데이터들을 가지고 있는 schema
가 많아져 관리가 힘들어지고 데이터 불일치 등 문제가 발생했다.
그런 문제를 해결하기 위해 conceptual schema
가 등장했다.
conceptual schema
internal schema를 한번 추상화 한 schema
- 전체 database에 대한 구조를 기술
- 물리적인 저장 구조에 관한 내용은 숨김
- entities, data types, relationships, user operations, constraints에 집중
- logical data model을 통해 기술
trhee-schema architecture 정리
안정적으로 데이터베이스 시스템을 운영하기 위해 사용
- 각 레벨을 독립시켜서 어느 레벨에서의 변화가 상위 레벨에 영향을 주지 않기 위함
- ex) internal schema에서 변경점이 생겨도, conceptual schema에 영향이 가지 않음 -> 두 scheam 사이의 mapping 만 수정해주면 됨
- 대부분의 DBMS가 three level을 완벽하게 혹은 명시적으로 나누지는 않음
- internal schema가 바뀌어도 conceptual schema가 바뀌지 않게 하는건 쉽지만, conceptual schema가 바뀌었을 때 external schema가 바뀌지 않게 하는건 상대적으로 어렵다. 그렇기 때문에 명시적으로 나누지 않음.
- 데이터가 존재하는 곳은 internal level
database language
data definition language (DDL)
conceptual schema
를 정의하기 위해 사용되는 언어- internal schema까지 정의할 수 있는 경우도 있음 (거의 안 씀)
storage definition language (SDL)
interanl schema
를 정의하는 용도로 사용되는 언어- 요즘은 RDBMS에서는 SDL이 거의 없고 파라미터 등의 설정으로 대체
view definition language (VDL)
external schemas
를 정의하기 위해 사용되는 언어- 대부분의 DBMS에서는 DDL이 VDL 역할까지 수행
data manipulation language (DML)
- database에 있는 data를 활용하기 위한 언어
- data 추가, 삭제, 수정, 검색 등등의 기능을 제공하는 언어
통합된 언어
- 오늘날의 DBMS는 DML, VDL, DDL이 따로 존재하기 보다는 통합된 언어로 존재
- 대표적인 예가 relational database language : SQL
- SQL이 DML, VDL, DDL의 역할을 모두 할 수 있다.
출처)
This post is licensed under CC BY 4.0 by the author.