Post

DB 기본 개념

DB란

전자적으로(electronically) 저장되고 사용되는 관련있는 데이터들의 조직화된 집합

조직화를 시킴으로 데이터의 불일치, 중복 데이터 관리 등 다양한 데이터 관리를 좀 더 효율적으로 할 수 있다.

DBMS : 사용자에게 DB를 정의하고 만들고 관리하는 기능을 제공하는 소프트웨어 프로그램 (MySQL, ORACLE 등)

DBMS로 DB를 정의하다 보면 부가적인 데이터가 발생한다. 그것을 metadate라고 부른다.

metadata (data about data)

  • database를 정의하거나 기술하는 data
  • catalog라고도 부름
  • e.g.) 데이터 유형, 구조, 제약 조건, 보안, 저장, 인덱스 등등
  • metadata 또한 DBMS를 통해 저장되고 관리

data models

data models란

  • DB의 구조(structure)를 기술하는데 사용될 수 있는 개념들이 모인 집합
  • DB 구조를 추상화해서 표현할 수 있는 수단을 제공
  • data model은 여러 종류가 있으며 추상화 수준과 DB 구조화 방식이 조금씩 다르다
  • DB에서 읽고 쓰기 위한 기본적인 동작들(operations)도 포함한다

data models는 크게 3가지로 분류할 수 있다.

  • conceptual (or high-level) data models
  • logical (or repreentational) data models
  • physical (or low-level) data models

conceptual data models

  • 일반 사용자들이 쉽게 이해할 수 있는 개념들로 이뤄진 모델
  • 추상화 수준이 가장 높음
  • 비즈니스 요구 사항을 추상화하여 기술할 때 사용
  • entity-relationship model이 대표적이다.

logical data models

  • 이해하기 어렵지 않으면서도 디테일하게 DB를 구조화 할 수 있는 개념들을 제공
  • 데이터가 컴퓨터에 저장될 때의 구조와 크게 다르지 않게 DB 구조화를 가능하게
  • 특정 DBMS나 storage에 종속되지 않는 수준에서 DB를 구조화할 수 있는 모
  • 보통 개발자는 logical data model을 많이 사용하게 되는데 그 중에서도 가장 많이 사용되는 것이 relational data model이다. relational data model은 데이터를 테이블 형태로 저장하게 된다.

physical data models

  • 컴퓨터에 데이터가 어떻게 파일 형태로 저장되는지를 기술할 수 있는 수단을 제공, 실제로 컴퓨터에 저장되는 형태에 가장 근접
  • data format, data orderings, access path 등이 있다.
  • access path : 데이터 검색을 빠르게 하기 위한 구조체를 뜻 한다. ex) index

schema & state

database schema

  • data mode을 바탕으로 database의 구조를 기술한 것
  • schema는 database를 설계할 때 정해지며 한번 정해진 후에는 자주 바뀌지 않음

database state

  • database에 있는 실제 데이터는 꽤 자주 바뀔 수 있다
  • 특정 시점에 database에 있는 데이터를 database state 혹은 snapshot이라고 한다
  • 혹은 database에 있는 현재 instances의 집합이라고도 한다

three-schema architecture

  • database system을 구축하는 architecture 중의 하나
  • user application 으로부터 물리적인 database를 분리시키는 목적
    • 물리적인 database는 자주 바뀔 수 있는데 그때 실제 database를 사용하는 user application에 영향을 주지 않도록 하는
  • 세가지 level이 존재하며 각각의 level마다 schema가 정의되어 있다
    • external schemas (or user views) at external (or view) level
    • conceptual schemas at conceptual level
    • internal schemas at internal level

internal schema

  • 저장장치에 가장 가까운 schema

  • 물리적으로 데이터가 어떻게 저장되는지 physical data model을 통해 표현
  • data storage, data structure, access path 등 실체가 있는 내용 기술

external schema

  • 실제 사용자가 바라보는 schema
  • 특정 유저들이 필요로 하는 데이터만 표현
  • 그 외 알려줄 필요가 없는 데이터는 숨김
  • logical data model을 통해 표현

초창기에는 위의 두 schema만 존재했다.

이렇게 하다보니 문제점이 발생했는데, 각각의 유저마다 필요로 하는 데이터들이 달라지다보니 중복되는 데이터들을 가지고 있는 schema가 많아져 관리가 힘들어지고 데이터 불일치 등 문제가 발생했다.

그런 문제를 해결하기 위해 conceptual schema가 등장했다.

conceptual schema

  • internal schema를 한번 추상화 한 schema

  • 전체 database에 대한 구조를 기술
  • 물리적인 저장 구조에 관한 내용은 숨김
  • entities, data types, relationships, user operations, constraints에 집중
  • logical data model을 통해 기술

trhee-schema architecture 정리

  • 안정적으로 데이터베이스 시스템을 운영하기 위해 사용

  • 각 레벨을 독립시켜서 어느 레벨에서의 변화가 상위 레벨에 영향을 주지 않기 위함
    • ex) internal schema에서 변경점이 생겨도, conceptual schema에 영향이 가지 않음 -> 두 scheam 사이의 mapping 만 수정해주면 됨
  • 대부분의 DBMS가 three level을 완벽하게 혹은 명시적으로 나누지는 않음
    • internal schema가 바뀌어도 conceptual schema가 바뀌지 않게 하는건 쉽지만, conceptual schema가 바뀌었을 때 external schema가 바뀌지 않게 하는건 상대적으로 어렵다. 그렇기 때문에 명시적으로 나누지 않음.
  • 데이터가 존재하는 곳은 internal level

database language

data definition language (DDL)

  • conceptual schema를 정의하기 위해 사용되는 언어
  • internal schema까지 정의할 수 있는 경우도 있음 (거의 안 씀)

storage definition language (SDL)

  • interanl schema를 정의하는 용도로 사용되는 언어
  • 요즘은 RDBMS에서는 SDL이 거의 없고 파라미터 등의 설정으로 대체

view definition language (VDL)

  • external schemas를 정의하기 위해 사용되는 언어
  • 대부분의 DBMS에서는 DDL이 VDL 역할까지 수행

data manipulation language (DML)

  • database에 있는 data를 활용하기 위한 언어
  • data 추가, 삭제, 수정, 검색 등등의 기능을 제공하는 언어

통합된 언어

  • 오늘날의 DBMS는 DML, VDL, DDL이 따로 존재하기 보다는 통합된 언어로 존재
  • 대표적인 예가 relational database language : SQL
  • SQL이 DML, VDL, DDL의 역할을 모두 할 수 있다.

출처)

백엔드에서 사용되는 데이터베이스(database) 기본 개념

This post is licensed under CC BY 4.0 by the author.