본문 바로가기
Database/DB

Database Chapter 10 - 회복과 병행 제어

by Garonguri 2022. 3. 29.
728x90

  • 트랜잭션이란?
    • 하나의 작업을 수행하는 데 필요한 데이터베이스의 연산들을 모아놓은 것. 
    • 데이터 베이스에서 논리적 작업 단위, 데이터 복구 작업 단위, 작업 수행에 필요한 SQL 모임 등으로 표현 가능
    • 데이터베이스의 무결성과 일관성을 보장하기 위해 트랜잭션의 올바른 정의 및 관리가 필요하다.
    • 일반적으로 DELETE, INSERT, UPDATE 등 데이터 변경문의 실행을 트랜잭션을 통해 관리
  • 트랜잭션의 특성 (ACID)
    • A 원자성
      • 트랜잭션을 구성하는 연산이 모두 정상적으로 실행되거나, 하나도 실행되지 않아야 함.
      • all-or-nothing
      • 장애 발생 시 트랜잭션 작업 전의 상태로 되돌려야 한다.
      • 필요 기능 : 회복 기능
    • C 일관성
      • 트랜잭션이 성공적으로 수행된 후에도 데이터베이스가 일관된 상태를 유지해야 함.
      • (트랜잭션이 수행되는 과정에서는 일관된 상태가 아닐 수는 있음!)
      • 필요 기능 : 제어 기능 (병행 제어 기능)
    • I 격리성(고립성)
      • 현재 수행 중인 트랜잭션이 완료될 때까지 트랜잭션이 생성한 중간 연산 결과에 다른 트랜잭션이 접근할 수 없음.
      • 여러 트랜잭션이 동시에 수행되지만, 각 트랜잭션은 독립적으로 수행되어야 한다.
      • 필요 기능 : 제어 기능 (병행 제어 기능)
    • D 지속성(영속성)
      • 트랜잭션이 성공적으로 완료된 후 데이터베이스에 반영한 수행 결과는 어떠한 경우에도 손실되지 않고 영구적이어야 함.
      • 시스템 장애가 발생하더라도 트랜잭션 작업 결과는 데이터베이스에 남아있어야 함.
      • 필요 기능 : 회복 기능
  • 트랜잭션의 주요 연산
    • commit
      • 트랜잭션이 성공적으로 수행되었음을 나타내는 연산.
      • 커밋 연산이 실행된 후 수행 결과가 데이터베이스에 반영됨.
    • rollback
      • 트랜잭션을 수행하는데 실패했음을 나타내는 연산.
      • 지금까지 실행한 연산의 결과가 취소되고 트랜잭션이 수행되기 전의 상태로 돌아감.
  • 트랜잭션의 상태
    • 활동 상태 : 트랜잭션이 수행하기 시작
    • 부분 완료 상태 : 트랜잭션이 마지막 연산을 처리
    • 완료 상태 : 트랜잭션이 commit 연산을 처리
    • 실패 상태 : 다양한 원인으로 인해 정상적인 트랜잭션 수행이 불가능
    • 철회 상태 : 실패 상태의 트랜잭션이 rollback연산을 했을 경우
      • 완료상태, 철회상태의 트랜잭션 -> 트랜잭션의 종료로 간주
      • 종료된 트랜잭션은 상황에 따라 다시 수행되거나, 폐기됨.

  • 장애 : 시스템이 제대로 동작하지 않는 상태
  • 장애의 유형
    • 트랜잭션 장애 : 논리적 오류, 잘못된 데이터, 시스템 과다 사용 등에서 발생된  트랜잭션 수행 중 오류
    • 시스템 장애 : 하드웨어 이상으로 메인메모리 정보에 대한 손상 등으로 시스템 수행을 계속할 수 없는 상태
    • 미디어 장애 : 디스크 헤드의 손상으로 디스크에 저장된 데이터베이스가 손상된 상태
  • 저장 장치에 따른 장애 발생 대응 유형
저장 장치 예시 장애 발생 시 대응  
휘발성 저장장치 (소멸성) 메인 메모리 저장된 데이터 손실  
비휘발성 저장장치 (비소멸성) 디스크, CD
-> DB는 일반적으로 디스크에 저장
장애 발생 시 저장된 데이터는 손실 X
but 저장장치 자체가 손상될 경우
데이터 손상 가능 
 
안정 저장장치 비휘발성 저장장치를 통한 복사본의 집합 영구적 데이터 저장 가능  

  • 회복 기법
    • "복사본"을 만드는 방식으로 구성된다.
      • 1. 덤프(dump) 기법 : 데이터베이스 전체를 다른 저장 장치에 주기적으로 복사하는 방법
        • 비휘발성 저장 장치에 저장
        • 미디어 회복 기법에 사용
        • 장점 : 데이터베이스 전체 복사 가능
        • 단점 : 높은 비용, CPU 낭비
      • 2. 로그(log) 기법 : 데이터베이스에서 변경 연산이 실행될 때 마다 변경 이전, 이후값을 별도의 파일에 기록하는 방법
        • redo, undo연산의 실행으로 이루어짐
        • Redo(재실행)
          • 가장 최근 저장한 DB복사본을 가져온 후, 로그를 이용해 복사본이 만들어진 이후에 실행된 모든 변경 연산을 재실행하여 장애 발생 전의 데이터로 복구하는 기법.
          • 데이터의 전반적 손상에 많이 쓰임
        • Undo(취소)
          • 로그를 이용해 지금까지 실행된 모든 변경 연산을 취소하여 데이터베이스를 원래 상태로 복구
          • 데이터 변경 중, 또는 변경된 내용만 신뢰성을 잃은 경우에 사용
  • 로그 : 데이터베이스 변경 연산과 관련해 변경 이전과 이후 값을 기록한 것.
  • 로그 연산
  로그 레코드 의미
LR 1 <T, start> T가 수행 시작함
LR 2 <T, X, old, new> T가 data X를 old에서 new로 변경함
LR 3 <T, commit> T가 완료됨
LR 4 <T, abort> T가 철회됨
  • 데이터 베이스 회복 기법
    • 로그 회복 기법
      • 데이터베이스 회복에 시간 소요가 많음
      • 과도한 redo연산 실행으로 비효율성 생길 수 있음 
      • 즉시 갱신 회복 기법
        • T수행 중 변경 연산의 결과를 데이터베이스에 즉시 반영 + 장애 발생에 대비하기 위해 변경 내용을 로그에 기록
        • 수행 과정 : 로그 파일에 로그 레코드 기록 -> 데이터베이스에 변경 연산 반영
        • 장애 발생 시 로그에 기록된 내용을 참조해 redo, undo를 사용해 데이터베이스 복구
        • Redo 사용 경우 : T완료 전 장애가 발생한 경우 : LR1은 존재O, LR3은 존재X
        • Undo 사용 경우 : T완료 후 장애가 발생한 경우 : LR1, LR3이 모두 존재하는 경우
      • 지연 갱신 회복 기법
        • 트랜잭션이 수행되는 동안에는 데이터 변경 연산 결과를 반영하지 않음. + 로그에만 기록
          • 로그 기록만 삭제하면 데이터베이스를 변경하지 않아도 됨 -> 변경 이전 값 기록할 필요 없음.
        • 트랜잭션이 부분완료된 후 로그에 기록된 내용을 통해 데이터베이스에 반영. (1번 연산으로 이루어짐)
        • 장애 발생 시 : 로그 기록만 삭제하면 데이터베이스를 변경하지 않아도 됨. -> undo연산 필요 X
        • Log만 버리는 경우 : T완료 전 장애가 발생한 경우 : LR1은 존재O, LR3은 존재X
        • Redo 사용 경우 : T완료 후 장애가 발생한 경우 : LR1, LR3이 모두 존재하는 경우
    • 검사 시점 회복 기법
      • 로그를 이용한 전체 데이터를 회복하는  기법의 비효율성을 해결하기 위해 제안됨 -> 시간적 비효율성 해결
      • 로그를 이용하지만, 일정 시간 간격으로 검사 시점을 만들어 장애 발생 시 가장 최근 검사 시점 이후의 T에만 회복 작업 수행.
      • checkpoint가 되면 모든 로그 레코드를 안정 저장 장치에 있는 로그 파일에 기록한다.
    • 미디어 회복 기법
      • 덤프(dump)를 이용해 안전저장장치에 복사하는 기법.
      • 비용이 많이 들고, CPU가 낭비된다.

 

 

  • 병행 수행
    • 여러 사용자가 데이터베이스를 동시에 공유할 수 있도록 트랜잭션이 동시에 수행되는 것
    • 인터리빙 방식 : 여러 트랜잭션이 차례로 번갈아 수행하는 방식
  • 제어 없는 병행 수행의 문제점
    • 갱신 분실 : 하나의 트랜잭션이 수행한 데이터 변경 연산의 결과를 다른 트랜잭션이 덮어서 변경 연산이 무효되는 것
    • 모순성 : 하나의 트랜잭션이 여러 개의 데이터 변경 연산을 실행할 때, 일관성 없는 상태의 데이터베이스에서 데이터를 가져와 연산 실행 시 모순된 결과가 발생하는 것
    • 연쇄 복귀 : 트랜잭션이 완료되기 전에 장애가 발생해 rollback연산을 수행하면, 이 트랜잭션이 장애발생 전에 변경한 데이터를 가져가 변경 연산을 실행한 다른 트랜잭션에도 rollback연산을 실행해야 한다는 것.
  • 트랜잭션 스케줄
    • 트랜잭션에 포함되어 있는 연산들을 수행하는 순서
    • 직렬 스케줄
      • 인터리빙 방식을 이용하지 않고 각 트랜잭션별로 연산들을 순차적으로 실행시키는 것
      • 직렬 스케줄에 따라 수행된 트랜잭션은 다른 트랜잭션의 방해를 받지 않고 독립적으로 수행된다. -> 정확한 결과!
    • 비직렬 스케줄
      • 인터리빙 방식을 이용하여 트랜잭션을 병행해 수행시킨다.
      • 갱신 분실, 모순성, 연쇄 복귀 등의 문제 상황 발생 가능성이 있음.
    • 직렬 가능 스케줄
      • 직렬 스케줄과 같은 결과를 생성하는 비직렬 스케줄.
  • 병행 제어 기법
    • locking : 병행 수행되는 트랜잭션이 동일한 데이터에 동시에 접근하지 못하도록 제어하는 기법
      • 처리 효율성을 높이기 위해 lock연산의 종류를 구분하기도 한다.
        • shared lock : 해당 데이터에 read는 가능, write는 불가, 다른 트랜잭션은 sl실행 가능
        • exclusive lock : 해당 데이터에 read, write 가능, 다른 트랜잭션은 el실행 불가
    • lock : 트랜잭션이 사용할 데이터에 대한 독점권을 가지기 위해 사용
      • 전체 data에 lock 연산을 하면? 제어가 간단하지만 병행 수행이라 할 수 없음.
      • 속성(가장 작은 단위의 data)에  lock연산을 하면? 많은 트랜잭션이 병행 수행을 할 수 있지만 제어가 복잡함.
      • 병행성 v 제어 난이도 ^ 단위 v
    • unlock : 트랜잭션이 데이터에 대한 독점권을 반납하기 위해 사용
  • 2단계 locking 규약
    • 모든 트랜잭션이 위 규약을 준수하면 직렬 가능성이 보장된다. 
    • 1. 확장 단계
      • 트랜잭션이 lock한 연산만 실행할 수 있고, unlock한 연산은 실행할 수 없는 단계
    • 2. 축소 단계
      • 트랜잭션이 unlock한 연산만 실행할 수 있고, lock한 연산은 실행할 수 없는 단계
  • 교착 상태?
    • 트랜잭션들이 상대가 독점하고 있는 데이터에 unlock연산이 실행되기를 서로 기다리며 트랜잭션의 수행을 중단해 더이상 수행을 계속하지 못하고 계속 기다리는 상태

 

728x90

댓글