[CS][데이터베이스 시스템 3판] Chapter18. Cash Recovery

y-seo 2023. 12. 7. 23:18

Atomicity : Transaction이 abort 할 수 있다. (rollback)
Durability → 만약 DBMS가 실행을 중단하면?
시스템 재시작 후 원하는 동작
- T1, T2, T3가 durable 해야 한다. (이미 commit 되어 durability를 책임져야 한다.) → 변경 상태가 DB에 남아 있어야 한다. (안 남아 있다면 ReDo 필요)
- T4, T5는 abort(스스로X, 시스템이) 되어야 한다. (atomicity를 책임져야 한다.) → action이 없던 것처럼 recover 되어야 한다. (recovery는 abort 까지만, 다시 수행시키지는 않는다.)
  - Read : 상태변화 X → 상관 X, 영향 X
  - Write : 상태변화 했을 수도 → 상관 O, 모든 경우에 대해 abort 할 수 있어야 한다. UNDO가 필요할 수도

REDO와 UNDO를 위해 기록을 남긴다.
read는 문제 없지만 write가 문제다.
REDO
- commit 된 transaction을 재실행
- 새로운 value가 필요 (어떻게 바꾸었다.)
- 로그의 적당한 위치에서 시작하여 모든 액션들을 반복하고 DB 상태를 장애시점이 있었던 상태로 복구한다.
UNDO
- dirty data를 읽는 fail이나 uncommit 된 transaction의 operation을 실행취소 해야 한다.
- old value가 필요하다. (어떤걸 UNDO 할지)
- DB에 완료된 transaction 액션만 반영이 되도록 하기 위해서 완료하지 않은 transaction의 액션들을 실행 취소한다.
log에 모든 업데이트에 대한 REDO, UNDO 정보를 기록해야 한다.
log에 순차적으로 작성한다. (separate disk에 둔다.)
최소한의 정보(diff)를 기록하여 여러개의 update가 하나의 log page에 들어간다. (시간 단축을 위해서)

해당 data page가 disk에 도달하기 전에 update를 위해 log record를 강제로 기록한다.
- log가 먼저 쓰여져야 한다.
- automicity를 보장한다. (undo가 난 상황을 생각했을 때)
commit 하기 전에 transaction에 대한 모든 log record를 write 해야 한다.
- durability를 보장한다.
- commit 하면 어차피 log에 남는데 log를 먼저 쓰고 commit을 수행하는 것

system crash일 때 recovery에 걸리는 시간을 최소화 하기 위해 DBMS가 주기적으로 checkpoint를 생성한다.
checkpoint도 log에 남아야 한다.
checkpoint가 포함하는 것
- checkpoint record를 log storage에 강제로 보낸다.
- DB buffer의 내용을 DB로 강제로 보낸다.
- log 내 checkpoint record의 주소를 master record에 기록한다. (checkpoint 시점의 정보가 있다.)
chekpoint : recovery 시 sacn할 log의 양을 제한할 수 있는 빠른 방법
Checkpoint가 없다면 crash → 전체 Transaction REDO → 오래걸린다. → 중간중간 Disk에 반영해놔야 한다. → Recovery 부담을 줄이자.
checkpoint 이전에 수행된 작업은 REDO 할 필요가 없다.