본문 바로가기

CS 스터디

4.3 트랜잭션과 무결성

참고한 책: 면접을 위한 CS 전공지식 노트 (http://www.yes24.com/Product/Goods/108887922)

4. 데이터베이스

    4.3. 트랜잭션과 무결성

        4.3.1. 트랜잭션

        4.3.2. 무결성

 

p. 206

4.3.1 트랜잭션

데이터베이스에서 하나의 논리적 기능을 수행하기 위한 작업의 단위.

-> 여러 개의 쿼리들을 하나로 묶는 단위.

특징으로는 원자성, 일관성, 독립성, 지속성이 있음. (ACID)

 

원자성(atomicity)

트랜잭션과 관련된 일이 모두 수행되었거나  수행되지 않았거나를 보장하는 특징.

예) 트랜잭션을 커밋했는데, 문제가 발생하여 롤백하는 경우 그 이후에 모두 수행되지 않음을 보장하는 것.

트랜잭션 단위로 여러 로직들을 묶을 때 외부 API를 호출하는 것이 있으면 안되고, 있다면 롤백이 일어났을 때 어떻게 할지 해결 방법이 있어야 하고 트랜잭션 전파를 신경써서 관리해야 함

 

커밋과 롤백

커밋(commit): 여러 쿼리가 성공적으로 처리되었다고 확정하는 명령어. 트랜잭션 단위로 수행되며 변경된 내용이 모두 영구적으로 저장되는 것.

"커밋이 수행되었다." == "하나의 트랜잭션이 성공적으로 수행되었다."

롤백: 트랜잭션으로 처리한 하나의 묶음 과정을 일어나기 전으로 돌리는 일(취소)을 말함.

커밋과 롤백 덕에 데이터의 무결성이 보장되고, 데이터 변경 전에 변경 사항을 쉽게 확인할 수 있고 해당 작업을 그룹화할 수 있음.

 

트랜잭션 전파

트랜잭션을 수행할 때 커넥션 단위로 수행하기 때문에 커넥션 객체를 넘겨서 수행해야하지만 매번 넘겨주기 어려움. 넘겨서 수행하지 않고 여러 트랜잭션 관련 메소드의 호출을 하나의 트랜잭션에 묶이도록 하는 것.

@Service
@Transactional(readOnly = true)
public class MemberService{
	private final MemberRepository memberRepository;
    
    public MemberService(MemberRepository memberRepository){
    	this.memberRepository = memberRepository;
    }
}

Spring 프레임워크에서는 @Transactional 애너테이션을 통해 여러 쿼리 관련 코드들을 하나의 트랜잭션으로 처리함.

 

일관성(consistency)

'허용된 방식'으로만 데이터를 변경해야 하는 것.

데이터베이스에 기록된 모든 데이터는 여러 가지 조건, 규칙에 따라 유효함을 가져야 함.

예) 통장 잔고가 0인 사람이 다른사람에게 500만원을 입금할 수 없음.(마이너스 통장 제외)

 

격리성(isolation)

트랜잭션 수행 시 서로 끼어들지 못하는 것.

복수의 병렬 트랜잭션은 서로 격리되어 마치 순차적으로 실행되는 것처럼 작동되어야 하고, 데이터베이스는 여러 사용자가 같은 데이터에 접근할 수 있어야 함. 격리성은 여러 개의 격리 수준으로 나뉘어 격리성을 보장함.

 

동시성







격리성
READ_UNCOMMITTED
READ_COMMITTED 더티 리드
REPEATABLE_READ 반복가능하지 않은 조회
SERIALIZABLE 팬텀리드
 

격리 수준에 따라 발생하는 현상

팬텀 리드, 반복 가능하지 않은 조회, 더티 리드

 

팬텀 리드(phantom read)

한 트랜잭션 내에서 동일한 쿼리를 보냈을 때 해당 조회 결과가 다른 경우

  • 예) A가 레코드를 조회하고 B가 레코드를 추가하여 A가 다시 조회할 때 존재하지 않은 레코드가 조회되는 경우

 

반복 가능하지 않은 조회(non-repeatable read)

한 트랜 잭션 내의 같은 행에 두 번이상 조회가 발생했는데 그 값이 다른 경우

  • 예) A가 레코드를 여러 번 조회하던 중 B가 레코드를 변경하여 A가 조회한 값이 달라지는 경우

팬텀 리드와 다른 점은 반복 가능하지 않은 조회는 행 값이 달라질 수도 있는데, 팬텀 리드는 다른 행이 선택될 수도 있다는 것을 의미함.

 

더티 리드(dirty read)

반복가능하지 않은 조회와 유사하며 한 트랜잭션이 실행 중일 때 다른 트랜잭션에 의해 수정되었지만 아직 '커밋되지 않은' 행의 데이터를 읽을 수 있을 때

  • 예) B가 레코드를 추가하고 커밋을 하지 않았지만, A가 해당 레코드를 조회할 수 있는 경우

예시 출처: https://greeng00se.tistory.com/37

 

격리 수준

SERIALIZABLE

트랜잭션을 순차적으로 진행시키는 것.

여러 트랜잭션이 동시에 같은 행에 접근할 수 없다.

교착 상태가 일어날 확률 도 많고 가장 성능이 떨어지는 격리 수준

 

REPEATABLE_READ

하나의 트랜잭션이 수정한 행을 다른 트랜잭션이 수정할 수 없도록 막아주지만 새로운 행을 추가하는 것은 막지 않음.

이후에 추가된 행이 발견될 수 있음.

 

READ_COMMITTED

가장 많이 사용되는 격리 수준. (MySQL8.0, PostgreSQL, SQL Server, 오라클에서 기본값으로 설정되어 있음.)

READ_UNCOMMITTED와 달리 다른 트랜잭션이 커밋하지 않은 정보는 읽을 수 없음.

커밋 완료된 데이터에 대해서만 조회 허용.

어떤 트랜잭션이 접근한 행을 다른 트랜잭션이 수정할 수 있음.

 

READ_UNCOMMITTED

가장 낮은 격리 수준.

하나의 트랜잭션이 커밋되기 전에 다른 트랜잭션에 노출되는 문제가 있지만 가장 빠름.

 

지속성(durability)

성공적으로 수행된 트랜잭션은 영원히 반영되어야 하는 것을 의미.

데이터베이스에 시스템 장애가 발생해도 원래 상태로 복구하는 회복 기능이 있어야 함.

데이터베이스는 이를 위해 체크섬, 저널링, 롤백 등의 기능을 제공함.

 

체크섬

중복 검사의 한 형태. 오류 정정을 통해 송신된 자료의 무결성을 보호하는 단순한 방법

 

저널링

파일 시스템 또는 데이터베이스 시스템에 변경사항을 반영(commit)하기 전에 로깅하는 것, 트랜 잭션 등 변경 사항에 대한 로그를 남기는 것.

 

p. 212

4.3.2 무결성

데이터의 정확성, 일관성, 유효성을 유지하는 것.

무결성이 유지되어야 데이터베이스에 저장된 데이터 값과 그 값에 해당하는 현실 세계의 실제 값이 일치하는지에 대한 신뢰가 생김.

 
개체 무결성 기본키로 선택된 필드는 빈 값을 허용하지 않음.
참조 무결성 서로 참조 관계에 있는 두 테이블의 데이터는 항상 일관된 값을 유지해야 함.

릴레이션 간의 참조 관계를 정의하는 제약조건으로 외래키는 참조할 수 없는 키를 가질 수 없다는 것이다. 외래키와 관련되었기 때문에 외래키 제약이라고도 한다. 자신이 참조하는 릴레이션의 참조 가능한 기본키만 외래키로 사용해야 하며, 값이 없을 경우 외래키 값은 NULL이 될 수 있다.
(출처: https://velog.io/@chappi/DB%EC%A0%95%EB%A6%AC%EB%8A%94-%ED%95%A0%EA%BB%80%EB%8D%B0-%ED%95%B5%EC%8B%AC%EB%A7%8C-%ED%95%A0%EA%BB%8D%EB%8B%88%EB%8B%A4.-%ED%82%A4%EC%99%80-%EB%AC%B4%EA%B2%B0%EC%84%B1 )
고유 무결성 특정 속성에 대해 고유한 값을 가지도록 조건이 주어진 경우 그 속성 값은 모두 고유한 값을 가짐.
NULL 무결성 특정 속성 값에 NULL이 올 수 없다는 조건이 주어진 경우 그 속성 값은 NULL이 될 수 없다는 제약 조건.

'CS 스터디' 카테고리의 다른 글

4.5 인덱스  (0) 2023.06.21
4.4 데이터 베이스의 종류  (0) 2023.06.21
4.2 ERD와 정규화 과정  (0) 2023.06.16
4.1 데이터베이스의 기본  (0) 2023.06.16
3.4 CPU 스케줄링 알고리즘  (0) 2023.06.14