본문 바로가기
자격증/SQL개발자(SQLD)

5-3장. SQL 최적화 기본 원리(조인 수행 원리)

by 김엉배 2023. 6. 4.
728x90
반응형

 

SQLD 단원별 목록으로


1. 조인 수행 원리

  • 조인이란 두 개 이상의 테이블을 하나의 집합으로 만드는 연산이다. SQL문에서 FROM 절에 두 개 이상의 테이블이 나열될 경우 조인이 수행된다.
  • 조인 기법은 두 개의 테이블을 조인할 때 사용할 수 있는 방법이다. 여기서는 조인 기법 중에서 자주 사용되는 NL Join, Hash Join, Sort Merge Join 등이  있다.

 


2. NL Join

- NL Join은 프로그래밍에서 사용하는 중첩된 반복문과 유사한 방식으로 조인을 수행한다.

  • NL Join의 작업 방법
    1) 선행 테이블에서 주어진 조건을 만족하는 행을 찾음
    2) 선행 테이블의 조인 키 값을 가지고 후행 테이블에서 조인 수행
    3) 선행 테이블의 조건을 만족하는 모든 행에 대해 1번 작업 반복 수행

  • NL Join 기법은 조인이 성공하면 바로 조인 결과를 사용자에게 보여 줄 수 있다. 그 래서 결과를 가능한 한 빨리 화면에 보여줘야 하는 온라인 프로그램에 적당한 조인 기법이다.

 

 


3. Sort Merge Join

  • 조인 칼럼을 기준으로 데이터를 정렬하여 조인을 수행한다.
  • 주로 스캔 방식으로 데이터를 읽는다.
  • 랜덤 액세스로 NL Join에서 부담이 되던 넓은 범위의 데이터를 처리할 때 이용되던 조인 기법이다.
  • 정렬할 데이터 가 많아 메모리에서 모든 정렬 작업을 수행하기 어려운 경우에는 임시 영역을 사용해 성능이 떨어질 수 있다.

  • Sort Merge Join의 동작
    1) 선행 테이블에서 주어진 조건을 만족하는 행을 찾음
    2) 선행 테이블의 조인 키를 기준으로 정렬 작업을 수행
    1~2) 작업을 선행 테이블의 조건을 만족하는 모든 행에 대해 반복 수행
    3) 후행 테이블에서 주어진 조건을 만족하는 행을 찾음
    4) 후행 테이블의 조인 키를 기준으로 정렬 작업을 수행
    4~5) 작업을 후행 테이블의 조건을 만족하는 모든 행에 대해 반복 수행
    6) 정렬된 결과를 이용하여 조인을 수행하며 조인에 성공하면 추출버퍼에 넣음

  • Sort Merge Join은 조인 칼럼의 인덱스를 사용하지 않기에 조인 칼럼의 인덱스가 존재하지 않을 경우에도 사용할 수 있는 조인 기법

 

 


4. Hash Join

  • Hash Join은 해슁 기법을 이용하여 조인을 수행한다.
  • 조인을 수행할 테이블의 조인 칼럼 을 기준으로 해쉬 함수를 수행하여 서로 동일한 해쉬 값을 갖는 것들 사이에서 실제 값이 같은지를 비교하면서 조인을 수행한다.
  • Hash Join은 NL Join의 랜덤 액세스 문제점과 Sort Merge Join의 문제점인 정렬 작업의 부담을 해결 위한 대안으로 등장하였다.

  • Hash Join의 동작
    1) 선행 테이블에서 주어진 조건을 만족하는 행을 찾음
    2) 선행 테이블의 조인 키를 기준으로 해쉬 함수를 적용하여 해쉬 테이블을 생성
     → 조인 칼럼과 SELECT 절에서 필요로 하는 칼럼도 함께 저장됨
    1~2) 작업을 선행 테이블의 조건을 만족하는 모든 행에 대해 반복 수행
    3) 후행 테이블에서 주어진 조건을 만족하는 행을 찾음
    4) 후행 테이블의 조인 키를 기준으로 해쉬 함수를 적용하여 해당 버킷을 찾음
     → 조인 키를 이용해서 실제 조인될 데이터를 찾음
    5) 조인에 성공하면 추출버퍼에 넣음
    3~5) 작업을 후행 테이블의 조건을 만족하는 모든 행에 대해서 반복 수행

  • Hash Join은 조인 칼럼의 인덱스를 사용하지 않기 때문에 조인 칼럼의 인덱스가 존재하 지 않을 경우에도 사용할 수 있는 조인 기법.

  • Hash Join에서는 선행 테이블을 이용하여 먼저 해쉬 테이블을 생성한다고 해서 선행 테 이블을 Build Input이라고도 하며, 후행 테이블은 만들어진 해쉬 테이블에 대해 해쉬 값의 존재여부를 검사한다고 해서 Prove Input이라고도 한다.
728x90
반응형