database/mysql

[MySQL] Query 성능 확인

moonsiri 2020. 11. 1. 00:18
728x90
반응형

1. Explain : 쿼리 명령문을 어떻게 수행할 것인지 실행 계획에 대한 정보

2. Profiling : 현재 세션 과정 동안 실행 문에 대한 리소스 정보

3. Optimizer_trace : 실제 실행 시 바람직한 비용 기반으로 계획을 선택한 과정 정보

 

 

Explain

 

쿼리 실행 플랜 정보를 optimizer에서 가져와서 출력.

EXPLAIN SELECT Query;

ID

  • 실행계획의 순서. 이 순서대로 select 문이 실행.

 

select_type

  • select 문의 유형
  • SIMPLE : 단순 select문
  • PRIMARY : 첫번째 쿼리
  • DERIVED : select문으로 추출된 테이블 ( from 절에서의 서브쿼리 또는 inline view)
  • SUBQUERY : sub query 중 첫번째 select문
  • UNION : UNION쿼리에서 PRIMARY를 제외한 나머지 select문
  • DEPENDENT SUBQUERY
  • DEPENDENT UNION

 

table

  • 대상이 되는 테이블명 혹은 Alias

 

partitions

  • 파티션 사용 시, 대상이 되는 파티션

 

type

  • data access 타입. 우수한 순서대로 아래 설명. 뒤로 갈수록 나쁜 형태.
  • system : 0개 또는 하나의 row를 가진 테이블. const 타입의 특별한 케이스. (MyISAM, Memory 테이블)
  • const : primary key나 unique Key의 모든 컬럼에 대해 equal 조건으로 검색 반드시 1건의 레코드만 반환
SELECT * FROM tbl_name WHERE primary_key = 1;
  • eq_ref : 조인에서 첫 번째 읽은 테이블의 컬럼값을 이용해 두 번째 테이블을 primary key나 unique Key로 equal 조건 검색으로 두번째 테이블은 반드시 1건의 레코드만 반환 (1:1 관계)
SELECT * FROM ref_table, other_table
WHERE ref_table.key_column = other_table.column;
  • ref : 조인의 순서와 인덱스의 종류와 관계없이 equal 조건으로 검색 (1:n 관계)
SELECT * FROM ref_table WHERE key_column = expr;
  • unique_subquery : IN(sub-query) 형태의 조건에서 반환 값에 중복 없음
  • index_subquery : unique_subquery와 비슷하지만 반환 값에 중복 있음
  • range : 인덱스를 하나의 값이 아니라 범위로 검색. 가장 많이 사용
SELECT * FROM tbl_name
WHERE key_column BETWEEN 0 AND 20;
  • Index : 인덱스를 처음부터 끝까지 읽는 인덱스 풀 스캔
  • All : 풀스캔. 성능 가장 안 좋음

possible_keys

  • 해당 테이블에서 데이터를 찾기위해 선택한 인덱스 목록

key

  • 실제로 쿼리 실행에 사용한 인덱스

key_len

  • 쿼리를 처리하기 위해 단일, 다중 컬럼으로 구성된 인덱스의 각 레코드에서 몇 바이트까지 사용했는지

ref

  • 행을 추출하는데 키와 함께 사용된 컬럼이나 상수 값

rows

  • 쿼리 수행에서 예상하는 검색해야 할 행수. 조인문이나 서브쿼리 최적화에 있어서 중요한 항목.
  • 조회 결과 수와 rows가 차이가 크다면 성능 개선 필요

Extra

  • 쿼리에 관한 추가적인 정보
  • distinct : 이미 처리한 값과 동일한 값을 가진 Row는 처리하지 않음.
  • not exist : left join을 수행함에 매치되는 한 행을 찾으면 더 이상 매치되는 행을 검색하지 않음.
  • Range checked for each record :사용할 좋은 인덱스가 없음.
  • using filesort : 정렬을 위해 추가적인 과정을 필요로 함(물리적인 정렬작업 수행)
  • using index : 실제 데이터 Block을 읽지 않고 인덱스 Block 만으로 결과를 생성할 수 있는 경우
  • using temporary : 임시 테이블을 사용. order by 나 group by 절이 각기 다른 컬럼을 사용할 때 발생
  • using where : where절이 다음 조인에 사용될 행이나 클라이언트에게 돌려질 행을 제한하는 경우
  • using index for group-by

=> 쿼리를 가능한 한 빠르게 하려면, Extra 값의 Using filesort나 Using temporary에 주의해야 함.

=> EXPLAIN의 출력 내용 중 rows 컬럼값들을 곱해봄으로써 얼마나 효과적인 join을 실행하고 있는지 알 수 있다.

 

 

 

Profiles

 

쿼리가 처리되는 동안 각 단계별 작업에 시간이 얼마나 걸리는지 확인

Profiles 사용법 (profile 설정 -> 쿼리 실행 -> 결과 확인)

1. 확인 (Default : 0 (off) / 1 : ON)

SELECT @@profiling;

 

2. 설정

SET profiling = 1;

 

3. profiling history size 변경 (Default : 15 / 0 ~ 100)

SET @@profiling_history_size = 100;

 

4. 쿼리 실행

 

5. Profile 된 리스트 조회

SHOW PROFILES;

SHOW PROFILE ALL FOR QUERY 43; -- ALL 말고도 CPU/IPC/SOURCE/SWAPS 등으로 조회 가능

Sending data : 쿼리의 실행결과 데이터를 테이블로부터 읽으면서 전송하는 것까지 포함된 시간

SELECT STATE, FORMAT(DURATION, 6) AS DURATION
FROM INFORMATION_SCHEMA.PROFILING
WHERE QUERY_ID = 43
ORDER BY SEQ;

 

6. 비활성화

SET profiling = 0;

 

 

Optimizer_trace

 

Optimizer는 여러 조건들을 통해 쿼리 플랜을 최초 작성하고, 마지막으로 한번 더 정리하는 과정.

테이블에 인덱스가 있어도 비용에 따라 table scan을 사용할 수 있으며 이 경우 인덱스가 사용되지 않은 이유를 확인 가능.

성능 저하가 될 수 있기에 사용 후 off.

Optimizer_trace 사용법

1. Optimizer_trace 활성화

SHOW VARIABLES LIKE 'optimizer_trace';
SET OPTIMIZER_TRACE = 'enabled=on';

 

2. 쿼리 실행

 

3. information_schema.optimizer_trace 확인

SELECT * FROM INFORMATION_SCHEMA.OPTIMIZER_TRACE;

 

4. Optimizer_trace 비활성화

SET OPRIMIZER_TRACE = 'enable=OFF';

728x90
반응형