MongoDB에서 실행 계획 확인하는 방법

Notice

Recent Posts

Recent Comments

Link

« 2025/12 »
일	월	화	수	목	금	토
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

DOing

MongoDB에서 실행 계획 확인하는 방법 본문

Database

MongoDB에서 실행 계획 확인하는 방법

mangdo 2022. 11. 5. 19:18

MongoDB에서 실행계획을 선택하는 방법

주요 로직

• RDBMS 와 비교했을 때 MongoDB는 각 컬렉션에 대한 통계 정보가 거의 없다.

• MongoDB는 규칙 기반의 옵티마이저 (rule-based optimizer)

• 규칙기반 옵티마이저는 RDBMS에서 허점이 많아서 거의 사용하지 않는 최적화 방법

• MongoDB는 실행 계획 후보를 모두 동시에 실행(쿼리의 일부분만)해보는 형태로 단점을 보완

예시

1) 한 쿼리에 대해 실행계획 후보가 3개

2) 3개를 동시에 쿼리 실행

3) 3개 중에서 어느 하나라도 먼저 실행이 완료되거나 101건의 도큐먼트를 먼저 검색하는 경우 멈추게 된다.

• 101건이 많다고 생각되면 기본값을 변경할 수 있다. 하지만 바꾸려면 collFration과 works 옵션도 같이 조정하는 것이 좋다.

• 이때 선택된 플랜을 winning plan이라고 한다.

플랜 캐시

• 플랜 캐시란?

• 최적의 쿼리 실행계획이 수립되기 위해서 실행 계획을 직접 실행한다.

• 이런 이유로 실행 계획을 수립하는 과정 자체도 많은 시간이 걸릴 수 있어서 캐시를 이용한다.

• 캐시 사이즈

• 최대 5000개(MongoDB 3.6 기준)

• 5000개가 넘으면 사용되지 않는 실행계획이 캐시에서 삭제

• 해당 컬렌션의 인덱스가 추가 또는 삭제되는 경우에도 캐시 삭제

• 5000이라는 숫자는 db.runCommand( {setParameter:1, internalQueryCacheSize: 6000 }) 변경 가능

• 같은 패턴의 쿼리인지 확인하는 방법

• 같은 패턴의 쿼리라면 플랜캐시 활용한다.

• Query Shape

• 쿼리 조건(query predicate)

• 정렬조건(sort)

• 조회필드(projection)

• 플랜캐시의 성능이 아직도 유효한지 체크하는 방법

• 플랜캐시에서 꺼내기 → 성능 재평가

• 지정된만큼의 도큐먼트만 읽어서 internalQueryPlanEvalueionMaxResults 에 정의한 수만큼 도큐먼트를 가져올 수 있는지 판단하는 형태

• 최초 실행계획을 수립할 때 work() 함수의 호출 횟수 x internalQueryCaheEvictionRatio

• 쿼리 재평가 과정도 결국 쿼리의 일부를 실행해보는 과정이다. 만약 실행 계획 수립과정이 커리 처리 성능에 미치는 영향이 큰 서비스라면 이 옵션을 좀 더 낮은 수치로 조정해서 성능 테스트를 해봐도 좋을 듯하다.. 라고 권유하고 있다.

실행 계획 확인

QueryPlanner

: 디폴트이며, 가장 단순한 실행계획 출력한다.

: 어떤 인덱스를 사용했는가 정도를 나타낸다.

- 실행 쿼리

ExecutionStats

: 선택한 실행계획의 상세한 내용까지 출력한다.

- 실행 쿼리

• 주요 확인 요소

• nReturned : 실제 클라이언트로 반환된 도큐먼트의 건수

• executionTimeMillis : 각 스테이지의 실행 시간

• totalKeyExamined : 쿼리를 처리하기 위해서 인덱스에서 읽은 인덱스 키의 개수

• totalDocsExamined : 쿼리를 처리하기 위해서 컬렉션의 데이터 파일에서 읽은 도큐먼트의 개수

+) works?

• 각 스테이지들이 자식 스테이지의 work()를 호출한 횟수

• work() 호출은 도큐먼트 단위로 호출

• work()함수 호출은 대표적으로 다음 3종류의 리턴 값을 반환

• ADVANCE

: 스테이지의 처리 결과 한건의 도큐먼트 또는 ID(프라이머리 키) 값을 반환

• NEED_TIME

: 스테이지 처리는 완료되었지만, 결과 도큐먼트나 ID 값은 반환되지 않음.

: 주로, 블로킹 스테이지일때 발생

: 대표적인 블로킹 스테이지는 인덱스를 사용하지 못하는 정렬이나 그룹핑 스테이지, 인덱스를 사용하지 못하는 필터링 스테이지
ex) 인덱스를 이용해서 도큐먼트 한건을 읽었는데, 이 도큐먼트가 다른 조건(인덱스를 사용하지 못하는 경우)에 의해서 버려지는 경우다.

: 얼마나 도큐먼트를 읽고 버렸는지, 얼마나 정렬 수행을 했는지를 확인할 수 있다.

• IS_EOF

: 스테이지 처리를 완료했으며, 더 이상 읽을 도큐먼트나 ID가 없다.

AllPlansExecution

: 모든 실행 계획 후보들까지 실행한다.

- 실행 쿼리

Explain Results

• 루트 스테이지에서 하위 스테이지를 콜한다.

• 실제로 수행되는 것은 루트 스테이지에서 부터이다.

• stage 예시

• COLLSCAN : 컬렉션 풀 스캔

• IXSCAN : 인덱스 레인지 스캔

• FETCH : 인덱스 레인지 스캔으로 읽은 인덱스키와 recordId를 이용해서 컬렉션의 도큐먼트를 읽기

• SORT

• COUNT

• LIMIT

• GROUP

MongoDB Compass에서 실행시

Ref.

대용량 데이터 처리를 위한 Real MongoDB : 이성욱, 2018, 위키북스

저작자표시 비영리 변경금지 (새창열림)

'Database' 카테고리의 다른 글

MongoDB에 Logrotate 설정하기 (0)	2022.11.05

'Database' Related Articles

MongoDB에 Logrotate 설정하기 2022.11.05

DOing

MongoDB에서 실행 계획 확인하는 방법 본문

MongoDB에서 실행 계획 확인하는 방법

MongoDB에서 실행계획을 선택하는 방법

플랜 캐시

실행 계획 확인

Explain Results

'Database' 카테고리의 다른 글

티스토리툴바