Repository

Category B

1. Index 자료구조 선택 문제

자료구조 관점에서 보면

이론적으로 Hash가 더 빠른 구조처럼 보이지만 대부분의 데이터베이스에서는 Index 구조로 B+Tree를 사용.

그 이유는 데이터베이스의 실제 검색 패턴 때문.

Hash Index는 특정 값 검색(Equal Search)에 매우 빠른 구조.

하지만 다음과 같은 제약 존재.

예시

WHERE id = 10

→ 효율적

WHERE id > 10

→ 비효율적

이러한 이유로 DB 검색 패턴과 맞지 않는 경우가 많음.

대부분의 RDBMS에서 사용하는 기본 인덱스 구조.

특히 다음 연산에서 강점 존재.

B+Tree는 리프 노드가 연결된 구조이기 때문에 범위 데이터 조회 시 Sequential Access 가능.

데이터베이스 검색은 단순한 단일 값 조회보다 범위 검색이 훨씬 많음.

대표적인 SQL 패턴

WHERE id = 10
WHERE id > 10
WHERE id BETWEEN 10 AND 20
ORDER BY id

이러한 조건을 효율적으로 처리하기 위해 정렬 기반 구조인 B+Tree가 더 적합.

Hash Index

단일 값 검색에 매우 빠른 구조

평균 시간 복잡도 O(1)

범위 검색에 부적합

B+Tree Index

정렬된 데이터 구조

Range Query 처리 가능

대부분의 RDBMS에서 기본 인덱스 구조로 사용

PostgreSQL Documentation, Index Types https://www.postgresql.org/docs/current/indexes-types.html
PostgreSQL Documentation, Indexes https://www.postgresql.org/docs/current/indexes.html