Имеет ли смысл индексировать данные с небольшим количеством возможных значений?

Question

Gymterview · Accepted Answer

В общем случае нет: при низкой кардинальности индекс не сужает выборку достаточно сильно, и полное сканирование быстрее. Исключения: сильно перекошенное распределение (99% true, 1% false — индекс полезен для поиска false), частичные индексы (индексируют только подмножество строк), bitmap-индексы в OLAP, и составной индекс с высококардинальным столбцом.

Ситуация	Пояснение
Сильно перекошенное распределение	99% записей `active = true`, 1% `active = false`. Индекс полезен для поиска `false`
Частичный индекс	`CREATE INDEX idx ON users(email) WHERE active = false` — индексирует только 1% строк
Битовый индекс (bitmap)	В OLAP-системах эффективен при низкой кардинальности (Oracle, PostgreSQL при Bitmap Index Scan)
Составной индекс	Столбец с низкой кардинальностью + столбец с высокой: `(status, created_at)`

Имеет ли смысл индексировать данные с небольшим количеством возможных значений?

Почему индекс неэффективен при низкой кардинальности

Когда всё-таки имеет смысл

Кардинальность и селективность