Перейти к основному содержимому

psql_lockmon. Расширение для мониторинга блокировки

Версия: 1.0.

В исходном дистрибутиве установлено по умолчанию: да.

Связанные компоненты: отсутствуют.

Схема размещения: ext.

Расширение реализовано в виде двух дополнительных представлений, основанных на pg_locks и pg_stat_activity, которые вносят минимальный вклад в блокировки объектов. Информация, выводимая представлениями, исключает собственные зависимости и блокировки.

Назначение модуля:

  • оперативный анализ блокировок сессий;
  • выявление слабых мест производительности.

Расширение psql_lockmon используется как инструмент для оперативного мониторинга заблокированных объектов. Подробнее с этой функциональностью можно ознакомиться в документе «Руководство администратора», раздел «Сценарии администрирования», подраздел «Мониторинг блокировок».

Объекты

Решение предоставляет следующие объекты:

locks_plain

locks_plain

Поле
Тип
Описание
locktype
text
Тип блокируемого объекта:
- relation (отношение);
- extend (расширение отношения);
- frozenid (замороженный идентификатор);
- page (страница);
- tuple (кортеж);
- transactionid (идентификатор транзакции);
- virtualxid (виртуальный идентификатор);
- object (объект);
- userlock (пользовательская блокировка);
- advisory (рекомендательная)
relation
text
Отношение, являющееся целью блокировки.

NULL, если целью блокировки не является отношение или его часть.

Перед именем отношения указывается признак репликации объекта и его тип.

Признаки репликации:
- Ordinary: обычные объекты;
- Unlogged: объекты, созданные с признаком Unlogged, или их зависимости;
- Temporary: объекты, созданные с признаком Temporary, или их зависимости;

Типы объектов:
- Table: таблицы;
- Index: индексы, включая primary key;
- Sequence: последовательности;
- TOAST: TOAST таблицы;
- View: представления;
- MatView: материализованные представления;
- CompositeType: составные типы;
- ForeignTable: внешние таблицы;
- PartitionedTable: партиции;
- PartitionedIndex: индексы партиций
page
int4
Номер страницы в отношении, являющейся целью блокировки, либо NULL, если цель блокировки не страница или кортеж отношения
tuple
int2
Номер кортежа на странице, являющегося целью блокировки, либо NULL, если цель блокировки не кортеж
virtualxid
text
Виртуальный идентификатор транзакции, являющийся целью блокировки, либо NULL, если цель блокировки — другой объект
transactionid
xid
Идентификатор транзакции, являющийся целью блокировки, либо NULL, если цель блокировки — другой объект
classid
oid
OID системного каталога pg_class, содержащего цель блокировки, либо NULL, если цель блокировки не обычный объект базы данных
objid
oid
OID цели блокировки в соответствующем системном каталоге, либо NULL, если цель блокировки не обычный объект базы данных
objsubid
int2
Номер столбца, являющегося целью блокировки (на саму таблицу указывают classid и objid);
- 0 (ноль), если это некоторый другой обычный объект базы данных;
- NULL, если целью не является обычный объект
virtualtransaction
text
Виртуальный идентификатор транзакции, удерживающей или ожидающей блокировку
pid
int4
Идентификатор серверного процесса (PID, Process ID), удерживающего или ожидающего эту блокировку, либо NULL, если блокировка удерживается подготовленной транзакцией
blocking_pids
text
Список идентификаторов серверных процессов, удерживающих блокировки, необходимые процессу (через точку с запятой)
safe_snapshot_blocking_pids
text
Список идентификаторов серверных процессов, удерживающих блокировки, необходимые процессу, с установленным уровнем изоляции транзакции SERIALIZABLE или REPEATABLE READ (через точку запятой)
mode
text
Название режима блокировки, которая удерживается или запрашивается процессом
granted
bool
True – блокировка получена;
false – блокировка ожидается
fastpath
bool
True – блокировка получена по короткому пути;
false – блокировка получена через основную таблицу блокировок
database
name
База данных, к которой относится цель блокировки;
- 0 (ноль), если разделяемый объект;
- NULL, если целью является идентификатор транзакции
username
name
Имя пользователя, создавшего подключение.

Внимание: переключение ролей через SET ROLE, SET SESSION AUTHORIZATION не меняют отображаемого имени пользователя
client_app_name
text
Название приложения, подключенного к этому серверному процессу
client_addr
text
IP-адрес клиента, подключенного к этому серверному процессу.

Значения:
- null означает, что клиент подключен как внутренний процесс (автоочистка);
- -1 означает, что клиент подключен через сокет Unix на стороне сервера
ssl
bool
True – подключение произведено с использованием SSL;

False – подключение произведено без SSL
sslversion
text
Версия TLS, при наличии
sslcipher
text
Используемый алгоритм шифрования, при наличии
sslbits
int4
Длина ключа SSL, при наличии
sslcompression
bool
Признак использования сжатия SSL соединения, при наличии
sslclientdn
text
Значение поля CN сертификата клиента, при наличии
backend_xid
xid
Идентификатор верхнего уровня транзакции этого серверного процесса или любой другой
backend_xmin
xid
Текущая граница xmin для серверного процесса
backend_type
text
Тип текущего серверного процесса.

Возможные варианты:
- autovacuum launcher;
- autovacuum worker;
- logical replication launcher;
- logical replication worker;
- parallel worker;
- background writer;
- client backend;
- checkpointer;
- startup;
- walreceiver;
walsender;
- walwriter

Фоновые рабочие процессы, регистрируемые расширениями, могут иметь дополнительные типы
backend_age
interval
Время, прошедшее с момента запуска процесса. Для процессов, обслуживающих клиентов, это время подключения клиента к серверу
xact_age
interval
Время, прошедшее с начала текущей транзакции в этом процессе или null при отсутствии активной транзакции. Если текущий запрос был первым в своей транзакции, то значение в этом столбце совпадает со значением столбца query_age
query_age
interval
Время, прошедшее с начала выполнения активного в данный момент запроса, или, если state не active, то время начала выполнения последнего запроса
state_change_age
interval
Время, прошедшее с последнего изменения состояния (поле state)
transaction_last_commit_age
interval
Время, прошедшее с фиксации последней транзакции (при включенном параметре track_commit_timestamp)
wait_event_type
text
Тип события, которого ждет обслуживающий процесс, если это имеет место; в противном случае — NULL
wait_event
text
Имя ожидаемого события, если обслуживающий процесс находится в состоянии ожидания, а в противном случае — NULL
state
text
Общее текущее состояние этого серверного процесса:
- active: серверный процесс выполняет запрос;
- idle: серверный процесс ожидает новой команды от клиента;
- idle in transaction: серверный процесс находится внутри транзакции, но в настоящее время не выполняет никакой запрос;
- idle in transaction (aborted): состояние подобно idle in transaction, за исключением того, что один из операторов в транзакции вызывал ошибку;
- fastpath function call: серверный процесс выполняет fast-path функцию;
- disabled: состояние отображается для серверных процессов, у которых параметр track_activities отключен
query
text
Текст последнего запроса этого серверного процесса

Представление locks_tree

locks_tree

Поле
Тип
Описание
main_pid
int4
Идентификатор серверного процесса (PID, Process ID), удерживающего блокировку
pid
int4
Идентификатор серверного процесса (PID, Process ID), ожидающего эту блокировку
lock_queue
text
Список идентификаторов процессов, ожидающих блокировку, созданную процессом main_pid, разделенных знаком >
locktype
text
Тип блокируемого объекта:
- relation – отношение;
- extend – расширение отношения;
- frozenid – замороженный идентификатор;
- page – страница;
- tuple – кортеж;
- transactionid – идентификатор транзакции;
- virtualxid – виртуальный идентификатор;
- object – объект;
- userlock – пользовательская блокировка;
- advisory – рекомендательная
relation
text
Отношение, являющееся целью блокировки;

- NULL, если целью блокировки не является отношение или его часть.

Перед именем отношения указывается признак репликации объекта и его тип.
Признаки репликации:
- Ordinary: обычные объекты;
- Unlogged: объекты, созданные с признаком Unlogged, или их зависимости;
- Temporary: объекты, созданные с признаком Temporary, или их зависимости;

Типы объектов:
- Table: таблицы;
- Index: индексы, включая primary key;
- Sequence: последовательности;
- TOAST: TOAST таблицы;
- View: представления;
- MatView: материализованные представления;
- CompositeType: составные типы;
- ForeignTable: внешние таблицы;
- PartitionedTable: партиции;
- PartitionedIndex: индексы партиций
mode
text
Название режима блокировки, которая удерживается или запрашивается процессом
username
name
Имя пользователя, создавшего подключение.

Внимание: переключение ролей через SET ROLE, SET SESSION AUTHORIZATION не меняют отображаемого имени пользователя
database
name
База данных, к которой относится цель блокировки;
- 0 (ноль), если разделяемый объект;
- NULL, если целью является идентификатор транзакции
client_app_name
text
Название приложения, подключенного к этому серверному процессу
client_addr
text
IP-адрес клиента, подключенного к этому серверному процессу.

Значения:
- null означает, что клиент подключен как внутренний процесс (автоочистка);
- -1 означает, что клиент подключен через сокет Unix на стороне сервера
xact_age
interval
Время, прошедшее с начала текущей транзакции в этом процессе или null при отсутствии активной транзакции. Если текущий запрос был первым в своей транзакции, то значение в этом столбце совпадает со значением столбца query_age
query_age
interval
Время, прошедшее с начала выполнения активного в данный момент запроса, или, если state не active, то время начала выполнения последнего запроса
state_change_age
interval
Время, прошедшее с последнего изменения состояния (поле state)
wait_event
text
Имя ожидаемого события, если обслуживающий процесс находится в состоянии ожидания, а в противном случае — NULL
state
text
Общее текущее состояние этого серверного процесса:
- active: серверный процесс выполняет запрос;
- idle: серверный процесс ожидает новой команды от клиента;
- idle in transaction: серверный процесс находится внутри транзакции, но в настоящее время не выполняет никакой запрос;
- idle in transaction (aborted): состояние подобно idle in transaction, за исключением того, что один из операторов в транзакции вызывал ошибку;
- fastpath function call: серверный процесс выполняет fast-path функцию;
- disabled: состояние отображается для серверных процессов, у которых параметр track_activities отключен
query
text
Текст последнего запроса этого серверного процесса

Доработка

Доработка: Набор представлений для работы с pg_locks, pg_stat_activity.

Версия: 5.2.0.

Решение реализовано в виде расширения psql_lockmon, состоящего из набора представлений для работы с pg_locks, pg_stat_activity.

По сравнению с процессом прямого опроса системных представлений в доработке реализована расшифровка:

  • OID объектов;
  • типов OID объектов;
  • дерева взаимоблокировок при их наличии.

Решение позволяет снизить:

  • квалификационный порог для эксплуатации;
  • затраты на поддержку СУБД экспертами.

Решение не предназначено для автоматизированного частотного мониторинга (от сотен запросов в секунду).

Ограничения

Область видимости ограничена полномочиями пользователя, который выполняет запрос к представлениям и базе данных.

В целях ограничения длительных запросов глубина очереди ограничена в 1000 pid (глубина вложенности pid).

Установка

При наличии прав администратора СУБД включение модуля возможно выполнить вручную:

CREATE EXTENSION psql_lockmon SCHEMA ext;

Настройка

Настройка не требуется.

Использование модуля

Расширение, в первую очередь, предназначено для оперативного анализа блокировок сессий и выявления слабых мест производительности.

  1. Построение дерева блокировок определенной сессии с целью определить блокирующую и устранить ее:

    SELECT * FROM locks_tree WHERE blocked_pid=<pid>;

    Построение дерева блокировок для сессии с определенным pid. Идентификатор блокирующей сессии будет определен в поле main_pid, список заблокированных сессий - в поле lock_tree. Отсутствие записей означает, что сессия не заблокирована.

  2. Построение дерева блокировок всех сессий, используя существующие представления, с целью определить заблокированные сессии и устранить блокировки:

    SELECT * FROM locks_tree;

    Идентификатор блокирующей сессии будет определен в поле main_pid, список заблокированных сессий - в поле lock_tree.

  3. Список заблокированных процессов:

    SELECT DISTINCT blocked_pid FROM locks_tree;

    Будет получен список pid процессов, ожидающих блокировки. Если заблокированные процессы отсутствуют, будет получен пустой список.

    Пример вывода результата выполнения запроса:

     blocked_pid
    -------------

    8053
    (2 rows)
  4. Список блокирующих процессов:

    SELECT DISTINCT main_pid FROM locks_tree;

    Будет получен список pid процессов, блокирующих другие процессы. Будет получен пустой список, если блокирующие процессы отсутствуют.

    Пример вывода результата выполнения запроса:

     main_pid
    ----------
    7576
    (1 row)
  5. Максимальная длительность блокировки:

    SELECT   blocked_pid,
    max (state_change_age)
    FROM locks_tree
    WHERE blocked_pid NOTNULL
    GROUP BY 1 ORDER BY 2 DESC,1 LIMIT 1;

    Будут получены pid заблокированного процесса и длительность блокировки.

    Пример вывода результата выполнения запроса:

     blocked_pid |       max
    -------------+-----------------
    8053 | 00:25:24.556964
    (1 row)
  6. Поиск по логам текста запроса, приведшего к блокировке (требует прав pg_read_all_stats):

    SELECT DISTINCT
    t1.main_pid,
    current_timestamp-t1.xact_age,
    current_timestamp-t2.state_change_age
    FROM locks_tree t1
    JOIN locks_tree t2 USING(main_pid)
    WHERE t1.lock_depth=1 AND t2.lock_depth=2;

    Поскольку в полях query отображается последний выполненный запрос, то для выявления блокирующего запроса стоит восстановить ретроспективу по логам базы данных. Для этого необходимы:

    • pid блокирующего процесса;
    • время начала транзакции в процессе;
    • время начала ожидания блокировки.

    Пример вывода результата выполнения запроса:

     main_pid |           ?column?            |           ?column?
    ----------+-------------------------------+-------------------------------
    7576 | 2023-03-23 10:42:52.409485+03 | 2023-03-23 12:04:39.150078+03
    (1 row)

    В результате запроса получены pid блокирующего процесса и диапазоны времени для поиска по логам.

  7. Принудительное завершение серверных сессий, приводящих к длительным блокировкам (требует прав pg_signal_backend).

    SELECT DISTINCT
    main_pid,
    pg_terminate_backend (main_pid)
    FROM locks_tree
    WHERE lock_depth=2
    AND state_change_age > interval '30 minutes';

    В примере запрос принудительно завершает процессы, приводящие к блокировкам длительностью более 30 минут.

    Пример вывода результата выполнения запроса:

     main_pid | pg_terminate_backend
    ----------+----------------------
    7576 | t
    (1 row)