Fix race condition at backend exit when deleting element in syncrep queue
authorMichael Paquier <michael@paquier.xyz>
Fri, 1 Nov 2019 13:38:32 +0000 (22:38 +0900)
committerMichael Paquier <michael@paquier.xyz>
Fri, 1 Nov 2019 13:38:32 +0000 (22:38 +0900)
commit20345197ff48c99a8a20dd3cd191d2aad5c7271c
treed99d66a6027502daeb6d2a784bdc2dae0a5a8346
parent396773762425126a85243fc85a267d401496beb8
Fix race condition at backend exit when deleting element in syncrep queue

When a backend exits, it gets deleted from the syncrep queue if present.
The queue was checked without SyncRepLock taken in exclusive mode, so it
would have been possible for a backend to remove itself after a WAL
sender already did the job.  Fix this issue based on a suggestion from
Fujii Masao, by first checking the queue without the lock.  Then, if the
backend is present in the queue, take the lock and perform an additional
lookup check before doing the element deletion.

Author: Dongming Liu
Reviewed-by: Kyotaro Horiguchi, Fujii Masao, Michael Paquier
Discussion: https://postgr.es/m/a0806273-8bbb-43b3-bbe1-c45a58f6ae21.lingce.ldm@alibaba-inc.com
Backpatch-through: 9.4
src/backend/replication/syncrep.c