Fix race condition in relcache init file invalidation.
authorTom Lane <tgl@sss.pgh.pa.us>
Tue, 16 Aug 2011 17:11:54 +0000 (13:11 -0400)
committerTom Lane <tgl@sss.pgh.pa.us>
Tue, 16 Aug 2011 17:11:54 +0000 (13:11 -0400)
commit2ada6779c5d3fcc31568ba263f8a0cc9bb8318c1
tree7744d0ff44bd14e6deb910da2c2343885ecd3b55
parent1bb69245ab234634013c543927e6fa76009622fa
Fix race condition in relcache init file invalidation.

The previous code tried to synchronize by unlinking the init file twice,
but that doesn't actually work: it leaves a window wherein a third process
could read the already-stale init file but miss the SI messages that would
tell it the data is stale.  The result would be bizarre failures in catalog
accesses, typically "could not read block 0 in file ..." later during
startup.

Instead, hold RelCacheInitLock across both the unlink and the sending of
the SI messages.  This is more straightforward, and might even be a bit
faster since only one unlink call is needed.

This has been wrong since it was put in (in 2002!), so back-patch to all
supported releases.
src/backend/access/transam/twophase.c
src/backend/utils/cache/inval.c
src/backend/utils/cache/relcache.c
src/include/utils/relcache.h