Tighten TAP tests' tracking of postmaster state some more.
authorTom Lane <tgl@sss.pgh.pa.us>
Thu, 20 Jan 2022 22:28:07 +0000 (17:28 -0500)
committerTom Lane <tgl@sss.pgh.pa.us>
Thu, 20 Jan 2022 22:28:07 +0000 (17:28 -0500)
commit4fdbf9af5184d033f07010a1ab573fb329e7b8cd
tree7c5d21421c1fdbee4579c14fc8e5a014df0227b1
parent3500ccc39b0dadd1068a03938e4b8ff562587ccc
Tighten TAP tests' tracking of postmaster state some more.

Commits 6c4a8903b et al. had a couple of deficiencies:

* The logic I added to Cluster::start to see if a PID file is present
could be fooled by a stale PID file left over from a previous
postmaster.  To fix, if we're not sure whether we expect to find a
running postmaster or not, validate the PID using "kill 0".

* 017_shm.pl has a loop in which it just issues repeated Cluster::start
calls; this will fail if some invocation fails but leaves self->_pid
set.  Per buildfarm results, the above fix is not enough to make this
safe: we might have "validated" a PID for a postmaster that exits
immediately after we look.  Hence, match each failed start call with
a stop call that will get us back to the self->_pid == undef state.
Add a fail_ok option to Cluster::stop to make this work.

Discussion: https://postgr.es/m/CA+hUKGKV6fOHvfiPt8=dOKzvswjAyLoFoJF1iQXMNpi7+hD1JQ@mail.gmail.com
src/test/perl/PostgreSQL/Test/Cluster.pm
src/test/recovery/t/017_shm.pl