amcheck: Fix FullTransactionIdFromXidAndCtx() for xids before epoch 0
authorAndres Freund <andres@anarazel.de>
Sat, 11 Mar 2023 22:12:51 +0000 (14:12 -0800)
committerAndres Freund <andres@anarazel.de>
Sat, 11 Mar 2023 22:12:52 +0000 (14:12 -0800)
64bit xids can't represent xids before epoch 0 (see also be504a3e974). When
FullTransactionIdFromXidAndCtx() was passed such an xid, it'd create a 64bit
xid far into the future. Noticed while adding assertions in the course of
investigating be504a3e974, as amcheck's test create such xids.

To fix the issue, just return FirstNormalFullTransactionId in this case. A
freshly initdb'd cluster already has a newer horizon. The most minimal version
of this would make the messages for some detected corruptions differently
inaccurate. To make those cases accurate, switch
FullTransactionIdFromXidAndCtx() to use the 32bit modulo difference between
xid and nextxid to compute the 64bit xid, yielding sensible "in the future" /
"in the past" answers.

Reviewed-by: Mark Dilger <mark.dilger@enterprisedb.com>
Discussion: https://postgr.es/m/20230108002923.cyoser3ttmt63bfn@awork3.anarazel.de
Backpatch: 14-, where heapam verification was introduced

contrib/amcheck/verify_heapam.c
src/bin/pg_amcheck/t/004_verify_heapam.pl

index 33c5b3389596cfd4a0b76762bc2755bc4bc8b2c0..94ddccd23a809149cce0f266da91d3cfb38a3f1f 100644 (file)
@@ -1574,17 +1574,40 @@ check_tuple(HeapCheckContext *ctx)
 static FullTransactionId
 FullTransactionIdFromXidAndCtx(TransactionId xid, const HeapCheckContext *ctx)
 {
-   uint32      epoch;
+   uint64      nextfxid_i;
+   int32       diff;
+   FullTransactionId fxid;
 
    Assert(TransactionIdIsNormal(ctx->next_xid));
    Assert(FullTransactionIdIsNormal(ctx->next_fxid));
+   Assert(XidFromFullTransactionId(ctx->next_fxid) == ctx->next_xid);
 
    if (!TransactionIdIsNormal(xid))
        return FullTransactionIdFromEpochAndXid(0, xid);
-   epoch = EpochFromFullTransactionId(ctx->next_fxid);
-   if (xid > ctx->next_xid)
-       epoch--;
-   return FullTransactionIdFromEpochAndXid(epoch, xid);
+
+   nextfxid_i = U64FromFullTransactionId(ctx->next_fxid);
+
+   /* compute the 32bit modulo difference */
+   diff = (int32) (ctx->next_xid - xid);
+
+   /*
+    * In cases of corruption we might see a 32bit xid that is before epoch
+    * 0. We can't represent that as a 64bit xid, due to 64bit xids being
+    * unsigned integers, without the modulo arithmetic of 32bit xid. There's
+    * no really nice way to deal with that, but it works ok enough to use
+    * FirstNormalFullTransactionId in that case, as a freshly initdb'd
+    * cluster already has a newer horizon.
+    */
+   if (diff > 0 && (nextfxid_i - FirstNormalTransactionId) < (int64) diff)
+   {
+       Assert(EpochFromFullTransactionId(ctx->next_fxid) == 0);
+       fxid = FirstNormalFullTransactionId;
+   }
+   else
+       fxid = FullTransactionIdFromU64(nextfxid_i - diff);
+
+   Assert(FullTransactionIdIsNormal(fxid));
+   return fxid;
 }
 
 /*
index 215c30eaa8ea42825ee56e8a8c86a1cd09bbee68..9984d0d9f87effe13e97060e2ff34c2b682d7a3a 100644 (file)
@@ -217,7 +217,7 @@ my $rel = $node->safe_psql('postgres',
 my $relpath = "$pgdata/$rel";
 
 # Insert data and freeze public.test
-use constant ROWCOUNT => 16;
+use constant ROWCOUNT => 17;
 $node->safe_psql(
    'postgres', qq(
    INSERT INTO public.test (a, b, c)
@@ -378,23 +378,24 @@ for (my $tupidx = 0; $tupidx < ROWCOUNT; $tupidx++)
    elsif ($offnum == 3)
    {
        # Corruptly set xmin < datfrozenxid, further back, noting circularity
-       # of xid comparison.  For a new cluster with epoch = 0, the corrupt
-       # xmin will be interpreted as in the future
-       $tup->{t_xmin} = 4026531839;
+       # of xid comparison.
+       my $xmin = 4026531839;
+       $tup->{t_xmin} = $xmin;
        $tup->{t_infomask} &= ~HEAP_XMIN_COMMITTED;
        $tup->{t_infomask} &= ~HEAP_XMIN_INVALID;
 
        push @expected,
-         qr/${$header}xmin 4026531839 equals or exceeds next valid transaction ID 0:\d+/;
+         qr/${$header}xmin ${xmin} precedes oldest valid transaction ID 0:\d+/;
    }
    elsif ($offnum == 4)
    {
        # Corruptly set xmax < relminmxid;
-       $tup->{t_xmax} = 4026531839;
+       my $xmax = 4026531839;
+       $tup->{t_xmax} = $xmax;
        $tup->{t_infomask} &= ~HEAP_XMAX_INVALID;
 
        push @expected,
-         qr/${$header}xmax 4026531839 equals or exceeds next valid transaction ID 0:\d+/;
+         qr/${$header}xmax ${xmax} precedes oldest valid transaction ID 0:\d+/;
    }
    elsif ($offnum == 5)
    {
@@ -502,7 +503,7 @@ for (my $tupidx = 0; $tupidx < ROWCOUNT; $tupidx++)
        push @expected,
          qr/${header}multitransaction ID 4 equals or exceeds next valid multitransaction ID 1/;
    }
-   elsif ($offnum == 15)    # Last offnum must equal ROWCOUNT
+   elsif ($offnum == 15)
    {
        # Set both HEAP_XMAX_COMMITTED and HEAP_XMAX_IS_MULTI
        $tup->{t_infomask} |= HEAP_XMAX_COMMITTED;
@@ -512,6 +513,17 @@ for (my $tupidx = 0; $tupidx < ROWCOUNT; $tupidx++)
        push @expected,
          qr/${header}multitransaction ID 4000000000 precedes relation minimum multitransaction ID threshold 1/;
    }
+   elsif ($offnum == 16)    # Last offnum must equal ROWCOUNT
+   {
+       # Corruptly set xmin > next_xid to be in the future.
+       my $xmin = 123456;
+       $tup->{t_xmin} = $xmin;
+       $tup->{t_infomask} &= ~HEAP_XMIN_COMMITTED;
+       $tup->{t_infomask} &= ~HEAP_XMIN_INVALID;
+
+       push @expected,
+          qr/${$header}xmin ${xmin} equals or exceeds next valid transaction ID 0:\d+/;
+   }
    write_tuple($file, $offset, $tup);
 }
 close($file)