Fix Assert failure in WITH RECURSIVE UNION queries
authorDavid Rowley <drowley@postgresql.org>
Thu, 19 Dec 2024 00:11:39 +0000 (13:11 +1300)
committerDavid Rowley <drowley@postgresql.org>
Thu, 19 Dec 2024 00:11:39 +0000 (13:11 +1300)
If the non-recursive part of a recursive CTE ended up using
TTSOpsBufferHeapTuple as the table slot type, then a duplicate value
could cause an Assert failure in CheckOpSlotCompatibility() when
checking the hash table for the duplicate value.  The expected slot type
for the deform step was TTSOpsMinimalTuple so the Assert failed when the
TTSOpsBufferHeapTuple slot was used.

This is a long-standing bug which we likely didn't notice because it
seems much more likely that the non-recursive term would have required
projection and used a TTSOpsVirtual slot, which CheckOpSlotCompatibility
is ok with.

There doesn't seem to be any harm done here other than the Assert
failure.  Both TTSOpsMinimalTuple and TTSOpsBufferHeapTuple slot types
require tuple deformation, so the EEOP_*_FETCHSOME ExprState step would
have properly existed in the ExprState.

The solution is to pass NULL for the ExecBuildGroupingEqual's 'lops'
parameter.  This means the ExprState's EEOP_*_FETCHSOME step won't
expect a fixed slot type.  This makes CheckOpSlotCompatibility() happy as
no checking is performed when the ExprEvalStep is not expecting a fixed
slot type.

Reported-by: Richard Guo
Reviewed-by: Tom Lane
Discussion: https://postgr.es/m/CAMbWs4-8U9q2LAtf8+ghV11zeUReA3AmrYkxzBEv0vKnDxwkKA@mail.gmail.com
Backpatch-through: 13, all supported versions

src/backend/executor/execGrouping.c
src/test/regress/expected/with.out
src/test/regress/sql/with.sql

index 4a8f72305ce19dc602c587f1c35aaecc71dd50cf..a69fa0f8cc3933c5f8cf509fd22bed6b9e8f4272 100644 (file)
@@ -236,9 +236,8 @@ BuildTupleHashTableExt(PlanState *parent,
                                                                                                                hash_iv);
 
        /* build comparator for all columns */
-       /* XXX: should we support non-minimal tuples for the inputslot? */
        hashtable->tab_eq_func = ExecBuildGroupingEqual(inputDesc, inputDesc,
-                                                                                                       &TTSOpsMinimalTuple, &TTSOpsMinimalTuple,
+                                                                                                       NULL, &TTSOpsMinimalTuple,
                                                                                                        numCols,
                                                                                                        keyColIdx, eqfuncoids, collations,
                                                                                                        allow_jit ? parent : NULL);
index ff9754603bdd1c6bf037ba70408b5df0dca5ac68..7a51e2eb7579990b241168a3d066772d4b7d8b58 100644 (file)
@@ -656,6 +656,21 @@ SELECT t1.id, t2.path, t2 FROM t AS t1 JOIN t AS t2 ON
  16 | {3,7,11,16} | (16,"{3,7,11,16}")
 (16 rows)
 
+CREATE TEMP TABLE duplicates (a INT NOT NULL);
+INSERT INTO duplicates VALUES(1), (1);
+-- Try out a recursive UNION case where the non-recursive part's table slot
+-- uses TTSOpsBufferHeapTuple and contains duplicate rows.
+WITH RECURSIVE cte (a) as (
+       SELECT a FROM duplicates
+       UNION
+       SELECT a FROM cte
+)
+SELECT a FROM cte;
+ a 
+---
+ 1
+(1 row)
+
 -- test that column statistics from a materialized CTE are available
 -- to upper planner (otherwise, we'd get a stupider plan)
 explain (costs off)
index aca7bae6dddd4b91950214b5e1b5b634993fa513..dcdaab5eff02a5060ce0ffd78d79d4258158e35e 100644 (file)
@@ -361,6 +361,18 @@ UNION ALL
 SELECT t1.id, t2.path, t2 FROM t AS t1 JOIN t AS t2 ON
 (t1.id=t2.id);
 
+CREATE TEMP TABLE duplicates (a INT NOT NULL);
+INSERT INTO duplicates VALUES(1), (1);
+
+-- Try out a recursive UNION case where the non-recursive part's table slot
+-- uses TTSOpsBufferHeapTuple and contains duplicate rows.
+WITH RECURSIVE cte (a) as (
+       SELECT a FROM duplicates
+       UNION
+       SELECT a FROM cte
+)
+SELECT a FROM cte;
+
 -- test that column statistics from a materialized CTE are available
 -- to upper planner (otherwise, we'd get a stupider plan)
 explain (costs off)