Fix misbehavior in contrib/pg_trgm with an unsatisfiable regex.
authorTom Lane <tgl@sss.pgh.pa.us>
Sat, 11 Mar 2023 17:15:41 +0000 (12:15 -0500)
committerTom Lane <tgl@sss.pgh.pa.us>
Sat, 11 Mar 2023 17:15:41 +0000 (12:15 -0500)
commit1925ac281a238fab50e208548f98daffdaaa0896
treedcba116a9bd634b7b1c60b7c02c5b3c67124f7f1
parentd66bb048c3130c7b7a4876fc9050291f9e4cad2b
Fix misbehavior in contrib/pg_trgm with an unsatisfiable regex.

If the regex compiler can see that a regex is unsatisfiable
(for example, '$foo') then it may emit an NFA having no arcs.
pg_trgm's packGraph function did the wrong thing in this case;
it would access off the end of a work array, and with bad luck
could produce a corrupted output data structure causing more
problems later.  This could end with wrong answers or crashes
in queries using a pg_trgm GIN or GiST index with such a regex.

Fix by not trying to de-duplicate if there aren't at least 2 arcs.

Per bug #17830 from Alexander Lakhin.  Back-patch to all supported
branches.

Discussion: https://postgr.es/m/17830-57ff5f89bdb02b09@postgresql.org
contrib/pg_trgm/expected/pg_word_trgm.out
contrib/pg_trgm/sql/pg_word_trgm.sql
contrib/pg_trgm/trgm_regexp.c