Add pg_encoding_set_invalid()
authorAndres Freund <andres@anarazel.de>
Mon, 10 Feb 2025 15:03:39 +0000 (10:03 -0500)
committerAndres Freund <andres@anarazel.de>
Mon, 10 Feb 2025 15:03:39 +0000 (10:03 -0500)
commit6e05b195d0e192e143db8c4c7ef2526860341a2c
treef1f92215f5c4b9e5fbe07cd93bf4e3142f88a03f
parentef23624caf89aaf472bd9fa687534149be9f49ae
Add pg_encoding_set_invalid()

There are cases where we cannot / do not want to error out for invalidly
encoded input. In such cases it can be useful to replace e.g. an incomplete
multi-byte characters with bytes that will trigger an error when getting
validated as part of a larger string.

Unfortunately, until now, for some encoding no such sequence existed. For
those encodings this commit removes one previously accepted input combination
- we consider that to be ok, as the chosen bytes are outside of the valid
ranges for the encodings, we just previously failed to detect that.

As we cannot add a new field to pg_wchar_table without breaking ABI, this is
implemented "in-line" in the newly added function.

Author: Noah Misch <noah@leadboat.com>
Reviewed-by: Andres Freund <andres@anarazel.de>
Backpatch-through: 13
Security: CVE-2025-1094
src/common/wchar.c
src/include/mb/pg_wchar.h
src/test/regress/expected/conversion.out
src/test/regress/regress.c
src/test/regress/sql/conversion.sql