Clean up dubious error handling in wellformed_xml().
authorTom Lane <tgl@sss.pgh.pa.us>
Fri, 16 Dec 2022 16:10:36 +0000 (11:10 -0500)
committerTom Lane <tgl@sss.pgh.pa.us>
Fri, 16 Dec 2022 16:10:40 +0000 (11:10 -0500)
commitc4939f121563f300b98b30837151753fc8255554
treef02c30acd711e7210c3a3c63ee6c8c68a9056998
parent37bef842f5530fc9f4a48daba9f4709ee5e36c9b
Clean up dubious error handling in wellformed_xml().

This ancient bit of code was summarily trapping any ereport longjmp
whatsoever and assuming that it must represent an invalid-XML report.
It's not really appropriate to handle OOM-like situations that way:
maybe the input is valid or maybe not, but we couldn't find out.
And it'd be a seriously bad idea to ignore, say, a query cancel
error that way.  (Perhaps that can't happen because there is no
CHECK_FOR_INTERRUPTS anywhere within xml_parse, but even if that's
true today it's obviously a very fragile assumption.)

But in the wake of the previous commit, we can drop the PG_TRY
here altogether, and use the soft error mechanism to catch only
the kinds of errors that are legitimate to treat as invalid-XML.

(This is our first use of the soft error mechanism for something
not directly related to a datatype input function.  It won't be
the last.)

xml_is_document can be converted in the same way.  That one is
not actively broken, because it was checking specifically for
ERRCODE_INVALID_XML_DOCUMENT rather than trapping everything;
but the code is still shorter and probably faster this way.

Discussion: https://postgr.es/m/3564577.1671142683@sss.pgh.pa.us
src/backend/utils/adt/xml.c