Allow using copy_file_range in write_reconstructed_file
authorTomas Vondra <tomas.vondra@postgresql.org>
Fri, 5 Apr 2024 17:01:16 +0000 (19:01 +0200)
committerTomas Vondra <tomas.vondra@postgresql.org>
Fri, 5 Apr 2024 17:19:36 +0000 (19:19 +0200)
commitac81101551326ddf4c5cb804c75bd3e8c56506ba
tree78204a44de1541312b7404c96fe3253c0d92a49e
parentb8b37e41ba4aae1e79dcfaeb9eb0fd7549773ff5
Allow using copy_file_range in write_reconstructed_file

This commit allows using copy_file_range() for efficient combining of
data from multiple files, instead of simply reading/writing the blocks.
Depending on the filesystem and other factors (size of the increment,
distribution of modified blocks etc.) this may be faster than the
block-by-block copy, but more importantly it enables various features
provided by CoW filesystems.

If a checksum needs to be calculated for the file, the same strategy as
when copying whole files is used - copy_file_range is used to copy the
blocks, but the file is also read for the checksum calculation.

While the checksum calculation is rarely needed when cloning whole
files, when reconstructing the files from multiple backups it needs to
happen almost always (the only exception is when the user specified
--no-manifest).

Author: Tomas Vondra
Reviewed-by: Thomas Munro, Jakub Wartak, Robert Haas
Discussion: https://postgr.es/m/3024283a-7491-4240-80d0-421575f6bb23%40enterprisedb.com
src/bin/pg_combinebackup/reconstruct.c