Make Unicode script fit for future versions
authorPeter Eisentraut <peter@eisentraut.org>
Mon, 18 Sep 2023 05:25:46 +0000 (07:25 +0200)
committerPeter Eisentraut <peter@eisentraut.org>
Mon, 18 Sep 2023 05:25:46 +0000 (07:25 +0200)
Between Unicode 15.0.0 and 15.1.0, the whitespace in
EastAsianWidth.txt has changed a bit, such as from

0020;Na          # Zs         SPACE

to

0020           ; Na # Zs         SPACE

with space around the semicolon.  Adjust the script to be able to
parse that.

src/common/unicode/generate-unicode_east_asian_fw_table.pl

index 2b2df375edfc5c868b445554ada3e0c23531cea7..125bd396a073e92900312bcb5971c74dfbd9fd22 100644 (file)
@@ -23,7 +23,7 @@ foreach my $line (<ARGV>)
        chomp $line;
        $line =~ s/\s*#.*$//;
        next if $line eq '';
-       my ($codepoint, $width) = split ';', $line;
+       my ($codepoint, $width) = split /\s*;\s*/, $line;
 
        if ($codepoint =~ /\.\./)
        {