Whitespace

I ASCII-der er kun fire, der almindeligvis anvendes blanke:

  • rum — ' ', chr(32), "\N{SPACE}"
  • tab — "\t", chr(9), "\N{CHARACTER TABULATION}"
  • line — "\n", chr(10), "\N{LINE FEED}"
  • vognretur — "\r", chr(13), "\N{CARRIAGE RETURN}" (bruges i Windows, linux og macOS er næsten aldrig brugt)

Men der er to standard rum, der bruges meget sjældent:

  • "\x0B", chr(11), "\N{LINE TABULATION}"
  • "\f", chr(12), "\N{FORM FEED}"

Denne liste af blanktegn kan tilgås ved hjælp af følgende script:

▶ Run
#!/usr/bin/perl

use utf8;
use open qw(:std :utf8);
use strict;
use warnings;

foreach my $i (0..65535) {
    print "chr($i)\n" if chr($i) =~ /\s/a;
}

Men i Unicode der er flere tegn, der er hvide rum. Her er et program, der udskriver alle tegn fra Unicode, som er Perl white-space:

▶ Run
#!/usr/bin/perl

use utf8;
use open qw(:std :utf8);
use strict;
use warnings;

my $count = 0;

foreach my $i (0..65535) {
    if (chr($i) =~ /\s/) {
        print "chr($i)\n";
        $count++;
    }
}

print "\n";
print "count: $count\n";Но

Outputtet af programmet:

chr(9)
chr(10)
chr(11)
chr(12)
chr(13)
chr(32)
chr(5760)
chr(6158)
chr(8192)
chr(8193)
chr(8194)
chr(8195)
chr(8196)
chr(8197)
chr(8198)
chr(8199)
chr(8200)
chr(8201)
chr(8202)
chr(8232)
chr(8233)
chr(8239)
chr(8287)
chr(12288)

count: 24

Relaterede emner

Andre artikler