Whitespace-Zeichen

In ASCII gibt es nur vier Häufig verwendete Leerzeichen:

  • Leertaste — ' ', chr(32), "\N{SPACE}"
  • Tabulator — "\t", chr(9), "\N{CHARACTER TABULATION}"
  • Zeilenvorschub — "\n", chr(10), "\N{LINE FEED}"
  • Absatzmarke — "\r", chr(13), "\N{CARRIAGE RETURN}" (in Windows, in linux und macOS fast nie benutzt)

Aber es gibt noch zwei Standard пробельных Zeichen, die verwendet werden, extrem selten:

  • "\x0B", chr(11), "\N{LINE TABULATION}"
  • "\f", chr(12), "\N{FORM FEED}"

Diese Liste von Leerzeichen können Sie mit dem folgenden Skript:

▶ Run
#!/usr/bin/perl

use utf8;
use open qw(:std :utf8);
use strict;
use warnings;

foreach my $i (0..65535) {
    print "chr($i)\n" if chr($i) =~ /\s/a;
}

Aber in Unicode gibt es noch Zeichen, die sind пробельными. Hier ist das Programm, was wird alle Zeichen aus Unicode, die in Bezug auf Perl sind пробельными:

▶ Run
#!/usr/bin/perl

use utf8;
use open qw(:std :utf8);
use strict;
use warnings;

my $count = 0;

foreach my $i (0..65535) {
    if (chr($i) =~ /\s/) {
        print "chr($i)\n";
        $count++;
    }
}

print "\n";
print "count: $count\n";Но

Ausgabe des Programms:

chr(9)
chr(10)
chr(11)
chr(12)
chr(13)
chr(32)
chr(5760)
chr(6158)
chr(8192)
chr(8193)
chr(8194)
chr(8195)
chr(8196)
chr(8197)
chr(8198)
chr(8199)
chr(8200)
chr(8201)
chr(8202)
chr(8232)
chr(8233)
chr(8239)
chr(8287)
chr(12288)

count: 24

Verwandte Themen

Andere Artikel