Пробельные caracteres

ASCII há apenas quatro frequentemente utilizados caracteres espaço em branco:

  • barra de espaço — ' ', chr(32), "\N{SPACE}"
  • aba — "\t", chr(9), "\N{CHARACTER TABULATION}"
  • tradução de comando — "\n", chr(10), "\N{LINE FEED}"
  • um retorno de disco rígido — "\r", chr(13), "\N{CARRIAGE RETURN}" (usado em Windows, linux e macOS praticamente não é usado)

Mas ainda há dois padrões caractere de espaço em branco, que são utilizados extremamente raros:

  • "\x0B", chr(11), "\N{LINE TABULATION}"
  • "\f", chr(12), "\N{FORM FEED}"

Essa lista de caracteres espaço em branco pode ser obtida utilizando o seguinte script:

▶ Run
#!/usr/bin/perl

use utf8;
use open qw(:std :utf8);
use strict;
use warnings;

foreach my $i (0..65535) {
    print "chr($i)\n" if chr($i) =~ /\s/a;
}

Mas em Unicode, há mais caracteres que não são пробельными. Esse é o programa que irá mostrar todos os caracteres Unicode, que do ponto de vista de Perl são пробельными:

▶ Run
#!/usr/bin/perl

use utf8;
use open qw(:std :utf8);
use strict;
use warnings;

my $count = 0;

foreach my $i (0..65535) {
    if (chr($i) =~ /\s/) {
        print "chr($i)\n";
        $count++;
    }
}

print "\n";
print "count: $count\n";Но

A saída do programa:

chr(9)
chr(10)
chr(11)
chr(12)
chr(13)
chr(32)
chr(5760)
chr(6158)
chr(8192)
chr(8193)
chr(8194)
chr(8195)
chr(8196)
chr(8197)
chr(8198)
chr(8199)
chr(8200)
chr(8201)
chr(8202)
chr(8232)
chr(8233)
chr(8239)
chr(8287)
chr(12288)

count: 24

Temas relacionados

Outros artigos