Los espacios en blanco

En la codificación ASCII hay un total de cuatro utilizados en los espacios en blanco:

  • barra espaciadora — ' ', chr(32), "\N{SPACE}"
  • tabulación — "\t", chr(9), "\N{CHARACTER TABULATION}"
  • la traducción de la cadena "\n", chr(10), "\N{LINE FEED}"
  • traducción de carro — "\r", chr(13), "\N{CARRIAGE RETURN}" (utilizado en Windows, en linux y macOS prácticamente no se utiliza)

Pero todavía hay dos estándar en espacios en blanco caracteres que se utilizan muy raramente:

  • "\x0B", chr(11), "\N{LINE TABULATION}"
  • "\f", chr(12), "\N{FORM FEED}"

Esta lista de caracteres de espacio en blanco se puede acceder mediante el siguiente script:

▶ Run
#!/usr/bin/perl

use utf8;
use open qw(:std :utf8);
use strict;
use warnings;

foreach my $i (0..65535) {
    print "chr($i)\n" if chr($i) =~ /\s/a;
}

Pero en Unicode todavía hay caracteres que son espacios en blanco. Este es el programa que mostrará todos los caracteres de Unicode, que desde el punto de vista de Perl son espacios en blanco:

▶ Run
#!/usr/bin/perl

use utf8;
use open qw(:std :utf8);
use strict;
use warnings;

my $count = 0;

foreach my $i (0..65535) {
    if (chr($i) =~ /\s/) {
        print "chr($i)\n";
        $count++;
    }
}

print "\n";
print "count: $count\n";Но

La salida del programa:

chr(9)
chr(10)
chr(11)
chr(12)
chr(13)
chr(32)
chr(5760)
chr(6158)
chr(8192)
chr(8193)
chr(8194)
chr(8195)
chr(8196)
chr(8197)
chr(8198)
chr(8199)
chr(8200)
chr(8201)
chr(8202)
chr(8232)
chr(8233)
chr(8239)
chr(8287)
chr(12288)

count: 24

Temas relacionados

Otros articulos