Perl, Regulární výrazy (33.díl)

Napsal O webu (») 3. 6. 2008 v kategorii Programování, přečteno: 1181×
obrazky/logo_perl.jpg

Třídy znaků zadané pomocí UNICODE vlastností

Třetí možností jak popsat třídu znaků je pomocí vlastností znaků Unicode. Každá z vlastností má své pojmenování, jejíž prostřednictvím jsou na místo třídy znaků dosazeny všechny symboly odpovídající zadaným vlastnostem (znaky jsou uloženy v souborech, jména tříd jsou mapována na jména těchto souborů). Je-li jméno třídy víceznakové, je nutné pro jeho ohraničení použít složené závorky. Pro jednoznaková jména závorky povinné nejsou. Znaky mající určité vlastnosti jsou pojmenovány pomocí p { VLASTNOST }, zápis
P { VLASTNOST } reprezentuje všechny znaky, které zadané vlastnosti nevyhovují. Třída znaku zadaná pomocí konstrukce ,p{} nebo P {} je použitelná samostatně, stejně tak jako uvnitř hranatých závorek.

Standardní třída znaků Unicode

Perl nabízí jak standardní třídy znaků Unicode, tak třídy znaků definované pomocí standardních tříd Unicode. V následující tabulce jsou uvedeny nejpoužívanější znaky standardní třídy Unicode:

Třída znakůVýznam
IsL1Malé písmeno
IsLuVelké písmeno
IsNdDesítková číslice
IsPiOtevírací uvozovka
IsPfUzavírací uvozovka
IsSmMatematický symbol
IsScSymbol měny
IsZ1Oddělovač řádků
IsZpOddělovač odstavců
IsZsMezera

Třída znaků podle standardu Posix

Poslední možností vyjádření třídy znaků je pomocí stylu POSIX. Třída je popsána konstrukcí [:název:] a lze ji použít pouze uvnitř třídy znaků vyjádřené výčtem (=uvnitř dvojice hranatých závorek [[:alpha:]] ). Bez těchto ohraničovacích hranatých závorek je celá implementace třídy jiná. Rozšířením Perlu je použití znaku ^ před názvem třídy- To opět znamená negaci uvedené třídy a taková třída znaků bude obsahovat všechny znaky kromě těch, jež jsou uvedeny v negované třídě. V následující tabulce jsou uvedeny názvy tříd znaků podle standardu POSIX:


TřídaVýznam
alnumAlfanumerický znak
alphaPísmeno
asciiZnak s ordinální hodnotou od 0 do 127
blankBílý znak
cntrlKontrol sekvence
digitDesítková číslice
graphAlfanumerický nebo interpunkční znak
lowerMalé písmeno
PrintAlfanumerický, interpunkční nebo mezera
punctInterpunkční znak
spaceBílý znak
upperVelké písmeno
wordAlfanumerický znak nebo podtržítko
xdigitHexadecimální číslice


A to by bylo pro dnešek všechno. V dalším díle se podíváme na kvantifikátory. V případě jakýchkoliv dotazů mě kontaktujte na email: habrman@banan.cz.


Autor: Robert Habrman
Štítky: Perl
Facebook Twitter Topčlánky.cz Linkuj.cz

Komentáře

Zobrazit: standardní | od aktivních | poslední příspěvky | všechno
Článek ještě nebyl okomentován.


Nový komentář

Téma:
Jméno:
Notif. e-mail *:
Komentář:
  [b] [obr]
Odpovězte prosím číslicemi: Součet čísel sedm a sedm