narodne prostredie
Dan Lukes
dan at obluda.cz
Wed Dec 18 23:38:11 CET 2002
P Sedo wrote, On 12/18/02 21:14:
> >setenv LC_CTYPE "sk_SK.ISO8859-2"
> krakora po slovensky a GREP, GREP mi pre istotu ignoruje pri tomto
> nastaveni rozdiely medzi VELKYMI a malymi pismenkami, co ma uz celkom
> slusne vytaca.
Na vasi otazku uz odpovedel nekdo jiny - ja bych se ted rad zastal
neopravnene napadeneho a bezbranneho grepu ... ;-)
Grep pravdepodobne nic neignoruje. Pokud chcete pouze velka pismena, k
tomu slouzi class [:upper:], vy jste, predpokladam, pouzil zapis A-Z.
Jenze, jako na potvoru, ve slovenskem kodovani (stejne jako v ceskem)
netvori velka (a ani mala) pismena souvislou neprerusenou radu ...
Pouzivani rozsahu v regularnich vyrazech je velmi neportabilni
konstrukt, protoze nikdy nevite, jak je vlastne aktualni kodovani
konstruovano (nejde jen o ruzna narodni kodovani, ale take napriklad o
EBCDIC, coz je stale pouzivane kodovani alternativni k ASCII, ktere nema
pismena v souvisle neprerusene rade) a co tedy vlastne presne obsahuje
takovy rozsah. A pri pouzivani neportabilnich konstruktu se nelze nez
divit, ze mimo puvodni prostredi pro ktere byly navrzeny nefunguji.
To, ze grep nefunguje tedy neni chyba jeho, ale chyba autora
regularniho vyrazu, ktery pouzil neportabilni konstrukt v nevhodnem
prostredi.
Budiz vam utechou, ze napriklad FreeBSD se take neprelozi pokud
nastavite jakekoliv locale, ktere je "US-ASCII range neidenticke" -
podpurne scripty totiz tyto neportabilni konstrukty take pomerne casto
pouzivaji (jenze, ty zhusta psali americane, u kterych zas az tak
neprekvapi, ze nevedi, ze existuji i jine jazyky nez anglictina a jiny
kontinent nez Amerika).
Jsem si vedom toho, ze toto neni informace, ktera byla pozadovana ...
Dan
--
Dan Lukes tel: +420 2 21914205, fax: +420 2 21914206
root of FIONet, KolejNET, webmaster of www.freebsd.cz
AKA: dan at obluda.cz, dan at freebsd.cz,dan at kolej.mff.cuni.cz
More information about the Users-l
mailing list