LINUXSOFT.cz Přeskoč levou lištu
Uživatel: Heslo:  
   CZUKPL

> Programujeme s XML (13.) - XPath a řetězce

Dnes zakončíme náš rychlý úvod do jazyka XPath popisem funkcí pracujících s řetězci.

24.8.2004 15:00 | Aleš Hakl | Články autora | přečteno 12004×

Protože jazyk XPath není určen pro obecné programování, a protože je z principu interpretovaný, nebylo by vhodné zpracovávat řetězce po jednotlivých znacích a tudíž to ani není možné, a právě proto nám jazyk XPath nabízí řadu funkcí představujících nejčastější operace s řetězci. Tato sada funkcí bohužel neobsahuje žádné zpracování regulárních výrazů, které bych právě v jazyku typu XPath velmi uvítal.

Již minule jsme se seznámili s funkcí string() sloužící k převodu libovolného jiného datového typu na řetězec, nyní se tedy podíváme na ostatní:

concat() - Spojování řetězců

Funkce concat() spojí všechny svoje argumenty do jednoho řetězce, argumentů může být 2 nebo více.

starts-with() - Vyhledávání na začátku

Tato funkce slouží k operaci, která se v ostatních jazycích příliš nevyskytuje (snad z výjimkou Javy), zjistí, začíná-li první argument obsahem druhého argumentu a podle toho vrátí true nebo false.

contains() - Vyhledávání

Obdoba funkce předchozí s tím rozdílem, že vrací true, pokud se druhý argument vyskytuje kdekoli v prvním.

substring-before() a substring-after()

Tyto dvě funkce vrací část prvního argumentu předcházející (nebo následující) výskyt druhého argumentu. Obě funkce vrátí prázdný řetězec, pokud se v prvním argumentu argument druhý nevyskytuje (což může být občas trochu matoucí)

substring() - Část řetězce

Tato funkce vrácí část prvního argumentu určenou pozicí začátku (druhý argument) a délkou (třetí argument). Pozice prvního znaku je 1 jako v Pascalu a ne 0 jako ve většině ostatních programovacích jazyků.

string-length() - Délka řetězce

Vrácí délku řetězce (argumentu) ve znacích.

normalize-space() - Normalizace mezer

Funkce normalize-space() zajistí nahrazení mezer a podobných znaků (což znamená tabulátor a nový řádek, znaky typu U+3000(ideografická mezera) XML nepovažuje za mezery) dle pravidel XML.

Prakticky jde o to, že tyto znaky jsou na začátku a konci řetězce odstraněny a jejich sekvence uprostřed řetězce jsou nahrazeny jednou mezerou.

translate() - Nahrazení znaků

Kdo zná program tr(1), zná i tuto funkci, princip je totiž stejný. Funkce vrací první argument ve kterém jsou znaky vyskytující se v druhém argumentu nahrazeny odpovídajícími znaky z třetího argumentu. Pokud je třetí argument kratší než druhý, jsou odpovídající znaky jednoduše odstraněny.

Několik příkladů

concat('foo','bar','quux') = foobarquux

starts-with('nyaa','ny') = true

starts-with('nyaa','mn') = false

contains('foo bar','bar') = true

contains('foo bar','quux') = false

contains('foobar','oba') = true

substring-before('root=/dev/hda1','=') = root

substring-after('root=/dev/hda1','=') = /dev/hda1

substring-before('foo,bar,quux',',') = foo

substring-after('foo,bar,quux',',') = bar,quux

substring-before('foo,bar,quux','=') =

substring-after('foo,bar,quux','=') =

substring('abcdef',2,3) = bcd

substring('abcdef',5,1 div 0) = ef - Výsledkem dělení nulou je hodnota plus nekonečno.

string-length('abcdef') = 6

normalize-space(' bla  bla  foo   ') = bla bla foo

translate('abcdef','ab','AB') = ABcdef

translate('abcdef','abc','AB') = ABdef

Pokud někde mluvím o znacích, myslím tím samožřejmě znaky Unicode a nikoli jednotlivé bajty a toto by mělo platit i pro znaky vyšší než U+FFFF. Jediným problémem můžou být znaky, které ačkoli vypadají jeden jsou reprezentovány více znaky Unicode, případně pro ně existuje více reprezentací, jednou jako jeden znak a podruhé jako dva znaky. Všechny české znaky s diakritikou patří do druhé skupiny, do první patří různé komplikovaně skládané znaky některých asijských jazyků.

Tímto článkem bych uzavřel naši krátkou odbočku k jazyku XPath a příště se vrátíme k XSL transformacím, pro které jsme teď vyzbrojeni jazykem XPath.

Verze pro tisk

pridej.cz

 

DISKUZE

Nejsou žádné diskuzní příspěvky u dané položky.



Příspívat do diskuze mohou pouze registrovaní uživatelé.
> Vyhledávání software
> Vyhledávání článků

13.9.2017 8:00 /František Kučera

Máš rád svobodný software a hardware nebo se o nich chceš něco dozvědět? Zajímá tě DIY, CNC, SDR nebo morseovka? Přijď na sraz spolku OpenAlt – tentokrát netradičně v pondělí: 18. září od 18:00 v Radegastovně Perón (Stroupežnického 20, Praha 5).


Přidat komentář

3.9.2017 20:45 /Redakce Linuxsoft.cz
PR: Dne 21. září 2017 proběhne v Praze konference "Mobilní řešení pro business". Hlavní tématy konference budou: nejnovější trendy v oblasti mobilních řešení pro firmy, efektivní využití mobilních zařízení, bezpečnostní rizika a řešení pro jejich omezení, správa mobilních zařízení ve firmách a další.
Přidat komentář

15.5.2017 23:50 /František Kučera
Máš rád svobodný software a hardware nebo se o nich chceš něco dozvědět? Zajímá tě DIY, CNC, SDR nebo morseovka? Přijď na sraz spolku OpenAlt, který se bude konat ve čtvrtek 18. května od 18:00 v Radegastovně Perón (Stroupežnického 20, Praha 5).
Přidat komentář

12.5.2017 16:42 /Honza Javorek
PyCon CZ, česká konference o programovacím jazyce Python, se po dvou úspěšných ročnících v Brně bude letos konat v Praze, a to 8. až 10. června. Na konferenci letos zavítá např. i Armin Ronacher, známý především jako autor frameworku Flask, šablon Jinja2/Twig, a dalších projektů. Těšit se můžete na přednášky o datové analytice, tvorbě webu, testování, tvorbě API, učení a mentorování programování, přednášky o rozvoji komunity, o použití Pythonu ve vědě nebo k ovládání nejrůznějších zařízení (MicroPython). Na vlastní prsty si můžete na workshopech vyzkoušet postavit Pythonem ovládaného robota, naučit se učit šestileté děti programovat, efektivně testovat nebo si v Pythonu pohrát s kartografickým materiálem. Kupujte lístky, dokud jsou.
Přidat komentář

2.5.2017 9:20 /Eva Rázgová
Putovní konference československé Drupal komunity "DrupalCamp Československo" se tentokrát koná 27. 5.2017 na VUT FIT v Brně. Můžete načerpat a vyměnit si zkušenosti z oblasti Drupalu 7 a 8, UX, SEO, managementu týmového vývoje, využití Dockeru pro Drupal a dalších. Vítáni jsou nováčci i experti. Akci pořádají Slovenská Drupal Asociácia a česká Asociace pro Drupal. Registrace na webu .
Přidat komentář

1.5.2017 20:31 /Pavel `Goldenfish' Kysilka
PR: 25.5.2017 proběhne v Praze konference na téma Firemní informační systémy. Hlavními tématy jsou: Informační systémy s vlastní inteligencí, efektivní práce s dokumenty, mobilní přístup k datům nebo využívání cloudu.
Přidat komentář

15.4.2017 15:20 /František Kučera
Máš rád svobodný software a hardware nebo se o nich chceš něco dozvědět? Zajímá tě IoT a radiokomunikace? Přijď na sraz spolku OpenAlt, který se bude konat ve středu 19. dubna od 18:30 v Šenkovně (Sokolská 60, Praha 2).
Přidat komentář

5.3.2017 19:12 /Redakce Linuxsoft.cz
PR: 23. března proběhne v Praze konferenci na téma Cloud computing v praxi. Hlavními tématy jsou: Nejžhavější trendy v oblasti cloudu a cloudových řešení, Moderní cloudové služby, Infrastruktura současných cloudů, Efektivní využití cloudu, Nástrahy cloudových řešení a jak se jim vyhnout.
Přidat komentář

   Více ...   Přidat zprávičku

> Poslední diskuze

18.9.2017 14:37 / Rojas
high security vault

15.9.2017 7:33 / Wilson
new zealand childcare jobs

31.8.2017 12:11 / Jaromir Obr
Re: ukůládání dat ze souboru

30.7.2017 11:12 / Jaromir Obr
Národní znaky

27.7.2017 12:24 / Jaromir Obr
Cteni/zapis

Více ...

ISSN 1801-3805 | Provozovatel: Pavel Kysilka, IČ: 72868490 (2003-2017) | mail at linuxsoft dot cz | Design: www.megadesign.cz | Textová verze