LINUXSOFT.cz Přeskoč levou lištu
Uživatel: Heslo:  
   CZUKPL

> Programujeme s XML (13.) - XPath a řetězce

Dnes zakončíme náš rychlý úvod do jazyka XPath popisem funkcí pracujících s řetězci.

24.8.2004 15:00 | Aleš Hakl | Články autora | přečteno 12559×

Protože jazyk XPath není určen pro obecné programování, a protože je z principu interpretovaný, nebylo by vhodné zpracovávat řetězce po jednotlivých znacích a tudíž to ani není možné, a právě proto nám jazyk XPath nabízí řadu funkcí představujících nejčastější operace s řetězci. Tato sada funkcí bohužel neobsahuje žádné zpracování regulárních výrazů, které bych právě v jazyku typu XPath velmi uvítal.

Již minule jsme se seznámili s funkcí string() sloužící k převodu libovolného jiného datového typu na řetězec, nyní se tedy podíváme na ostatní:

concat() - Spojování řetězců

Funkce concat() spojí všechny svoje argumenty do jednoho řetězce, argumentů může být 2 nebo více.

starts-with() - Vyhledávání na začátku

Tato funkce slouží k operaci, která se v ostatních jazycích příliš nevyskytuje (snad z výjimkou Javy), zjistí, začíná-li první argument obsahem druhého argumentu a podle toho vrátí true nebo false.

contains() - Vyhledávání

Obdoba funkce předchozí s tím rozdílem, že vrací true, pokud se druhý argument vyskytuje kdekoli v prvním.

substring-before() a substring-after()

Tyto dvě funkce vrací část prvního argumentu předcházející (nebo následující) výskyt druhého argumentu. Obě funkce vrátí prázdný řetězec, pokud se v prvním argumentu argument druhý nevyskytuje (což může být občas trochu matoucí)

substring() - Část řetězce

Tato funkce vrácí část prvního argumentu určenou pozicí začátku (druhý argument) a délkou (třetí argument). Pozice prvního znaku je 1 jako v Pascalu a ne 0 jako ve většině ostatních programovacích jazyků.

string-length() - Délka řetězce

Vrácí délku řetězce (argumentu) ve znacích.

normalize-space() - Normalizace mezer

Funkce normalize-space() zajistí nahrazení mezer a podobných znaků (což znamená tabulátor a nový řádek, znaky typu U+3000(ideografická mezera) XML nepovažuje za mezery) dle pravidel XML.

Prakticky jde o to, že tyto znaky jsou na začátku a konci řetězce odstraněny a jejich sekvence uprostřed řetězce jsou nahrazeny jednou mezerou.

translate() - Nahrazení znaků

Kdo zná program tr(1), zná i tuto funkci, princip je totiž stejný. Funkce vrací první argument ve kterém jsou znaky vyskytující se v druhém argumentu nahrazeny odpovídajícími znaky z třetího argumentu. Pokud je třetí argument kratší než druhý, jsou odpovídající znaky jednoduše odstraněny.

Několik příkladů

concat('foo','bar','quux') = foobarquux

starts-with('nyaa','ny') = true

starts-with('nyaa','mn') = false

contains('foo bar','bar') = true

contains('foo bar','quux') = false

contains('foobar','oba') = true

substring-before('root=/dev/hda1','=') = root

substring-after('root=/dev/hda1','=') = /dev/hda1

substring-before('foo,bar,quux',',') = foo

substring-after('foo,bar,quux',',') = bar,quux

substring-before('foo,bar,quux','=') =

substring-after('foo,bar,quux','=') =

substring('abcdef',2,3) = bcd

substring('abcdef',5,1 div 0) = ef - Výsledkem dělení nulou je hodnota plus nekonečno.

string-length('abcdef') = 6

normalize-space(' bla  bla  foo   ') = bla bla foo

translate('abcdef','ab','AB') = ABcdef

translate('abcdef','abc','AB') = ABdef

Pokud někde mluvím o znacích, myslím tím samožřejmě znaky Unicode a nikoli jednotlivé bajty a toto by mělo platit i pro znaky vyšší než U+FFFF. Jediným problémem můžou být znaky, které ačkoli vypadají jeden jsou reprezentovány více znaky Unicode, případně pro ně existuje více reprezentací, jednou jako jeden znak a podruhé jako dva znaky. Všechny české znaky s diakritikou patří do druhé skupiny, do první patří různé komplikovaně skládané znaky některých asijských jazyků.

Tímto článkem bych uzavřel naši krátkou odbočku k jazyku XPath a příště se vrátíme k XSL transformacím, pro které jsme teď vyzbrojeni jazykem XPath.

Verze pro tisk

pridej.cz

 

DISKUZE

Nejsou žádné diskuzní příspěvky u dané položky.



Příspívat do diskuze mohou pouze registrovaní uživatelé.
> Vyhledávání software
> Vyhledávání článků

12.8.2018 16:58 /František Kučera
Srpnový pražský sraz spolku OpenAlt se koná ve čtvrtek – 16. 8. 2018 od 19:00 v Kavárně Ideál (Sázavská 30, Praha), kde máme rezervovaný salonek. Tentokrát jsou tématem srazu databáze prezentaci svého projektu si pro nás připravil Standa Dzik. Dále bude prostor, abychom probrali nápady na využití IoT a sítě The Things Network, případně další témata.
Přidat komentář

16.7.2018 1:05 /František Kučera
Červencový pražský sraz spolku OpenAlt se koná již tento čtvrtek – 19. 7. 2018 od 18:00 v Kavárně Ideál (Sázavská 30, Praha), kde máme rezervovaný salonek. Tentokrát bude přednáška na téma: automatizační nástroj Ansible, kterou si připravil Martin Vicián.
Přidat komentář

18.6.2018 0:43 /František Kučera
Červnový pražský sraz spolku OpenAlt se koná již tento čtvrtek – 21. 6. 2018 od 18:00 v Kavárně Ideál (Sázavská 30, Praha), kde máme rezervovaný salonek. Tentokrát na téma: F-Droid, aneb svobodný software do vašeho mobilu. Kromě toho budou k vidění i vývojové desky HiFive1 se svobodným/otevřeným čipem RISC-V.
Přidat komentář

23.5.2018 20:55 /Ondřej Čečák
Od pátku 25.5. proběhne na Fakultě informačních technologií ČVUT v Praze openSUSE Conference. Můžete se těšit na spostu zajímavých přednášek, workshopů a také na Release Party nového openSUSE leap 15.0. V na stejném místě proběhne v sobotu 26.5. i seminář o bezpečnosti CryptoFest.
Přidat komentář

20.5.2018 17:45 /Redakce Linuxsoft.cz
Ve čtvrtek 31. května 2018 připravuje webový magazín BusinessIT ve spolupráci s Best Online Média s.r.o. pátý ročník odborné konference Firemní informační systémy 2018. Akce proběhne v kongresovém centru Vavruška (palác Charitas), Karlovo náměstí 5, Praha 2 (u metra Karlovo náměstí) od 9:00 hod. dopoledne do cca 15 hod. odpoledne. Konference je zaměřena na efektivní využití firemních informačních systémů a na to, jak plně využít jejich potenciál. Podrobnější informace na webových stránkách konfrence.
Přidat komentář

14.5.2018 7:28 /František Kučera
Květnový pražský sraz spolku OpenAlt se koná již tento čtvrtek – 17. 5. 2018 od 18:00 v Kavárně Ideál (Sázavská 30, Praha), kde máme rezervovaný salonek. Tentokrát na téma: Audio – zvuk v GNU/Linuxu.
Přidat komentář

7.5.2018 16:20 /František Kučera
Na stránkách spolku OpenAlt vyšla fotoreportáž Pražské srazy 2017 dokumentující srazy za uplynulý rok. Květnový pražský sraz na téma audio se bude konat 17. 5. 2018 (místo a čas ještě upřesníme).
Přidat komentář

17.4.2018 0:46 /František Kučera
Dubnový pražský sraz spolku OpenAlt se koná již tento čtvrtek – 19. 4. 2018 od 18:00 v Kavárně Ideál (Sázavská 30, Praha), kde máme rezervovaný salonek. Tématem tohoto srazu bude OpenStreetMap (OSM) aneb svobodné mapy.
Přidat komentář

   Více ...   Přidat zprávičku

> Poslední diskuze

20.2.2018 18:48 / Ivan Majer
portal

20.2.2018 15:57 / Jan Havel
Jak využíváte služby cloudu v podnikání?

16.1.2018 1:08 / Ivan Pittner
verejna ip od o2 ubuntu

15.1.2018 17:26 / Mira Harvalik
Re: Jak udělat HTML/Javascript swiping gallery do mobilu?

30.12.2017 20:16 / Michal Knoll
odmocnina

Více ...

ISSN 1801-3805 | Provozovatel: Pavel Kysilka, IČ: 72868490 (2003-2018) | mail at linuxsoft dot cz | Design: www.megadesign.cz | Textová verze