LINUXSOFT.cz Přeskoč levou lištu
Uživatel: Heslo:  
   CZUKPL

> Programujeme s XML (13.) - XPath a řetězce

Dnes zakončíme náš rychlý úvod do jazyka XPath popisem funkcí pracujících s řetězci.

24.8.2004 15:00 | Aleš Hakl | Články autora | přečteno 11895×

Protože jazyk XPath není určen pro obecné programování, a protože je z principu interpretovaný, nebylo by vhodné zpracovávat řetězce po jednotlivých znacích a tudíž to ani není možné, a právě proto nám jazyk XPath nabízí řadu funkcí představujících nejčastější operace s řetězci. Tato sada funkcí bohužel neobsahuje žádné zpracování regulárních výrazů, které bych právě v jazyku typu XPath velmi uvítal.

Již minule jsme se seznámili s funkcí string() sloužící k převodu libovolného jiného datového typu na řetězec, nyní se tedy podíváme na ostatní:

concat() - Spojování řetězců

Funkce concat() spojí všechny svoje argumenty do jednoho řetězce, argumentů může být 2 nebo více.

starts-with() - Vyhledávání na začátku

Tato funkce slouží k operaci, která se v ostatních jazycích příliš nevyskytuje (snad z výjimkou Javy), zjistí, začíná-li první argument obsahem druhého argumentu a podle toho vrátí true nebo false.

contains() - Vyhledávání

Obdoba funkce předchozí s tím rozdílem, že vrací true, pokud se druhý argument vyskytuje kdekoli v prvním.

substring-before() a substring-after()

Tyto dvě funkce vrací část prvního argumentu předcházející (nebo následující) výskyt druhého argumentu. Obě funkce vrátí prázdný řetězec, pokud se v prvním argumentu argument druhý nevyskytuje (což může být občas trochu matoucí)

substring() - Část řetězce

Tato funkce vrácí část prvního argumentu určenou pozicí začátku (druhý argument) a délkou (třetí argument). Pozice prvního znaku je 1 jako v Pascalu a ne 0 jako ve většině ostatních programovacích jazyků.

string-length() - Délka řetězce

Vrácí délku řetězce (argumentu) ve znacích.

normalize-space() - Normalizace mezer

Funkce normalize-space() zajistí nahrazení mezer a podobných znaků (což znamená tabulátor a nový řádek, znaky typu U+3000(ideografická mezera) XML nepovažuje za mezery) dle pravidel XML.

Prakticky jde o to, že tyto znaky jsou na začátku a konci řetězce odstraněny a jejich sekvence uprostřed řetězce jsou nahrazeny jednou mezerou.

translate() - Nahrazení znaků

Kdo zná program tr(1), zná i tuto funkci, princip je totiž stejný. Funkce vrací první argument ve kterém jsou znaky vyskytující se v druhém argumentu nahrazeny odpovídajícími znaky z třetího argumentu. Pokud je třetí argument kratší než druhý, jsou odpovídající znaky jednoduše odstraněny.

Několik příkladů

concat('foo','bar','quux') = foobarquux

starts-with('nyaa','ny') = true

starts-with('nyaa','mn') = false

contains('foo bar','bar') = true

contains('foo bar','quux') = false

contains('foobar','oba') = true

substring-before('root=/dev/hda1','=') = root

substring-after('root=/dev/hda1','=') = /dev/hda1

substring-before('foo,bar,quux',',') = foo

substring-after('foo,bar,quux',',') = bar,quux

substring-before('foo,bar,quux','=') =

substring-after('foo,bar,quux','=') =

substring('abcdef',2,3) = bcd

substring('abcdef',5,1 div 0) = ef - Výsledkem dělení nulou je hodnota plus nekonečno.

string-length('abcdef') = 6

normalize-space(' bla  bla  foo   ') = bla bla foo

translate('abcdef','ab','AB') = ABcdef

translate('abcdef','abc','AB') = ABdef

Pokud někde mluvím o znacích, myslím tím samožřejmě znaky Unicode a nikoli jednotlivé bajty a toto by mělo platit i pro znaky vyšší než U+FFFF. Jediným problémem můžou být znaky, které ačkoli vypadají jeden jsou reprezentovány více znaky Unicode, případně pro ně existuje více reprezentací, jednou jako jeden znak a podruhé jako dva znaky. Všechny české znaky s diakritikou patří do druhé skupiny, do první patří různé komplikovaně skládané znaky některých asijských jazyků.

Tímto článkem bych uzavřel naši krátkou odbočku k jazyku XPath a příště se vrátíme k XSL transformacím, pro které jsme teď vyzbrojeni jazykem XPath.

Verze pro tisk

pridej.cz

 

DISKUZE

Nejsou žádné diskuzní příspěvky u dané položky.



Příspívat do diskuze mohou pouze registrovaní uživatelé.
> Vyhledávání software
> Vyhledávání článků

15.5.2017 23:50 /František Kučera
Máš rád svobodný software a hardware nebo se o nich chceš něco dozvědět? Zajímá tě DIY, CNC, SDR nebo morseovka? Přijď na sraz spolku OpenAlt, který se bude konat ve čtvrtek 18. května od 18:00 v Radegastovně Perón (Stroupežnického 20, Praha 5).
Přidat komentář

12.5.2017 16:42 /Honza Javorek
PyCon CZ, česká konference o programovacím jazyce Python, se po dvou úspěšných ročnících v Brně bude letos konat v Praze, a to 8. až 10. června. Na konferenci letos zavítá např. i Armin Ronacher, známý především jako autor frameworku Flask, šablon Jinja2/Twig, a dalších projektů. Těšit se můžete na přednášky o datové analytice, tvorbě webu, testování, tvorbě API, učení a mentorování programování, přednášky o rozvoji komunity, o použití Pythonu ve vědě nebo k ovládání nejrůznějších zařízení (MicroPython). Na vlastní prsty si můžete na workshopech vyzkoušet postavit Pythonem ovládaného robota, naučit se učit šestileté děti programovat, efektivně testovat nebo si v Pythonu pohrát s kartografickým materiálem. Kupujte lístky, dokud jsou.
Přidat komentář

2.5.2017 9:20 /Eva Rázgová
Putovní konference československé Drupal komunity "DrupalCamp Československo" se tentokrát koná 27. 5.2017 na VUT FIT v Brně. Můžete načerpat a vyměnit si zkušenosti z oblasti Drupalu 7 a 8, UX, SEO, managementu týmového vývoje, využití Dockeru pro Drupal a dalších. Vítáni jsou nováčci i experti. Akci pořádají Slovenská Drupal Asociácia a česká Asociace pro Drupal. Registrace na webu .
Přidat komentář

1.5.2017 20:31 /Pavel `Goldenfish' Kysilka
PR: 25.5.2017 proběhne v Praze konference na téma Firemní informační systémy. Hlavními tématy jsou: Informační systémy s vlastní inteligencí, efektivní práce s dokumenty, mobilní přístup k datům nebo využívání cloudu.
Přidat komentář

15.4.2017 15:20 /František Kučera
Máš rád svobodný software a hardware nebo se o nich chceš něco dozvědět? Zajímá tě IoT a radiokomunikace? Přijď na sraz spolku OpenAlt, který se bude konat ve středu 19. dubna od 18:30 v Šenkovně (Sokolská 60, Praha 2).
Přidat komentář

5.3.2017 19:12 /Redakce Linuxsoft.cz
PR: 23. března proběhne v Praze konferenci na téma Cloud computing v praxi. Hlavními tématy jsou: Nejžhavější trendy v oblasti cloudu a cloudových řešení, Moderní cloudové služby, Infrastruktura současných cloudů, Efektivní využití cloudu, Nástrahy cloudových řešení a jak se jim vyhnout.
Přidat komentář

27.2.2017 22:12 /František Kučera
Pozvánka na 137. sraz OpenAlt – Praha: Tentokrát jsme si pro vás připravili neobvyklou akci. Ve středu 1.3. v 17:30 nás přivítá sdružení CZ.NIC ve svých prostorách v Milešovské ulici číslo 5 na Praze 3, kde si pro nás připravili krátkou prezentaci jejich činnosti. Následně navštívíme jejich datacentrum pod Žižkovskou věží. Provedou nás prostory, které jsou běžnému smrtelníkovi nedostupné!
Po ukončení prohlídky se všchni odebereme do hostince U vodoucha, Jagelonská 21, Praha 3 pochutnat si na některém z vybraných piv či dát si něco na zub. Rezervaci máme od 19:30, heslo je OpenAlt.
Ale pozor! Do prostor datového centra máme omezený přístup, dostane se tam pouze 10 lidí! Takže kdo přijde dříve, ten má přednost, a občanky s sebou! Kdo nebude chtít na prohlídku datového centra, může se pomalu přesunout do hostince U vodoucha a u nepřeberné nabídky piv počkat na ostatní.
Přidat komentář

18.1.2017 0:49 /František Kučera
Členové a příznivci spolku OpenAlt se pravidelně schází v Praze a Brně. Fotky z pražských srazů za uplynulý rok si můžete prohlédnout na stránkách spolku. Příští sraz se koná už 19. ledna – tentokrát je tématem ergonomie ovládání počítače – tzn. klávesnice, myši a další zařízení. Také budete mít příležitost si prohlédnout pražský hackerspace Brmlab.
Přidat komentář

   Více ...   Přidat zprávičku

> Poslední diskuze

1.8.2017 7:32 / Cassidy
structural consultants

30.7.2017 11:12 / Jaromir Obr
Národní znaky

27.7.2017 12:24 / Jaromir Obr
Cteni/zapis

26.7.2017 21:12 / Jaromir Obr
Podminka

15.6.2017 9:34 / Ondřej Havlas
php,

Více ...

ISSN 1801-3805 | Provozovatel: Pavel Kysilka, IČ: 72868490 (2003-2017) | mail at linuxsoft dot cz | Design: www.megadesign.cz | Textová verze