LINUXSOFT.cz Přeskoč levou lištu
Uživatel: Heslo:  
   CZUKPL

> PHP (57) - XML

XML se stalo módou současných systémů. Podívejme se, jak na něj jít pomocí PHP.

18.10.2004 15:00 | Petr Zajíc | Články autora | přečteno 52038×

XML je fenoménem posledních několika let. Pro ty z vás, kdo by snad nevěděl o co se jedná: XML označuje způsob velmi pružného ukládání dat pomocí souborů obsahujících značky. Je to trochu podobné jako HTML, které rovněž obsahuje data a značky (tagy), ale v trochu jiném slova smyslu. Podobnost mezi HTML (Hypertext Markup Language česky něco jako "značkový jazyk pro práci s hypertextem") a XML (Extensible Markup Language, česky něco jako"rozšiřitelný jazyk se značkami") není čistě náhodná, oba jazyky mají stejného rodiče. Je jím SGML (Standard Generalized Markup Language, "standardní zobecnění jazyk se značkami").

XML nám umožňuje vytvářet sktrukturované dokumenty. "Sktrukturované" znamená, že budou obsahovat "značky" a "znaky". Značky dávají dokumentu XML strukturu, kdežto znaky jim dávají obsah. XML dokumenty mohou být značně rozsáhlé, ale přesto (a to je asi hlavní výhoda) bývají snadno čitelné jak lidem, tak i počítačům. Zkrátíme úvod tím, že si předvedeme, jak takový XML dokument může vypadat:

<?xml version="1.0" encoding="UTF-8"?>
<FINANCE>
  <PRIJMY>
    <PRIJEM id="1">
      <NAZEV>Plat</NAZEV>
      <CASTKA>12000</CASTKA>
    </PRIJEM>
    <PRIJEM id="2">
      <NAZEV>Články na Linuxsoft</NAZEV>
      <CASTKA>3000</CASTKA>
    </PRIJEM>
  </PRIJMY>
  <VYDAJE>
    <VYDAJ id="1">
      <NAZEV>Byt</NAZEV>
      <CASTKA>4500</CASTKA>
    </VYDAJ>
    <VYDAJ id="2">
      <NAZEV>Jídlo</NAZEV>
      <CASTKA>2500</CASTKA>
    </VYDAJ>
    <VYDAJ id="3">
      <NAZEV>Koníčky</NAZEV>
      <CASTKA>1500</CASTKA>
    </VYDAJ>
  </VYDAJE>
</FINANCE>

To by mělo odstranit všechny nejasnosti kolem výhod XML. Vidíte, že formát je to opravdu pohodový. XML se skládá z několika oddílů neboli uzlů. Popis využití XML a technik jeho zpracování by vydal na nejednu knihu a skutečně na toto téma bylo mnoho knih vydáno. My si v našem seriálu ukážeme pouze dvě základní věci: Nejprve jak data z XML pomocí PHP číst a potom jak elegantně data do XML pomocí PHP zapisovat.

Pozn.: Celému problému se šířeji věnuje například náš seriál na Linuxsoftu. Věc je to technicky zaměřená, poměrně erudovaně napsaná a podstatně rozsáhlejší než našich několik dílů, které se budou XML věnovat. Aleš Hakl se však soustřeďuje převážně na práci v Javě, okrajově v FreePascalu a Pythonu, takže se vzájemně nebudeme křížit.

Expat a PHP

Asi tušíte, že když má XML nějakou strukturu, že nebude nutné k němu přistupovat bajt po bajtu a luštit jej pomocí funkcí sestavených v potu vlastní programátorské tváře (ačkoliv možné to samozřejmě je). Existují již hotové knihovny pro práci s XML. PHP například používá Expat. Expat patří do velké skupiny software, kterou nazýváme XML parsery. "Parser" si můžete představit jako program, který rozumí XML a umí k němu strukturovaně přistupovat. Parser rovněž ví, co má udělat, když v XML dokumentu narazí na určitou jeho část (třeba, když narazí na značku).

PHP, pokud to výslovně nezakážete, má po instalaci podporu XML zapnutou. Takže můžeme hned začít využívat funkcí pro práci s XML. Nejdřív vám vysvětlím, co všechno musí skript zpracovávající soubor XML dělat:

  1. Musí vytvořit instanci parseru.
  2. Musí zaregistrovat obslužné funkce. Tento hrozný výraz znamená prostě to, že se definují funkce v PHP, které stanoví, co s danou věcí (značky, data) dělat poté, co se na ni v dokumentu narazí. A parseru se řekne, že má tyto funkce zavolat.
  3. Konečně, parseru se předá vlastní xml soubor a ten jej zpracuje a skončí.

Pozn.: Celé je to trochu zjednodušené. Například jsme nehovořili o zpracování chyb. Ale pro představu by to mělo stačit.

Tak, a teď ukázka. Mějme soubor finance.xml (viz výše) a ukažme si, jak jej zpracovat naším v PHP vytvořeným parserem.

<?
  $nas_soubor
="./finance.xml";

  
//co se má stát, když narazíme na počáteční a koncovou značku
  
function PocatecniZnacka ($parser, $nazev, $atributy)
  {
    echo
"Narazil jsem při čtení na značku $nazev s atributy:"."<BR>";
    echo
print_r($atributy)."<BR>";
  }

  function
KoncovaZnacka ($parser, $nazev) {}
  
  
// fáze 1) instance parseru
  
$nas_parser=xml_parser_create();
  
  
// fáze 2) řekneme parseru, co má udělat když se dostane k
  // počáteční značce
  
xml_set_element_handler ($nas_parser, "PocatecniZnacka", "KoncovaZnacka");
  
  
// fáze 3) vlastní čtení souboru, práce s ním a ukončení parseru
  
if (!($obsahsouboru = fopen($nas_soubor, "r")))
    die(
"Nemohu otevřít XML pro čtení.");

  while (
$data = fread($obsahsouboru, 5))
    
xml_parse($nas_parser, $data, feof($obsahsouboru));

  
xml_parser_free($nas_parser);
?>

Spustit skript

Takovýhle parser je nám pochopitelně celkem na nic, ale dá se na něm alespoň pěkně zjistit, jak to celé funguje. Všimněte si funkce xml_set_element_handler. Ta registruje funkci, která bude provedena pokud se při procházení dokumentu XML narazí na značky. V našem případě to je vypsání do prohlížeče, může to však být libovolná akce, kterou je PHP schopno provést. Rovněž si všimněte, že pro obsluhu koncové značky jsme zaregistrovali funkci, která nedělá vůbec nic. To je v pořádku, funcke se nám může hodit později, takže byste si měli zvyknout to tak dělat.

Příště si ukážeme, jak sestavit poněkud chytřejší parser. Bude to aplikace, která nám řekne, koli si ještě na základě našich příjmů a výdajů můžeme dovolit utratit ;-) když se všechny příjmy a výdaje sečtou. Jinými slovy uvidíme, že parser umí (pochopitelně) pracovat nejen se značkami, ale rovněž s daty.

Verze pro tisk

pridej.cz

 

DISKUZE

Nejsou žádné diskuzní příspěvky u dané položky.



Příspívat do diskuze mohou pouze registrovaní uživatelé.
> Vyhledávání software
> Vyhledávání článků

28.11.2018 23:56 /František Kučera
Prosincový sraz spolku OpenAlt se koná ve středu 5.12.2018 od 16:00 na adrese Zikova 1903/4, Praha 6. Tentokrát navštívíme organizaci CESNET. Na programu jsou dvě přednášky: Distribuované úložiště Ceph (Michal Strnad) a Plně šifrovaný disk na moderním systému (Ondřej Caletka). Následně se přesuneme do některé z nedalekých restaurací, kde budeme pokračovat v diskusi.
Komentářů: 1

12.11.2018 21:28 /Redakce Linuxsoft.cz
22. listopadu 2018 se koná v Praze na Karlově náměstí již pátý ročník konference s tématem Datová centra pro business, která nabídne odpovědi na aktuální a často řešené otázky: Jaké jsou aktuální trendy v oblasti datových center a jak je optimálně využít pro vlastní prospěch? Jak si zajistit odpovídající služby datových center? Podle jakých kritérií vybírat dodavatele služeb? Jak volit vhodné součásti infrastruktury při budování či rozšiřování vlastního datového centra? Jak efektivně datové centrum spravovat? Jak co nejlépe eliminovat možná rizika? apod. Příznivci LinuxSoftu mohou při registraci uplatnit kód LIN350, který jim přinese zvýhodněné vstupné s 50% slevou.
Přidat komentář

6.11.2018 2:04 /František Kučera
Říjnový pražský sraz spolku OpenAlt se koná v listopadu – již tento čtvrtek – 8. 11. 2018 od 18:00 v Radegastovně Perón (Stroupežnického 20, Praha 5). Tentokrát bez oficiální přednášky, ale zato s dobrým jídlem a pivem – volná diskuse na téma umění a technologie, IoT, CNC, svobodný software, hardware a další hračky.
Přidat komentář

4.10.2018 21:30 /Ondřej Čečák
LinuxDays 2018 již tento víkend, registrace je otevřená.
Přidat komentář

18.9.2018 23:30 /František Kučera
Zářijový pražský sraz spolku OpenAlt se koná již tento čtvrtek – 20. 9. 2018 od 18:00 v Radegastovně Perón (Stroupežnického 20, Praha 5). Tentokrát bez oficiální přednášky, ale zato s dobrým jídlem a pivem – volná diskuse na téma IoT, CNC, svobodný software, hardware a další hračky.
Přidat komentář

9.9.2018 14:15 /Redakce Linuxsoft.cz
20.9.2018 proběhne v pražském Kongresovém centru Vavruška konference Mobilní řešení pro business. Návštěvníci si vyslechnou mimo jiné přednášky na témata: Nejdůležitější aktuální trendy v oblasti mobilních technologií, správa a zabezpečení mobilních zařízení ve firmách, jak mobilně přistupovat k informačnímu systému firmy, kdy se vyplatí používat odolná mobilní zařízení nebo jak zabezpečit mobilní komunikaci.
Přidat komentář

12.8.2018 16:58 /František Kučera
Srpnový pražský sraz spolku OpenAlt se koná ve čtvrtek – 16. 8. 2018 od 19:00 v Kavárně Ideál (Sázavská 30, Praha), kde máme rezervovaný salonek. Tentokrát jsou tématem srazu databáze prezentaci svého projektu si pro nás připravil Standa Dzik. Dále bude prostor, abychom probrali nápady na využití IoT a sítě The Things Network, případně další témata.
Přidat komentář

16.7.2018 1:05 /František Kučera
Červencový pražský sraz spolku OpenAlt se koná již tento čtvrtek – 19. 7. 2018 od 18:00 v Kavárně Ideál (Sázavská 30, Praha), kde máme rezervovaný salonek. Tentokrát bude přednáška na téma: automatizační nástroj Ansible, kterou si připravil Martin Vicián.
Přidat komentář

   Více ...   Přidat zprávičku

> Poslední diskuze

13.12.2018 10:57 / Jan Mareš
Re: zavináč

2.12.2018 23:56 / František Kučera
Sraz

5.10.2018 17:12 / Jakub Kuljovsky
Re: Jaký kurz a software by jste doporučili pro začínajcího kodéra?

20.9.2018 10:04 / Jan Ober
Jaký kurz a software by jste doporučili pro začínajcího kodéra?

20.9.2018 10:00 / Jan Ober
Re: Gimp

Více ...

ISSN 1801-3805 | Provozovatel: Pavel Kysilka, IČ: 72868490 (2003-2018) | mail at linuxsoft dot cz | Design: www.megadesign.cz | Textová verze