LINUXSOFT.cz Přeskoč levou lištu
Uživatel: Heslo:  
   CZUKPL

> PHP (57) - XML

XML se stalo módou současných systémů. Podívejme se, jak na něj jít pomocí PHP.

18.10.2004 15:00 | Petr Zajíc | Články autora | přečteno 49600×

Komerční sdělení: Pořádáme Kurzy PHP

XML je fenoménem posledních několika let. Pro ty z vás, kdo by snad nevěděl o co se jedná: XML označuje způsob velmi pružného ukládání dat pomocí souborů obsahujících značky. Je to trochu podobné jako HTML, které rovněž obsahuje data a značky (tagy), ale v trochu jiném slova smyslu. Podobnost mezi HTML (Hypertext Markup Language česky něco jako "značkový jazyk pro práci s hypertextem") a XML (Extensible Markup Language, česky něco jako"rozšiřitelný jazyk se značkami") není čistě náhodná, oba jazyky mají stejného rodiče. Je jím SGML (Standard Generalized Markup Language, "standardní zobecnění jazyk se značkami").

XML nám umožňuje vytvářet sktrukturované dokumenty. "Sktrukturované" znamená, že budou obsahovat "značky" a "znaky". Značky dávají dokumentu XML strukturu, kdežto znaky jim dávají obsah. XML dokumenty mohou být značně rozsáhlé, ale přesto (a to je asi hlavní výhoda) bývají snadno čitelné jak lidem, tak i počítačům. Zkrátíme úvod tím, že si předvedeme, jak takový XML dokument může vypadat:

<?xml version="1.0" encoding="UTF-8"?>
<FINANCE>
  <PRIJMY>
    <PRIJEM id="1">
      <NAZEV>Plat</NAZEV>
      <CASTKA>12000</CASTKA>
    </PRIJEM>
    <PRIJEM id="2">
      <NAZEV>Články na Linuxsoft</NAZEV>
      <CASTKA>3000</CASTKA>
    </PRIJEM>
  </PRIJMY>
  <VYDAJE>
    <VYDAJ id="1">
      <NAZEV>Byt</NAZEV>
      <CASTKA>4500</CASTKA>
    </VYDAJ>
    <VYDAJ id="2">
      <NAZEV>Jídlo</NAZEV>
      <CASTKA>2500</CASTKA>
    </VYDAJ>
    <VYDAJ id="3">
      <NAZEV>Koníčky</NAZEV>
      <CASTKA>1500</CASTKA>
    </VYDAJ>
  </VYDAJE>
</FINANCE>

To by mělo odstranit všechny nejasnosti kolem výhod XML. Vidíte, že formát je to opravdu pohodový. XML se skládá z několika oddílů neboli uzlů. Popis využití XML a technik jeho zpracování by vydal na nejednu knihu a skutečně na toto téma bylo mnoho knih vydáno. My si v našem seriálu ukážeme pouze dvě základní věci: Nejprve jak data z XML pomocí PHP číst a potom jak elegantně data do XML pomocí PHP zapisovat.

Pozn.: Celému problému se šířeji věnuje například náš seriál na Linuxsoftu. Věc je to technicky zaměřená, poměrně erudovaně napsaná a podstatně rozsáhlejší než našich několik dílů, které se budou XML věnovat. Aleš Hakl se však soustřeďuje převážně na práci v Javě, okrajově v FreePascalu a Pythonu, takže se vzájemně nebudeme křížit.

Expat a PHP

Asi tušíte, že když má XML nějakou strukturu, že nebude nutné k němu přistupovat bajt po bajtu a luštit jej pomocí funkcí sestavených v potu vlastní programátorské tváře (ačkoliv možné to samozřejmě je). Existují již hotové knihovny pro práci s XML. PHP například používá Expat. Expat patří do velké skupiny software, kterou nazýváme XML parsery. "Parser" si můžete představit jako program, který rozumí XML a umí k němu strukturovaně přistupovat. Parser rovněž ví, co má udělat, když v XML dokumentu narazí na určitou jeho část (třeba, když narazí na značku).

PHP, pokud to výslovně nezakážete, má po instalaci podporu XML zapnutou. Takže můžeme hned začít využívat funkcí pro práci s XML. Nejdřív vám vysvětlím, co všechno musí skript zpracovávající soubor XML dělat:

  1. Musí vytvořit instanci parseru.
  2. Musí zaregistrovat obslužné funkce. Tento hrozný výraz znamená prostě to, že se definují funkce v PHP, které stanoví, co s danou věcí (značky, data) dělat poté, co se na ni v dokumentu narazí. A parseru se řekne, že má tyto funkce zavolat.
  3. Konečně, parseru se předá vlastní xml soubor a ten jej zpracuje a skončí.

Pozn.: Celé je to trochu zjednodušené. Například jsme nehovořili o zpracování chyb. Ale pro představu by to mělo stačit.

Tak, a teď ukázka. Mějme soubor finance.xml (viz výše) a ukažme si, jak jej zpracovat naším v PHP vytvořeným parserem.

<?
  $nas_soubor
="./finance.xml";

  
//co se má stát, když narazíme na počáteční a koncovou značku
  
function PocatecniZnacka ($parser, $nazev, $atributy)
  {
    echo
"Narazil jsem při čtení na značku $nazev s atributy:"."<BR>";
    echo
print_r($atributy)."<BR>";
  }

  function
KoncovaZnacka ($parser, $nazev) {}
  
  
// fáze 1) instance parseru
  
$nas_parser=xml_parser_create();
  
  
// fáze 2) řekneme parseru, co má udělat když se dostane k
  // počáteční značce
  
xml_set_element_handler ($nas_parser, "PocatecniZnacka", "KoncovaZnacka");
  
  
// fáze 3) vlastní čtení souboru, práce s ním a ukončení parseru
  
if (!($obsahsouboru = fopen($nas_soubor, "r")))
    die(
"Nemohu otevřít XML pro čtení.");

  while (
$data = fread($obsahsouboru, 5))
    
xml_parse($nas_parser, $data, feof($obsahsouboru));

  
xml_parser_free($nas_parser);
?>

Spustit skript

Takovýhle parser je nám pochopitelně celkem na nic, ale dá se na něm alespoň pěkně zjistit, jak to celé funguje. Všimněte si funkce xml_set_element_handler. Ta registruje funkci, která bude provedena pokud se při procházení dokumentu XML narazí na značky. V našem případě to je vypsání do prohlížeče, může to však být libovolná akce, kterou je PHP schopno provést. Rovněž si všimněte, že pro obsluhu koncové značky jsme zaregistrovali funkci, která nedělá vůbec nic. To je v pořádku, funcke se nám může hodit později, takže byste si měli zvyknout to tak dělat.

Příště si ukážeme, jak sestavit poněkud chytřejší parser. Bude to aplikace, která nám řekne, koli si ještě na základě našich příjmů a výdajů můžeme dovolit utratit ;-) když se všechny příjmy a výdaje sečtou. Jinými slovy uvidíme, že parser umí (pochopitelně) pracovat nejen se značkami, ale rovněž s daty.

Verze pro tisk

pridej.cz

 

DISKUZE

Nejsou žádné diskuzní příspěvky u dané položky.



Příspívat do diskuze mohou pouze registrovaní uživatelé.
> Vyhledávání software
> Vyhledávání článků

27.8.2016 8:55 /Delujek
Dnes po 4 letech komunitního vývoje vyšla diaspora 0.6.0.0
diaspora* je open-source, distribuovaná sociální síť s důrazem na soukromý
Více v oficiálním blog-postu
Přidat komentář

24.8.2016 6:44 /Ondřej Čečák
Poslední týden CFP LinuxDays 2016; pokud byste rádi přednášeli na LinuxDays 2016 8. a 9. října v Praze, můžete svůj příspěvek přihlásit, následovat bude veřejné hlasování.
Přidat komentář

9.8.2016 22:56 /Petr Ježek
Zařazení souborového systému reiser4 do jádra 4.7 znamená konečně konec patchování jádra jen kvůli možnosti použít reiser4.
Přidat komentář

12.7.2016 13:14 /František Kučera
Spolek OpenAlt zve na 130. distribuovaný sraz příznivců svobodného softwaru a otevřených technologií (hardware, 3D tisk, SDR, DIY, makers…), který se bude konat ve čtvrtek 21. července od 18:00 v Radegastovně Perón (Stroupežnického 20, Praha 5).
Přidat komentář

11.7.2016 16:53 /Redakce Linuxsoft.cz
Konference LinuxDays hledá přednášející. Přihlášky poběží do konce prázdnin, v září bude hlasování a program. Více na https://www.linuxdays.cz/2016/cfp/.
Přidat komentář

8.5.2016 17:19 /Redakce Linuxsoft.cz
PR: Dne 26.5.2016 proběhne v Praze konference Cloud computing v praxi. Tématy bude např. nejnovější trendy v oblasti cloudu a cloudových řešení, cloudové služby, infrastruktura cloudu, efektivní využití cloudu, možné nástrahy cloudů a jak se jim vyhnout
Přidat komentář

21.4.2016 8:01 /František Kučera
Spolek OpenAlt zve na 127. distribuovaný sraz příznivců svobodného softwaru a otevřených technologií (hardware, 3D tisk, SDR, DIY, makers…), který se bude konat ve čtvrtek 28. dubna od 18:00 v Radegastovně Perón (Stroupežnického 20, Praha 5).
Přidat komentář

2.3.2016 22:41 /Ondřej Čečák
Letošní ročník konference InstallFest již tento víkend!
Přidat komentář

   Více ...   Přidat zprávičku

> Poslední diskuze

12.8.2016 11:51 / Josef Zapletal
Jak udělat HTML/Javascript swiping gallery do mobilu?

8.8.2016 14:58 / Adams
fairies for hire

28.7.2016 15:51 / pepan
Re: NetBeans vs Eclipse

10.6.2016 21:10 / pavel riha
FreeBSD 10.3 a virtualizace

8.6.2016 21:56 / Milan Gallas
Nevalidní prefix m

Více ...

ISSN 1801-3805 | Provozovatel: Pavel Kysilka, IČ: 72868490 (2003-2016) | mail at linuxsoft dot cz | Design: www.megadesign.cz | Textová verze