LINUXSOFT.cz Přeskoč levou lištu
Uživatel: Heslo:  
   CZUKPL

> MySQL (28) - Dotazy pro pokročilé

Dnes o tom, jak vrátit sadu záznamů s očíslovanými řádky. Uvidíte, jak se dá vtipně využít spojení tabulky se sebou samou.

8.7.2005 08:00 | Petr Zajíc | Články autora | přečteno 31467×

Komerční sdělení: Pořádáme Kurzy MySQL

Minule jsme načali látku o pokročilých technikách sestavování SQL dotazů tím, že jsme si ukázali, jak se dá sestavit dotaz na duplicitní položky a dotaz na chybějící záznamy. Dnes budeme v rozboru náročnějších dotazů pokračovat. Ukážeme si, co může vzniknout za problémy, když se rozhodnete vracet pořadová čísla záznamů.

"Očíslované" záznamy

Čas od času je třeba vrátit sadu záznamů, která obsahuje jako součást vracených dat i pořadové číslo záznamu. Může to být potřeba například při sestavování výsledkových listin v nějakém soutěžním klání, jako podklad pro tvorbu kalendářů a podobně. Mějme třeba jako data tabulku:

create table zamestnanci (jmeno varchar(20), plat integer);
insert into zamestnanci (jmeno, plat) values ('Pepa', 10000);
insert into zamestnanci (jmeno, plat) values ('Míša', 9500);
insert into zamestnanci (jmeno, plat) values ('Jarda', 12500);
insert into zamestnanci (jmeno, plat) values ('Jana', 13200);
insert into zamestnanci (jmeno, plat) values ('Big boss', 16500);

a chtějme vrátit lidi podle jejich platů (nejbohatší nejvýše) s tím, že seznam bude očíslován. Jak na to? Existuje několik řešení.

Řešení s dočasnou tabulkou

První, co by někoho mohlo napadnout je, že k tabulce by se mohlo přidat automaticky číslované pole, a pak ji prostě vrátit i s tímto polem:

alter table zamestnanci add id int not null auto_increment primary key;
select * from zamestnanci;

Tento přístup má však mnoho omezení, v praxi většinou takových, že se to nedá použít vůbec:

  • Každá tabulka smí mít jen jedno automaticky číslované pole
  • Odmazáním záznamů vznikne v číslené řadě "díra", kterou MySQL nezaplňuje
  • Toto číslování funguje jen pro celou tabulku, pokud budeme chtít data seřadit nebo vybrat jen některá, je nám tento postup víceméně nanic.

Ačkoli by se zdálo, že se tím nemá cenu déle zabývat, může mít tato technika vracení "očíslovaných záznamů" své zastánce, zejména pokud ji trochu upravíme. MySQL totiž může fungovat takto:

  1. Vytvoříme si sadu záznamů, která nás zajímá
  2. Tu umístíme do dočasné tabulky
  3. K dočasné tabulce přidáme automaticky číslované pole
  4. Pak z ní vybereme data a ta vrátíme volající aplikaci

Celé to předveďme na příkladu. Budeme chtít vrátit seznam zaměstnanců s tím, že budou seřazeni podle platu (sestupně) a očíslováni. Řešení?

create temporary table tmp_zamestnanci like zamestnanci;
alter table tmp_zamestnanci add id int not null auto_increment primary key;
insert into tmp_zamestnanci (jmeno, plat) select jmeno, plat from zamestnanci order by plat desc;
select * from tmp_zamestnanci;

Toto řešení samozřejmě předpokládá, že v původní tabulce neexistovalo pole id. Pokud by existovalo, je druhý řádek z příkazu výše zbytečný. Tahle metoda je občas cenná, protože na jednu stranu sice přesypává kvanta čísel, na stranu druhou však může i tak být dost rychlá. Druhé řešení, které vám předvedu, totiž trpí poměrně výžnými výkonostními problémy.

Řešení s poddotazem

Tohle řešení nepoužívá dočasnou tabulku, ale poddotaz. A to poddotaz korelační, tedy takový, kde se data z vnitřního dotazu vztahují k dotazu vnějšímu. Nejprve jej předvedu:

select zamestnanci.*, (select count(*) from zamestnanci as pocitadlo where pocitadlo.plat >=zamestnanci.plat) as poradi from zamestnanci order by plat desc;

a teď vysvětlím - vnořený poddotaz prostě vrátí počet všech zaměstnanců, kteří mají stejný nebo vyšší plat než aktuálně zpracovávaný zaměstnanec. Což znamená, že de facto vrátí počet zaměstnanců majících vyšší plat než zpracovávaný záznam. Jak už to na tom světě bývá, i tohle řešení má háček, a to ten, že když by měli dva pracovníci stejný plat, vrátí jim poddotaz stejné pořadí. Což je logické - v takovém případě totiž existuje "stejný počet kolegů, majících stejný či vyšší plat".

Jak z toho ven? Je tu jeden způsob - a to ten, že si "vypůjčíme" ještě nějaké další pole pro řazení. V našem případě bychom například mohli řadit jednak sestupně podle platu, a jednak jména podle abecedy. To všechno proto, abychom měli zajištěno pevné pořadí i v rámci skupiny se stejným platem. Dotaz, fungující dobře i pro záznamy s více lidmi se stejným platem by pak mohl vypadat takto (důležité pasáže jsem zvýraznil):

select zamestnanci.*, (select count(*) from zamestnanci as pocitadlo where pocitadlo.plat >zamestnanci.plat or (pocitadlo.plat=zamestnanci.plat and pocitadlo.jmeno<=zamestnanci.jmeno)) as poradi from zamestnanci order by plat desc, jmeno;

Když si poddotaz přečtete a zamyslíte se nad ním, je to opět logické. Vrací totiž:

  • Počet lidí majících vyšší plat než aktuální zaměstnanec, plus
  • Počet lidí majících sice stejný plat, ale příjmení, které je dříve v abecedě

Pochopitelně, poddotaz by nefungoval správně, kdyby řazení v hlavním dotazu bylo jiné.

Pozn.: Vnímavý čtenář může namítnout, že v reále lze mít dva lidi jak se stejným jménem, tak i se stejným platem. Ono se to ve skutečnosti většinou ještě řadí podle nějakého jedinečného identifikátoru řádku (například, podle automaticky číslovaného pole), takže tento problém nenastává.

Řešení se spojením

Pokud jste se rozhodli přepsat výše uvedený poddotaz na spojení, mám pro vás dobrou zprávu - jde to. Člověk musí pouze dát pozor na to, že v hlavním dotazu je pak nutné použít klauzuli GROUP BY, neb agregační funkce COUNT(*) musí počítat pouze s počty "předcházejících" zaměstnanců pro konkrétního pracovníka. Mohlo by to tedy dopadnout nějak takto:

select zamestnanci.*, count(*) from zamestnanci join zamestnanci as pocitadlo on pocitadlo.plat > zamestnanci.plat or (pocitadlo.plat = zamestnanci.plat and pocitadlo.jmeno <= zamestnanci.jmeno) group by zamestnanci.jmeno, zamestnanci.plat order by zamestnanci.plat desc, zamestnanci.jmeno;

Závěr

Jak vidíte, vracet jako součást dat i pořadová čísla řádků není až tak úplně jednoduché. Někteří programátoři proto volí jiný přístup - nechají data sestavit bez čísel řádků a ve volající aplikaci pak zpracovávají data po jednotlivých záznamech. Aplikace sama si vytvoří a spravuje jakýsi čítač, s nímž se pak manipuluje. Řešení, které jsem předvedl, však může být mnohem elegantnější, protože udržuje aplikační logiku v databázi a nemá ji roztříštěnu mezi databázi a aplikaci.

Co si vyberete záleží pochopitelně na konkrétní situaci. Pokud budete číslovat větší počet záznamů, udělejte si nějaké testy rychlosti - jednotlivé metody zde uvedené se mohou mít až řádově odlišný čas provádění!

Verze pro tisk

pridej.cz

 

DISKUZE

apl. logika v datovej vrstve 8.7.2005 10:22 ika
  |- Re: apl. logika v datovej vrstve 10.7.2005 07:57 Petr Zajíc
  L Re: apl. logika v datovej vrstve 13.7.2005 08:17 Pavel Stěhule
    L Re: apl. logika v datovej vrstve 21.7.2005 08:13 Petr Zajíc




Příspívat do diskuze mohou pouze registrovaní uživatelé.
> Vyhledávání software
> Vyhledávání článků

15.5.2017 23:50 /František Kučera

Máš rád svobodný software a hardware nebo se o nich chceš něco dozvědět? Zajímá tě DIY, CNC, SDR nebo morseovka? Přijď na sraz spolku OpenAlt, který se bude konat ve čtvrtek 18. května od 18:00 v Radegastovně Perón (Stroupežnického 20, Praha 5).


Přidat komentář

12.5.2017 16:42 /Honza Javorek
PyCon CZ, česká konference o programovacím jazyce Python, se po dvou úspěšných ročnících v Brně bude letos konat v Praze, a to 8. až 10. června. Na konferenci letos zavítá např. i Armin Ronacher, známý především jako autor frameworku Flask, šablon Jinja2/Twig, a dalších projektů. Těšit se můžete na přednášky o datové analytice, tvorbě webu, testování, tvorbě API, učení a mentorování programování, přednášky o rozvoji komunity, o použití Pythonu ve vědě nebo k ovládání nejrůznějších zařízení (MicroPython). Na vlastní prsty si můžete na workshopech vyzkoušet postavit Pythonem ovládaného robota, naučit se učit šestileté děti programovat, efektivně testovat nebo si v Pythonu pohrát s kartografickým materiálem. Kupujte lístky, dokud jsou.
Přidat komentář

2.5.2017 9:20 /Eva Rázgová
Putovní konference československé Drupal komunity "DrupalCamp Československo" se tentokrát koná 27. 5.2017 na VUT FIT v Brně. Můžete načerpat a vyměnit si zkušenosti z oblasti Drupalu 7 a 8, UX, SEO, managementu týmového vývoje, využití Dockeru pro Drupal a dalších. Vítáni jsou nováčci i experti. Akci pořádají Slovenská Drupal Asociácia a česká Asociace pro Drupal. Registrace na webu .
Přidat komentář

1.5.2017 20:31 /Pavel `Goldenfish' Kysilka
PR: 25.5.2017 proběhne v Praze konference na téma Firemní informační systémy. Hlavními tématy jsou: Informační systémy s vlastní inteligencí, efektivní práce s dokumenty, mobilní přístup k datům nebo využívání cloudu.
Přidat komentář

15.4.2017 15:20 /František Kučera
Máš rád svobodný software a hardware nebo se o nich chceš něco dozvědět? Zajímá tě IoT a radiokomunikace? Přijď na sraz spolku OpenAlt, který se bude konat ve středu 19. dubna od 18:30 v Šenkovně (Sokolská 60, Praha 2).
Přidat komentář

5.3.2017 19:12 /Redakce Linuxsoft.cz
PR: 23. března proběhne v Praze konferenci na téma Cloud computing v praxi. Hlavními tématy jsou: Nejžhavější trendy v oblasti cloudu a cloudových řešení, Moderní cloudové služby, Infrastruktura současných cloudů, Efektivní využití cloudu, Nástrahy cloudových řešení a jak se jim vyhnout.
Přidat komentář

27.2.2017 22:12 /František Kučera
Pozvánka na 137. sraz OpenAlt – Praha: Tentokrát jsme si pro vás připravili neobvyklou akci. Ve středu 1.3. v 17:30 nás přivítá sdružení CZ.NIC ve svých prostorách v Milešovské ulici číslo 5 na Praze 3, kde si pro nás připravili krátkou prezentaci jejich činnosti. Následně navštívíme jejich datacentrum pod Žižkovskou věží. Provedou nás prostory, které jsou běžnému smrtelníkovi nedostupné!
Po ukončení prohlídky se všchni odebereme do hostince U vodoucha, Jagelonská 21, Praha 3 pochutnat si na některém z vybraných piv či dát si něco na zub. Rezervaci máme od 19:30, heslo je OpenAlt.
Ale pozor! Do prostor datového centra máme omezený přístup, dostane se tam pouze 10 lidí! Takže kdo přijde dříve, ten má přednost, a občanky s sebou! Kdo nebude chtít na prohlídku datového centra, může se pomalu přesunout do hostince U vodoucha a u nepřeberné nabídky piv počkat na ostatní.
Přidat komentář

18.1.2017 0:49 /František Kučera
Členové a příznivci spolku OpenAlt se pravidelně schází v Praze a Brně. Fotky z pražských srazů za uplynulý rok si můžete prohlédnout na stránkách spolku. Příští sraz se koná už 19. ledna – tentokrát je tématem ergonomie ovládání počítače – tzn. klávesnice, myši a další zařízení. Také budete mít příležitost si prohlédnout pražský hackerspace Brmlab.
Přidat komentář

   Více ...   Přidat zprávičku

> Poslední diskuze

15.6.2017 9:34 / Ondřej Havlas
php,

10.6.2017 10:39 / Temple
sell home for cash

11.5.2017 23:32 / lelo
Re: Problém se správcem balíčků

11.5.2017 5:45 / davd mašek
Re: Problém se správcem balíčků

10.5.2017 22:54 / lelo
Re: Problém se správcem balíčků

Více ...

ISSN 1801-3805 | Provozovatel: Pavel Kysilka, IČ: 72868490 (2003-2017) | mail at linuxsoft dot cz | Design: www.megadesign.cz | Textová verze