LINUXSOFT.cz Přeskoč levou lištu
Uživatel: Heslo:  
   CZUKPL

> Perl (66) - Projekt - výběr zápasů a podrobnosti

Perl Zdokonalíme náš modul o funkci, která ze všech dostupných zápasů vybere jen ty, které vyhovují uživatelem zadaným kritériím. Mimoto se podíváme na další extrakci dat z webu - tentokrát si opatříme detailní informace o zvoleném zápasu.

21.2.2008 07:00 | Jiří Václavík | Články autora | přečteno 13048×

Výběr zápasů podle kritérií

Nyní se zaměříme na výběr zápasů podle kritérií. Opět si na to vytvoříme zvláštní metodu, která bude volána uživatelem. Jako parametr bude přijímat odkaz na seznam zápasů vrácených metodou ziskej_zapasy_dane_ligy a odkaz na pole kritérií. Metoda vrátí seznam zápasů, jež vyhovují daným kritériím.

sub najdi_zapas_podle_kriterii {
    my($self, $p_zapasy, $p_kriteria) = @_;
    my @vyhovujici;

    #tělo metody

    return @vyhovujici;
}

Pokud kritéria zadána nebudou, vrátíme tentýž seznam, který jsme získali.

return @$p_zapasy if scalar @$p_kriteria == 0;

Nyní se dostáváme k jednomu zajímavému místu. Budeme chtít zajistit, aby byl každý zápas porovnán se všemi kritérii (podmínkami). Co to ale je všemi? To může být jedna podmínka, dvě podmínky, nebo jakýkoliv přirozený počet podmínek. A otázkou je, jak do testu podmínky vepsat libovolný počet kritérií.

Zdánlivě je to těžko řešitelný problém, ale existuje řešení. Tím je pěkná aplikace nástroje eval.

Vytvoříme tedy podmínku jako řetězec a poté v cyklu tento řetězec porovnáme postupně se všemi vstupními zápasy. Pokud zápas vyhovuje kritériím, přidáme ho k vyhovujícím zápasům.

    my $eval = 'if(/'.join("/i and /", @$p_kriteria).'/i){push @vyhovujici, $zapas;}';
    foreach my $zapas (@$p_zapasy){
       $_ = $zapas->{"tym1"}." ".$zapas->{"tym2"};
       eval $eval;
    }

Detail zápasu

Další veřejnou metodou bude prenos, který bude poskytovat informace o událostech v jednotlivých zápasech. Abychom mohli jednoznačně určit, odkud informace o zápasu získat, potřebujeme znát dva údaje. Za prvé soutěž a za druhé ID zápasu. Samotné ID by na to nestačilo.

Co se týká výstupu tak tam to bude složitější. Budeme muset vracet nějakou složitou datovou strukturu. Je třeba, aby obsahovala veškeré informace o událostech a navíc probíhající minutu. Pouvažujme však nad uživatelem této metody. Pro online přenos je třeba vrátit ještě informaci o tom, zda se zápas hraje. Proto vrátíme ještě hodnotu, jež určuje, zda zápas stále probíhá, zda již skončil nebo zda ještě nezačal. Tato informace se sice dá vyvodit z probíhající minuty, avšak později uvidíme, že její uvedení má své opodstatnění. Program live se podle ní zařídí a spustí buď online přenos nebo jen zobrazí výsledky.

A nyní se již pusťme do detailu zápasu.

sub prenos {
    my($self, $liga, $odkaz_idzapasu) = @_;
    my($probihajici_minuta, $hraje_se);
    my @udalost;

    #tělo metody

    return ($probihajici_minuta, $hraje_se, \@udalost);
}

Stažení dat

Naším prvním úkolem je stáhnout zdrojový kód. URL ke zdrojovým kódům zápasů je zde: http://www.livescore.com/default.dll/Game?comp=soutěž&game=id_zápasu. Soutěž je zde přitom hodnota v prvku odkaz_liga, nikoliv liga.

Použijeme na to opět metodu ziskej_zdrojovy_kod, kterou ale budeme muset upravit. Pokud dostane druhý argument - číslo zápasu - upravíme její chování. Bude stahovat z uvedeného URL a je tedy třeba nastavit proměnnou $url odpovídajícím způsobem.

    my($self, $liga, $odkaz_idzapasu) = @_;

    ...

    if ($odkaz_idzapasu){
        $url = "http://www.livescore.com/default.dll/Game?comp=$liga&game=$odkaz_idzapasu";
    }else{
        $url = "http://www.livescore.com/default.dll?page=$liga";
    }

Nyní opět přeskočme do metody prenos. Díky úpravám ve funkci ziskej_zdrojovy_kod nyní můžeme napsat následující. Podotkněme ještě, že tato funkce je stále kompatibilní s posledně použitými voláními.

my $zdroj = $self->ziskej_zdrojovy_kod($liga, $odkaz_idzapasu);

Extrakce dat a získání podrobných informací o zápasu

Na základě tohoto zdrojového kódu musíme opět získat extrakcí několik údajů. Tyto údaje je pak třeba ještě rozdělit na dva druhy - údaje obecné a údaje o události. Údaje obecné jsou následující.

  • hraje se? (na obrázku označení červenou barvou)
  • probíhající minuta (modrá)
  • názvy týmů - s každou událostí bude třeba posílat jméno týmu, kterého se událost týká, proto si oba názvy uložíme (žlutá)

údaje o stavu zápasu

A co se týká událostí, tak budeme sledovat toto:

  • typ události - tedy gól, žlutá karta, červená karta (na obrázku označení červenou barvou)
  • jméno hráče, kterého se událost týká (modrá)
  • minuta události (žlutá)
  • nové skóre (fialová)
  • tým, kterého se událost týká (hnědá; určíme podle toho, zda je událost vlevo nebo vpravo)

údaje o událostech

Nejprve vyextrahujeme ze zdrojového kódu obecné údaje.

    my($hraje_se, $probihajici_minuta, $domaci, $hoste) = ($zdroj =~
        /<font[^>]*><b>(?:<(i)mg[^>]*>)?\s?([\w\:.]*)'?<\/b><\/font><\/td><t[^>]*>([^[]*)
        \s\[[^\]]*\]\s([^<]*)<\/td>/);
    $hraje_se = ($hraje_se ? 1 : 0);

Nyní přichází složitější část. V cyklu musíme zpracovávat jednotlivé události. To znamená, že regulární výraz umístíme do podmínky cyklu a uvnitř něj data postupně zpracujeme do pole hashů @udalosti. Budeme zpracovávat řádek po řádku - tedy od <tr> k </tr>. Nicméně bude to o to složitější, že na každém řádku mohou být i dvě události - jedna pro hostující a jedna pro domácí tým.

Na extrakci minuty události, skóre a jména hráče není nic nového. Typ události získáme z názvu obrázku. Začátek jeho názvu totiž je jedním z řetězců yellow, red, yellow-red a goal.

Zde je celý regulární výraz. Pomocí komentářů v něm by měl být jasnější smysl jednotlivých jeho úseků a metoda konstrukce.

    while ($zdroj =~
                 /
                 <tr[^>]*><td[^>]*>
                 (\d+)'                       #minuta události
                 <\/td><td[^>]*><b>
                 (?:\[(\d+)\s?-\s?(\d+)\])?   #nové skóre
                 <\/b><\/td>

                 #událost domácích - buď je nebo není
                 <td[^>]*>
                 (?:([^<]*)\s<img\ssrc="http:\/\/www1.livescore.com\/img\/([\w-]+)\.gif"[^>]*>)?
                 <\/td>   #typ události a hráč


                 #událost hostů - buď je nebo není
                 <td[^>]*>
                 (?:([^<]*)\s<img\ssrc="http:\/\/www1.livescore.com\/img\/([\w-]+)\.gif"[^>]*>)?
                 <\/td>   #typ události a hráč

                 <td\swidth=4><\/td><\/tr><tr><td\scolspan=\"4\"\swidth=\"400\"\s
                 height=\"1\"><\/td><\/tr>
                 /gx){
    }

Dokončení metody prenos

Nyní nám už zbývá pouze naplnit prvek pole @udalosti získanými hodnotami. Způsob zapisování dat musíme rozdělit hned na tři možnosti - buď máme událost hostů, událost domácích nebo události obě.

Ještě uveďme, že jméno hráče nemusí být v případě gólů vždy uvedeno. Proto, pokud jméno skutečně nebude, nahradíme ho neznámým střelcem.

Pokud se tedy týká událost domácích, zapíšeme to takto.

        if($4){
            $tym = $domaci;
            $strelec = ($4 ? $4 : "neznamy strelec");

            $udalost[$i++] = {
                "id_udalosti" => $i-1,
                "udalost" => $5,
                "minuta" => $1,
                "hrac" => $strelec,
                "tym" => $tym,
                "skore1" => $2,
                "skore2" => $3
            }
        }

A jde-li o hosty použijeme analogický způsob.

        if($6){
            $tym = $hoste;
            $strelec = ($6 ? $6 : "neznamy strelec");

            $udalost[$i++] = {
                "id_udalosti" => $i-1,
                "udalost" => $7,
                "minuta" => $1,
                "hrac" => $strelec,
                "tym" => $tym,
                "skore1" => $2,
                "skore2" => $3
            }
        }

Půjde-li o oba týmy, program sám projde obě podmínky.

Verze pro tisk

pridej.cz

 

DISKUZE

Mezi odkazy chybí předešlý díl 29.2.2008 09:52 Martin Štrobl




Příspívat do diskuze mohou pouze registrovaní uživatelé.
> Vyhledávání software
> Vyhledávání článků

14.11.2017 16:56 /František Kučera

Máš rád svobodný software a hardware nebo se o nich chceš něco dozvědět? Zajímá tě DIY, CNC, SDR nebo morseovka? Přijď na sraz spolku OpenAlt – tradičně první čtvrtek před třetím pátkem v měsíci: 16. listopadu od 18:00 v Radegastovně Perón (Stroupežnického 20, Praha 5).


Přidat komentář

12.11.2017 11:06 /Redakce Linuxsoft.cz
PR: 4. ročník odborné IT konference na téma Datová centra pro business proběhne již ve čtvrtek 23. listopadu 2017 v konferenčním centru Vavruška, v paláci Charitas, Karlovo náměstí 5, Praha 2 (u metra Karlovo náměstí) od 9:00. Konference o návrhu, budování, správě a efektivním využívání datových center nabídne odpovědi na aktuální a často řešené otázky, např Jaké jsou aktuální trendy v oblasti datových center a jak je využít pro vlastní prospěch? Jak zajistit pro firmu či jinou organizaci odpovídající služby datových center? Podle jakých kritérií vybrat dodavatele služeb? Jak volit součásti infrastruktury při budování či rozšiřování vlastního datového centra? Jak efektivně spravovat datové centrum? Jak eliminovat možná rizika? apod.
Přidat komentář

13.9.2017 8:00 /František Kučera
Máš rád svobodný software a hardware nebo se o nich chceš něco dozvědět? Zajímá tě DIY, CNC, SDR nebo morseovka? Přijď na sraz spolku OpenAlt – tentokrát netradičně v pondělí: 18. září od 18:00 v Radegastovně Perón (Stroupežnického 20, Praha 5).
Přidat komentář

3.9.2017 20:45 /Redakce Linuxsoft.cz
PR: Dne 21. září 2017 proběhne v Praze konference "Mobilní řešení pro business". Hlavní tématy konference budou: nejnovější trendy v oblasti mobilních řešení pro firmy, efektivní využití mobilních zařízení, bezpečnostní rizika a řešení pro jejich omezení, správa mobilních zařízení ve firmách a další.
Přidat komentář

15.5.2017 23:50 /František Kučera
Máš rád svobodný software a hardware nebo se o nich chceš něco dozvědět? Zajímá tě DIY, CNC, SDR nebo morseovka? Přijď na sraz spolku OpenAlt, který se bude konat ve čtvrtek 18. května od 18:00 v Radegastovně Perón (Stroupežnického 20, Praha 5).
Přidat komentář

12.5.2017 16:42 /Honza Javorek
PyCon CZ, česká konference o programovacím jazyce Python, se po dvou úspěšných ročnících v Brně bude letos konat v Praze, a to 8. až 10. června. Na konferenci letos zavítá např. i Armin Ronacher, známý především jako autor frameworku Flask, šablon Jinja2/Twig, a dalších projektů. Těšit se můžete na přednášky o datové analytice, tvorbě webu, testování, tvorbě API, učení a mentorování programování, přednášky o rozvoji komunity, o použití Pythonu ve vědě nebo k ovládání nejrůznějších zařízení (MicroPython). Na vlastní prsty si můžete na workshopech vyzkoušet postavit Pythonem ovládaného robota, naučit se učit šestileté děti programovat, efektivně testovat nebo si v Pythonu pohrát s kartografickým materiálem. Kupujte lístky, dokud jsou.
Přidat komentář

2.5.2017 9:20 /Eva Rázgová
Putovní konference československé Drupal komunity "DrupalCamp Československo" se tentokrát koná 27. 5.2017 na VUT FIT v Brně. Můžete načerpat a vyměnit si zkušenosti z oblasti Drupalu 7 a 8, UX, SEO, managementu týmového vývoje, využití Dockeru pro Drupal a dalších. Vítáni jsou nováčci i experti. Akci pořádají Slovenská Drupal Asociácia a česká Asociace pro Drupal. Registrace na webu .
Přidat komentář

1.5.2017 20:31 /Pavel `Goldenfish' Kysilka
PR: 25.5.2017 proběhne v Praze konference na téma Firemní informační systémy. Hlavními tématy jsou: Informační systémy s vlastní inteligencí, efektivní práce s dokumenty, mobilní přístup k datům nebo využívání cloudu.
Přidat komentář

   Více ...   Přidat zprávičku

> Poslední diskuze

18.9.2017 14:37 / Rojas
high security vault

15.9.2017 7:33 / Wilson
new zealand childcare jobs

31.8.2017 12:11 / Jaromir Obr
Re: ukůládání dat ze souboru

30.7.2017 11:12 / Jaromir Obr
Národní znaky

27.7.2017 12:24 / Jaromir Obr
Cteni/zapis

Více ...

ISSN 1801-3805 | Provozovatel: Pavel Kysilka, IČ: 72868490 (2003-2017) | mail at linuxsoft dot cz | Design: www.megadesign.cz | Textová verze