LINUXSOFT.cz Přeskoč levou lištu
Uživatel: Heslo:  
   CZUKPL

> Perl (113) - Práce s archivy

Perl Budeme se věnovat práci s archivy, zejména pak rozbalování a zabalování. Zajímat nás budou nejrozšířenější formáty tar, zip a rar.

12.7.2010 00:00 | Jiří Václavík | Články autora | přečteno 8261×

Podívejme na to, jak manipulovat s TAR, ZIP a RAR v Perlu.

Budeme používat zejména modul Archive::Tar, jelikož tento typ archivu je v linuxovém světě asi nejrozšířenější.

Archive::Tar je sice jako modul pomalý a občas náročný na paměť, ale díky implementaci pomocí perlu je snadno přenositelný.

Vytvoření objektu pro manipulaci s archivy

Pro jakoukoliv manipulaci s archivy je třeba vždy vytvořit Tar objekt. To se dělá standardní cestou metodou new.

$tar = Archive::Tar->new("priklad.tar");

Je-li uvedeno jméno archivu jako parametr, pak se z něj provedením tohoto příkazu se do operační paměti načte seznam souborů. S těmito soubory tak můžeme dále pracovat.

Pro vymazání seznamu souborů z paměti lze využít metodu clear a pro znovunačtení metody read.

Přidávání se provádí metodou add_files a přejmenování pomocí rename.

Kontrola obsahu archivu

Pomocí metody contains_file lze ověřit, zda archiv obsahuje zadaný soubor.

$tar->contains_file("index.html");

Chceme-li zkontrolovat celý obsah, pak oceníme spíše funkci list_files, která vrátí seznam názvů všech souborů.

Pokud se nechceme obtěžovat s vytvářením objektů, lze pro získání seznamu souborů v archivu archiv.tar zadat také následující.

Archive::Tar->list_archive("archiv.tar");

Rozbalování

Metoda read slouží k načtení komprimovaného souboru do paměti. Jejími argumenty jsou jméno komprimovaného souboru a jako třetí parametr odkaz na hash s pevně určenou strukturou, který ovlivní, kolik a jaké soubory mají být z vybaleny z archivu.

Návratová hodnota funkce read je pole obsahující názvy rozbalených souborů.

Po volání read máme obsah k rozbalení načten v paměti. Samotné rozbalení provede jedna z metod extract nebo extract_file.

Podívejme se na možné klíče hashe parametrů ve volání metody read.

KlíčVýznam
filterpomocí regulárního výrazu určí, vybere jen některé soubory
extractnastavíme-li hodnotu na 1, pak se automaticky zavolá metoda extract (a archiv bude rozbalen)
limitomezí počet rozbalovaných souborů na uvedené množství

Chceme-li rozbalit soubor priklad.tar, pak tedy dle výše uvedeného napíšeme následující kód.

use Archive::Tar;
my $tar = Archive::Tar->new;
$tar->read("priklad.tar");
$tar->extract();

Uvedeme-li parametr extract s pravdivou hodnotou, pak lze program zredukovat o poslední řádek.

use Archive::Tar;
my $tar = Archive::Tar->new;
$tar->read("priklad.tar", "", {"extract"=>1});

Pro rozbalení pouze souborů s příponou html použijeme klíč filter.

$tar->read("priklad.tar", "", {"extract"=>1, "filter"=>'.*html\$'});

Pro vybalení jednoho souboru zde máme metodu extract_file. Zde můžeme jako druhý parametr zadat, kam se má vybalený soubor přesunout.

Pokud nám jde pouze o rozbalení běžného archivu, pak jistě oceníme metodu třídy extract_archive. Ta funguje následovně.

Archive::Tar->extract_archive("priklad.tar");

Důkladnější výběr rozbalovaných souborů

Soubor rozbalený pomocí Archive::Tar se stává objektem typu Archive::Tar::File. To nám přináší zejména možnost filtrovat soubory podle dalších kritérií.

Uveďme si některá kritéria v tabulce.

KritériumVýznam
namejméno souboru
sizevelikost souboru v bajtech
typetyp souboru; Archive::Tar pro tento účel exportuje konstanty FILE, HARDLINK, SYMLINK, CHARDEV, BLOCKDEV, DIR, FIFO, SOCKET
mktimečas poslední modifikace
modemód
uid, gid, uname, gnameuživatel, skupina vlastnící soubor

Pak lze provádět takové věci jako například rozbalení souborů, jejichž velikost nepřesahuje 1000 bajtů. To by se provedlo takto.

$tar->extract(grep {$_->size < 1000 } $tar->get_files);

Taktéž lze rozbalovat podle obsahu souboru. Existuje metoda get_content, jež vrací obsah souboru. Pro rozbalení pouze těch souborů, které obsahují slovo linuxsoft provedeme následující příkaz.

$tar->extract(grep {$_->get_content =~ /linuxsoft/i} $tar->get_files);

Existují další zajímavé metody pro objekty typu Archive::Tar::File, o nichž se lze dočíst v dokumentaci.

Zabalování

Do tvořeného archivu se vždy vloží soubory, které jsou aktuálně v paměti. Ovšem jak přidat další soubory? K tomu máme metodu add_files, které předáme seznam souborů.

Přidání souboru tar.pl do našeho virtuálního seznamu tak provedeme následujícím voláním.

$tar->add_files("tar.pl");

Archivy se zabalují metodou write. Musíme vždy uvést co zabalit a jak to zabalit.

Prvním argumentem určujeme soubor, kam se archiv zapíše. Druhým je pro gzip úroveň komprese od 1 nebo 9 nebo pro bzip2 hodnota COMPRESS_BZIP.

Pro vytvoření nového archivu ze souborů v paměti lze užít například následující příkaz.

$tar->write("novy_archiv.tgz", 9);

Rychlejší cesta pro vytvoření archivu vede přes metodu třídy. Aniž bychom vytvářeli objekt, můžeme volat metodu create_archive. Té předáme požadovaný název výsledného archivu, typ komprese a seznam souborů, které chceme zabalit. Na ukázku přiložme tento příkaz.

Archive::Tar->create_archive( "vysledek.tgz", COMPRESS_GZIP, "tar.pl", "formular.html");

Práce se ZIP archivy

Myšlenka u práce se ZIP archivy je podobná jako u TAR archivů a proto se v rychlosti podívejme na základní operace.

Opět je třeba na začátku načíst archiv, který budeme rozbalovat. To provedeme pomocí metody new.

use Archive::Zip;
my $zip = Archive::Zip->new("archiv.zip");

Poznamenejme, že i zde je k dispozici metoda read, kterou lze přidávat nové soubory z archivů.

Seznam souborů z archivu archiv.zip nyní máme k dispozici. Pro seznam jmen souborů z tohoto archivu stačí zavolat metodu memberNames.

print $zip->memberNames;

Rozbalení proběhne po zavolání metody extractMember. Jako parametr uvedeme seznam souborů, které se mají rozbalit.

$zip->extractMember("titulky.sub");

Se seznamem souborů můžeme volně manipulovat. Pro odstranění některého souboru použijeme metodu removeMember.

$zip->removeMember("nepotrebny_soubor");

Naopak pro přidání souboru využijeme metodu addFile. Do nově tvořeného archivu lze nový soubor přidat pod změněným jménem.

$zip->addFile("data", "nove_jmeno")

Máme-li seznam souborů připraven, můžeme je zabalit.

$zip->writeToFileNamed("vysledek.zip");

Možností Archive::Zip je více. Pokročilejší záležitosti lze nalézt v dokumentaci.

Práce s RAR archivy

Pro rozbalení RAR archivu lze použít následující sekvenci příkazů.

use Archive::Rar;
$rar = Archive::Rar->new(-archive => "archiv.rar");
$rar->List;
$rar->Extract;

Další moduly

Existuje univerzální modul Archive::Extract, který dokáže rozbalit soubory různých typů. Jeho použití je následující.

use Archive::Extract;
$extract = Archive::Extract->new(archive => "priklad.tar");
$extract->extract;

Naopak dalším modulem zaměřeným na vytváření archivů je Archive::Builder.

Mimo uvedené existuje řada dalších modulů tvaru Archive::.

Verze pro tisk

pridej.cz

 

DISKUZE

Nejsou žádné diskuzní příspěvky u dané položky.



Příspívat do diskuze mohou pouze registrovaní uživatelé.
> Vyhledávání software
> Vyhledávání článků

26.4.2015 6:26 /MaReK Olšavský
Vyšel Debian 8.0 „Jessie“, označený jako LTS, tj. s 5 letou podporou. Podporuje 10 hlavních architektur, včetně Power (kterou většina hlavních distribucí již zavrhla), má přepracovánu podporu UEFI a také přešla na Systemd (sysvinit je alternativně k dispozici).
Přidat komentář

24.4.2015 9:31 /MaReK Olšavský
Nastal další „Den U“, neboli vydání aktuálních verze Ubuntu 15.04 i „spinů“ (Kubuntu, Xubuntu, Ubuntu MATE 15.04 a dalších). Jádro je řady 3.19, Upstart byl nahrazen moderním systemd (alternativně lze Upstart využít).
Přidat komentář

23.4.2015 8:33 /MaReK Olšavský
Lukáš Jelínek ohlásil vydání GCC 5.1, již s podporou C++11 (kompletní i v stdlibc) a C++14 (na front-endu). Mezi dalšími novinkami je i podpora OpenMP 4.0, experimentální GCC JIT, nebo podporu OpenACC.
Přidat komentář

19.4.2015 15:55 /MaReK Olšavský
Možná trochu neuvěřitelné je ohlášení GNU Hurd 0.6 a mikrojádra Mach 1.5. GNU Hurd byl nadějný systém Un*xového typu od FSF, s mikrojádrem (GNU/Linux používá jádro monolitické), avšak je zcela ve stínu Linuxu a BSD.
Přidat komentář

16.4.2015 21:49 /Ondřej Čečák
CryptoFest, seminář zaměřený na zabezpečení dat pomocí šifrování, a RetroFest, jednodenní výlet do minulosti hardware a software, se budou letos konat o víkendu 6. a 7. června na pražském Strahově. Stále můžete hlasovat o programu, případně se přihlásit se svojí přednáškou!
Přidat komentář

16.4.2015 7:55 /MaReK Olšavský
Programujete-li v Pythonu a potřebuje pracovat s Excelovskými soubory, mohlo by vás potěšit vydání XLWT 1.0.0, z balíku Python Excel), které je pro Python 3 a mimo jiné začíná obsahovat i podporu pro unit testy. Podporovanými typy souborů jsou formáty Excel 95–2003.
Přidat komentář

4.3.2015 9:04 /Marek Pszczolka
Obchod LinuxMarket získal díky spokojenosti ověřených zákazníků prestižní certifikát Ověřeno zákazníky. Recenzi na tento obchod mohou psát pouze ověření zákazníci - tím máte jistotu pravdivosti recenzí.Hodnocení lze učinit vyplněním dotazníku spokojenosti, který zákazníkům přijde po nákupu. http://obchody.heureka.cz/linuxsoft-cz-linuxmarket/recenze/
Přidat komentář

3.3.2015 7:15 /MaReK Olšavský
Další kus bývalé Motoroly, Freescale, bude mít nového majitele, jímž se stane nizozemská NXP. Motorola se podílela na PowerPC, ale ještě dříve vyrobila legendární řadu mikroprocesorů 68 0x0, které jsme měli v Amigách, Atari ST, Applech, nebo Sinclairu QL, či prvních stanicích SUN Microsystems.
Přidat komentář

   Více ...   Přidat zprávičku

> Poslední diskuze

3.3.2015 22:05 / MaReK Olšavský
Re: Presmerovanie na WEB server v LAN

3.3.2015 6:54 / MaReK Olšavský
Recenze + instalace

2.2.2015 6:40 / MaReK Olšavský
Re: Churchill

30.1.2015 13:16 / Petr Ježek
Churchill

27.1.2015 12:58 / Ladislav Kulatý
Re: Mazání adřářů v linuxu pro IP kamery

Více ...

ISSN 1801-3805 | Provozovatel: Pavel Kysilka, IČ: 72868490 (2003-2015) | mail at linuxsoft dot cz | Design: www.megadesign.cz | Textová verze | zákony online