LINUXSOFT.cz Přeskoč levou lištu
Uživatel: Heslo:  
   CZUKPL

> Python (10.) - Vstup a výstup

V dnešním díle se podíváme na to, jaké možnosti běžného (terminál, soubory) vstupu a výstupu nám Python nabízí.

2.3.2005 15:00 | Aleš Hakl | Články autora | přečteno 23798×

Již v předchozích dílech jsme zmínili příkaz print pro vypisování dat na standardní výstup, toto samozřejmě není jediná možnost výstupu. Podobně jsme též zmínili funkci raw_input načítající řádek od uživatele, také to samozřejmě není jediný prostředek vstupu dat, ačkoli pro jednoduché načítání řetězců od uživatele je tato funkce jistě jednou z nejvhodnějších.

Nezmínili jsme funkci input, jež je stejná jako funkce raw_input, navíc ovšem řetězec zadaný uživatelem vyhodnotí, jako kdyby byl výrazem v programu a vrátí výslednou hodnotu, v praxi se tato funkce v Pytonu ovšem příliš často nepoužívá.

Python, podobně jako unix obecně, celkem nerozlišuje, z čeho čteme a kam píšeme, pro programátora mezi souborem, terminálem či třeba síťovým spojením není velký rozdíl, všechny tyto případy jsou reprezentovány objektem s přibližně stejnými metodami, nazývejme takový objekt stream (proud). Samozřejmě stream implementuje pouze metody, které pro něj mají smysl. Například čtení ze standardního výstupu (většinou) smysl nemá.

Standardní vstup a výstup

Zpočátku můžeme za zajímavé považovat streamy reprezentující standardní vstup, výstup a chybový výstup. Tyto proudy nalezneme ve standardním modulu sys jako proměnné stdin, stdout a stderr.

Samozřejmě, že tyto proudy jsou proměnné jako každé jiné a je tedy možné změnit stream používaný pro vstup či výstup a tím dosáhnout nejrůznějších žádoucích efektů.

Soubory

Streamy také můžeme použít k přístupu k souborům, slouží k tomu funkce open, která je přímo součástí interpretu jazyka Python. Tato funkce má dva argumenty, jméno souboru a režim, ve kterém bude otevřen.

Režim je řetězec, jehož první znak určuje jestli soubor chceme číst ('r'), přepsat ('w') nebo zapisovat na jeho konec ('a'). Dále můžeme uvést znak '+' pro zápis i čtení zároveň, 'r+' nám tedy umožní soubor jak číst tak zapisovat a 'w+' totéž, s tím že bude nejdříve smazán původní obsah souboru. Méně vyspělé operační systémy též mohou vyžadovat znak 'b' indikující binární soubor, ten se zapisuje na druou pozici, za jeden ze znaků 'rwa'.

Pokud režim neuvedeme použije se výchozí hodnota 'r'.

Čtení ze streamu

  • read(počet bytů) - Přečte ze souboru daný počet bytů a vrátí je jako řetězec, pokud počet bytů nezadáme, přečte celý soubor. Je doufám zřejmé, že číst celý soubor najednou většinou není nejlepší řešení. Pokud funkce vrátí méně než udaný počet, dospěli jsme na konec souboru.
  • readline(počet byte) - Přečte řádku, maximálně však daný počet bytů, opět parametr nemusíme udat a metoda přečte řádku celou, libovoně dlouhou.
  • readlines() - Vrátí obsah souboru jako seznam řádek
  • xreadlines() - Vrátí objekt, který můžeme použít například v cyklu for pro zpracování všech řádek souboru, narozdíl od předchozí metody nenačítá celý soubor najednou, ale po částech, tak jak jsou potřeba další data.

Pokud tedy chceme přečíst soubor po jednotlivých řádcích a něco s nimi provést (což je dle mého názoru asi nejčastější operace, kterou chceme v unixu se souborem provádět), uděláme to například takto:

f = open('/etc/inittab','r')
i = 0 

for l in f.xreadlines():
    i = i + 1
    print i,l.rstrip()   # ořízneme bíle znaky na konci řádku

                         # (tj. minimálně znak nového řádku)
                         # a řádek očíslujeme.

Zápis do proudu

  • write(řetězec) - zapíše řetězec do souboru, v podstatě tak jak leží a běží.
  • writelines(seznam) - zapíše do souboru všechny řetězce v daném seznamu oddělené novým řádkem. Funguje to s ledasčím, co vzdáleně připomíná seznam, soubor tedy můžeme na obrazovku vypsat například takto:
    import sys
    
    sys.stdout.writelines(open('/etc/inittab','r').xreadlines())

Přesnou kopii souboru můžeme s využtím výše uvedených metod vytvořit nějak takto:

src = open('10.html','r')  # zdrojový soubor

dst = open('foo','w')      # cílový soubor

while True:
    buf = src.read(4096)   # čteme 4KiB najednou
    dst.write(buf)
    if len(buf) < 4096:
        break

Posun ve streamu

Aktuální pozici ve streamu můžeme, pokud to daný stream podporuje, měnit. Je zřejmé, že je nesmysl pokoušet se měnit pozici ve streamu reprezentujícím nějaké zařízení nebo síťové spojení, cestovat časem Python opravdu neumí ^_^.

  • tell() - vrátí aktuální pozici v souboru.
  • seek(offset, odkud) - nastaví novou pozici na offset od začátku souboru. Pokud uvedeme nepovinný parametr odkud počítá se nová pozice od začátku souboru (odkud = 0), aktuální pozice (1) nebo konce souboru (2). Zápis za konec souboru soubor automaticky zvětší.
  • truncate(délka) - zkrátí soubor na délka bytů, pokud parametr neuvedeme, zkrátí soubor na 0 bytů.

Ostatní metody

  • close() - uzavře soubor. Je vhodné tuto metodu zavolat pokud již se souborem nechceme dále pracovat.
  • fileno() - vrátí číslo (deskriptor) souboru používaný při komunikaci s operačním systémem.
  • flush() - Předá operačnímu systému dosud nezapsaná data. Tuto metodu je velmi vhodné zavolat u souborů otevřených pro čtení i zápis před čtení následujícím po zápisu.
  • isatty() - Vrátí True pokud stream reprezentuje terminál.

Atributy

Streamy také disponují několika atributy. Atribut closed má hodnotu True, pokud je stream uzavřen, name obsahuje jméno souboru nebo případně nějaký popis streamu, mode obsahuje řetězec určující režim (druhý parametr funkce open).

Stream ovšem nemusí vůbec být soubor (nebo něco, co se z pohledu rozhraní operačního systému chová jako soubor), ale může to být téměř libovolná třída. Ve standardní knihovně Pythonu tudíž nalezneme nejrůznější třídy různým způsobem obalující jiné streamy (například provádějící komprimaci, převod kódování...) či jenom prostě implementující rozhraní streamu, protože autoři předpokládali, že je vhodné, aby daná třída vypadala jako stream.

Dnešní díl tedy zakončíme souhrnnou ukázkou. Napíšeme program, který nám umožní na základě jednoho textového souboru zkopírovat konkrétní byte z jednoho souboru do druhého (k čemu to může být dobré, nechám na představivosti čtenáře).

Vstupem bude textový soubor se seznamem offsetů, vstupní binární soubor a výstupem bude jeden soubor obsahující dané byty.

#!/usr/bin/env python
# -*- coding: utf-8; -*-

import sys

src_name = raw_input("Jméno vstupního souboru?")
txt_name = raw_input("Jméno souboru se seznamem offsetů?")
dst_name = raw_input("Jméno výstupního souboru?")

txt = open(txt_name,'r')
src = open(src_name,'rb') 
dst = open(dst_name,'wb')


for off_s in txt.xreadlines():
    off = long(off_s)  # Převedeme na číslo

    src.seek(off)      # nastavíme pozici
    byte = src.read(1) # přečteme 1 byte


    if byte=='':       # případně upozorníme uživatele na možnou chybu
        sys.stderr.write("Offset za koncem vstupního souboru")

    dst.write(byte)


# uklidíme po sobě
src.close() 
dst.close() 
txt.close()

Doufám, že vás dnešní poněkud vykonstruovaná ukázka neodradila a sejdeme se u dalšího dílu, tentokrát se podíváme na řetězce poněkud podrobněji.

Verze pro tisk

pridej.cz

 

DISKUZE

Zápis průchodu souborem lze zjednodušit 7.6.2005 09:59 Petr Přikryl




Příspívat do diskuze mohou pouze registrovaní uživatelé.
> Vyhledávání software
> Vyhledávání článků

12.8.2018 16:58 /František Kučera
Srpnový pražský sraz spolku OpenAlt se koná ve čtvrtek – 16. 8. 2018 od 19:00 v Kavárně Ideál (Sázavská 30, Praha), kde máme rezervovaný salonek. Tentokrát jsou tématem srazu databáze prezentaci svého projektu si pro nás připravil Standa Dzik. Dále bude prostor, abychom probrali nápady na využití IoT a sítě The Things Network, případně další témata.
Přidat komentář

16.7.2018 1:05 /František Kučera
Červencový pražský sraz spolku OpenAlt se koná již tento čtvrtek – 19. 7. 2018 od 18:00 v Kavárně Ideál (Sázavská 30, Praha), kde máme rezervovaný salonek. Tentokrát bude přednáška na téma: automatizační nástroj Ansible, kterou si připravil Martin Vicián.
Přidat komentář

18.6.2018 0:43 /František Kučera
Červnový pražský sraz spolku OpenAlt se koná již tento čtvrtek – 21. 6. 2018 od 18:00 v Kavárně Ideál (Sázavská 30, Praha), kde máme rezervovaný salonek. Tentokrát na téma: F-Droid, aneb svobodný software do vašeho mobilu. Kromě toho budou k vidění i vývojové desky HiFive1 se svobodným/otevřeným čipem RISC-V.
Přidat komentář

23.5.2018 20:55 /Ondřej Čečák
Od pátku 25.5. proběhne na Fakultě informačních technologií ČVUT v Praze openSUSE Conference. Můžete se těšit na spostu zajímavých přednášek, workshopů a také na Release Party nového openSUSE leap 15.0. V na stejném místě proběhne v sobotu 26.5. i seminář o bezpečnosti CryptoFest.
Přidat komentář

20.5.2018 17:45 /Redakce Linuxsoft.cz
Ve čtvrtek 31. května 2018 připravuje webový magazín BusinessIT ve spolupráci s Best Online Média s.r.o. pátý ročník odborné konference Firemní informační systémy 2018. Akce proběhne v kongresovém centru Vavruška (palác Charitas), Karlovo náměstí 5, Praha 2 (u metra Karlovo náměstí) od 9:00 hod. dopoledne do cca 15 hod. odpoledne. Konference je zaměřena na efektivní využití firemních informačních systémů a na to, jak plně využít jejich potenciál. Podrobnější informace na webových stránkách konfrence.
Přidat komentář

14.5.2018 7:28 /František Kučera
Květnový pražský sraz spolku OpenAlt se koná již tento čtvrtek – 17. 5. 2018 od 18:00 v Kavárně Ideál (Sázavská 30, Praha), kde máme rezervovaný salonek. Tentokrát na téma: Audio – zvuk v GNU/Linuxu.
Přidat komentář

7.5.2018 16:20 /František Kučera
Na stránkách spolku OpenAlt vyšla fotoreportáž Pražské srazy 2017 dokumentující srazy za uplynulý rok. Květnový pražský sraz na téma audio se bude konat 17. 5. 2018 (místo a čas ještě upřesníme).
Přidat komentář

17.4.2018 0:46 /František Kučera
Dubnový pražský sraz spolku OpenAlt se koná již tento čtvrtek – 19. 4. 2018 od 18:00 v Kavárně Ideál (Sázavská 30, Praha), kde máme rezervovaný salonek. Tématem tohoto srazu bude OpenStreetMap (OSM) aneb svobodné mapy.
Přidat komentář

   Více ...   Přidat zprávičku

> Poslední diskuze

20.2.2018 18:48 / Ivan Majer
portal

20.2.2018 15:57 / Jan Havel
Jak využíváte služby cloudu v podnikání?

16.1.2018 1:08 / Ivan Pittner
verejna ip od o2 ubuntu

15.1.2018 17:26 / Mira Harvalik
Re: Jak udělat HTML/Javascript swiping gallery do mobilu?

30.12.2017 20:16 / Michal Knoll
odmocnina

Více ...

ISSN 1801-3805 | Provozovatel: Pavel Kysilka, IČ: 72868490 (2003-2018) | mail at linuxsoft dot cz | Design: www.megadesign.cz | Textová verze