Jak analyzovat soubor řádek po řádku s Python

Jedním z hlavních důvodů, proč lidé používají Python, je analýza a manipulace s textem. Pokud váš program potřebuje pracovat se souborem, je obvykle nejlepší číst v souboru jeden řádek najednou, z důvodu paměti a rychlosti zpracování. To se nejlépe provede pomocí smyčky while.

Tento kód bere první argument příkazového řádku jako název souboru, který má být zpracován. První řádek ji otevře a iniciuje objekt souboru „fileIN“. Druhý řádek pak přečte první řádek objektu souboru a přiřadí ji řetězcové proměnné "line". Smyčka while se provádí na základě stálosti "linky". Když se "řádek" změní, smyčka restartuje se. To pokračuje, dokud již nebudou čteny žádné další řádky souboru. Program pak odejde.

Takto čtený soubor program neuhýbá více dat, než je nastaveno ke zpracování. Zpracovává data, která vstupuje, rychleji a dává výstup postupně. Tímto způsobem je stopa paměti programu udržována nízká a rychlost zpracování počítače nezasáhne. To může být důležité, pokud píšete skript CGI, který může vidět, že několik stovek instancí se spustí současně.

instagram viewer

Příkaz může být jeden příkaz nebo blok příkazů. Všechny příkazy odsazené stejnou částkou se považují za součást stejného bloku kódu. Odsazení je, jak Python označuje skupiny příkazů.