Programovanie (1) v C/C++
1-INF-127, ZS 2024/25

Úvod · Pravidlá · Prednášky · Softvér · Testovač
· Kontaktujte nás pomocou e-mailovej adresy E-prg.png (bude odpovedať ten z nás, kto má príslušnú otázku na starosti alebo kto má práve čas).
· Prosíme študentov, aby si pravidelne čítali e-maily na @uniba.sk adrese alebo aby si tieto emaily preposielali na adresu, ktorú pravidelne čítajú.


Prednáška 19: Rozdiel medzi revíziami

Z Programovanie
Skočit na navigaci Skočit na vyhledávání
 
(28 medziľahlých úprav od 2 ďalších používateľov nie je zobrazených)
Riadok 1: Riadok 1:
 
== Oznamy ==
 
== Oznamy ==
* Zajtrajšia rozcvička bude o vyfarbovaní
 
* Tretiu domácu úlohu treba odovzdať do budúceho pondelka 5.12. 22:00.
 
* Príďte v piatok na cvičenia, ak potrebujete pomôcť s DÚ alebo s príkladmi z cvičení.
 
* Tento týždeň a budúci pondelok ešte prednášky v normálnom režime
 
* Budúcu stredu 7.12. v prvej polovici prednášky informácie k skúške a rady k skúškovému všeobecne, potom doberieme posledné učivo
 
* Posledný týždeň semestra v pondelok 12.12. nepovinná prednáška o nepreberaných črtách jazykov C a C++, v stredu 14.12. cez prednášku semestrálny test
 
* Cvičenia bežia normálne každý utorok, piatkové cvičenia už iba 2x
 
  
Semestrálny test
+
Prednášky
* Treba získať aspoň 50% bodov
+
* Tento týždeň a budúci pondelok ešte prednášky v normálnom režime.
* Opravný termín v januári
+
* Budúcu stredu 11.12. v prvej polovici prednášky informácie k skúške a rady k skúškovému všeobecne, potom doberieme posledné povinné učivo.
* Môžete si priniesť ťahák v rozsahu 1 listu A4
+
* Posledný týždeň semestra v pondelok 16.12. nepovinná prednáška o nepreberaných črtách jazykov C a C++, v stredu 18.12. prednáška pravdepodobne nebude.
* Na semestrálnom teste budú podobné typy príkladov, aké poznáte z teoretických cvičení, napríklad napíšte funkciu, ktorá robí zadanú činnosť, doplňte chýbajúce časti funkcie, zistite, čo funkcia robí.
 
* Vyskytnú sa ale aj príklady, kde je úlohou napísať, ako bude na nejakom vstupe fungovať algoritmus alebo dátová štruktúra z prednášky. Ukážky takýchto príkladov nájdete na stránke [[Zimný semester, semestrálny test]]
 
  
Termíny skúšok
+
Cvičenia a úlohy
* Piatok 16.12. 13:10 v H6 a H3
+
* Cvičenia bežia normálne každý utorok, piatkové cvičenia už iba 2x.
* Pondelok 9.1. 13:00 v H6 a H3
+
* Zajtrajšia rozcvička bude na papieri, môžete si priniesť ťahák, učivo po prednášku 17.
* Pondelok 23.1. 9:00 v H6 a H3, hlavne 1. opravný termín
+
* Tretiu domácu úlohu treba odovzdať do tohto piatka (6.12.) 22:00.
* Pondelok 30.1. 13:00 v H6, hlavne 2. opravný termín
 
 
 
Na termíny sa bude dať prihlasovať od stredy 30.11. 20:00
 
* Kapacita termínov bude obmedzená, prihláste sa teda radšej skôr, neskôr to môžete zmeniť
 
* Hláste sa iba na jeden termín!
 
* Ak vidíte konflikt niektorého termínu s hromadnou skúškou alebo písomkou z iného predmetu, dajte mi prosím vedieť čím skôr, najneskôr v stredu
 
* Decembrový termín odporúčame hlavne študentom, ktorým programovanie nerobí problémy
 
  
 +
Semestrálny test
 +
* Budúcu stredu, viď [[Prednáška_18#Oznamy|oznamy z minulej prednášky]].
 +
* Bude obsahovať učivo po prednášku 20 vrátane. Na opravnom termíne môže byť aj učivo z ďalších prednášok.
 +
* V stredu po prednáške na testovač pridáme niektoré príklady z budúcich cvičení, aby ste ich mohli vopred použiť ako tréning na písomku.
  
Začneme s dokončením [[Prednáška_18#Vyfarbovanie_s_pou.C5.BEit.C3.ADm_radu|vyfarbovania z minulej prednášky]]
+
Na termíny sa bude dať prihlasovať od dnes 19:00
 +
* Kapacita termínov bude obmedzená, prihláste sa teda radšej skôr, neskôr to môžete zmeniť.
 +
* Ak vidíte konflikt niektorého termínu s hromadnou skúškou alebo písomkou z iného predmetu, dajte mi prosím vedieť čím skôr.
 +
* Decembrový termín odporúčame hlavne študentom, ktorým programovanie nerobí problémy.
 +
* Viac informácií o skúške je na stránke [[Zimný semester, skúška]], spolu cez to prejdeme budúcu stredu.
 +
* Na testovač budúcu stredu pridáme zopár tréningových príkladov na skúšku.
  
 
==Aritmetické výrazy==
 
==Aritmetické výrazy==
  
 
Nejaký čas sa teraz budeme venovať spracovaniu aritmetických výrazov pozostávajúcich z reálnych čísel, operácií <tt>+,-,*,/</tt> a zátvoriek <tt>(,)</tt>.
 
Nejaký čas sa teraz budeme venovať spracovaniu aritmetických výrazov pozostávajúcich z reálnych čísel, operácií <tt>+,-,*,/</tt> a zátvoriek <tt>(,)</tt>.
Prakticky najdôležitejšou úlohou tu je vyhodnotenie daného výrazu; napríklad pre výraz
+
Hlavnou úlohou je vyhodnotenie daného výrazu; napríklad pre výraz
 
<pre>
 
<pre>
 
(65 - 3 * 5) / (2 + 3)
 
(65 - 3 * 5) / (2 + 3)
Riadok 40: Riadok 33:
  
 
===Infixová notácia===
 
===Infixová notácia===
Bežný spôsob zápisu aritmetických výrazov v matematike sa zvykne nazývať aj ''infixovou notáciou'' (prípadne ''infixovou formou'' alebo ''infixovým zápisom''). Toto pomenovanie odkazuje na skutočnosť, že binárne operátory (ako napríklad <tt>+,-,*,/</tt>) sa v tejto notácii píšu medzi svojimi dvoma operandmi. Poradie vykonávania jednotlivých operácií sa pritom riadi zátvorkami a prioritou operácií.  
+
 
 +
* Bežný spôsob zápisu aritmetických výrazov sa v matematike nazýva aj '''infixovou notáciou'''.  
 +
* Binárne operátory (ako napríklad <tt>+,-,*,/</tt>) sa v tejto notácii píšu medzi svojimi dvoma operandmi.
 +
* Poradie vykonávania operácií sa riadi zátvorkami a prioritou operácií.  
  
 
Napríklad  
 
Napríklad  
Riadok 50: Riadok 46:
 
=== Prefixová notácia ===
 
=== Prefixová notácia ===
  
Pri takzvanej ''prefixovej notácii'' (často podľa jej pôvodcu Jana Łukasiewicza nazývanej aj ''[https://en.wikipedia.org/wiki/Polish_notation poľskou notáciou]'') sa každý operátor v aritmetickom výraze zapisuje pred svojimi dvoma operandmi.  
+
Pri '''prefixovej notácii''' (často podľa jej pôvodcu Jana Łukasiewicza nazývanej aj ''[https://en.wikipedia.org/wiki/Polish_notation poľskou notáciou]'') sa každý operátor v aritmetickom výraze zapisuje pred svojimi dvoma operandmi.  
  
 
Napríklad výraz <tt>(65 – 3 * 5) / (2 + 3)</tt> má prefixový zápis
 
Napríklad výraz <tt>(65 – 3 * 5) / (2 + 3)</tt> má prefixový zápis
Riadok 61: Riadok 57:
 
=== Postfixová notácia ===
 
=== Postfixová notácia ===
  
Pri ''postfixovej notácii'' (často nazývanej aj ''[https://en.wikipedia.org/wiki/Reverse_Polish_notation obrátenou poľskou notáciou]'') je situácia opačná: operátor sa zapisuje bezprostredne za svojimi dvoma operandmi.
+
Pri '''postfixovej notácii''' (často nazývanej aj ''[https://en.wikipedia.org/wiki/Reverse_Polish_notation obrátenou poľskou notáciou]'') je situácia opačná: operátor sa zapisuje bezprostredne za svojimi dvoma operandmi.
  
 
Výraz <tt>(65 – 3 * 5) / (2 + 3)</tt> má teda postfixový zápis
 
Výraz <tt>(65 – 3 * 5) / (2 + 3)</tt> má teda postfixový zápis
Riadok 68: Riadok 64:
 
</pre>
 
</pre>
  
Postfixová a prefixová notácia sú pre človeka o niečo ťažšie čitateľné, než bežná notácia infixová (čo môže byť aj otázkou zvyku). Uvidíme však, že najmä výrazy v postfixovej notácii sa dajú pomerne jednoducho vyhodnocovať. Výhodou postfixovej a prefixovej notácie oproti infixovej je aj to, že nepotrebujú zátvorky.  
+
* Postfixová a prefixová notácia sú pre človeka o niečo ťažšie čitateľné, než bežná infixová notácia (čo môže byť aj otázkou zvyku).  
 +
* Uvidíme však, že výrazy v postfixovej notácii sa dajú jednoducho vyhodnocovať.  
 +
* Výhodou postfixovej a prefixovej notácie oproti infixovej je aj to, že nepotrebujú zátvorky.
  
 
=== Unárne mínus===
 
=== Unárne mínus===
  
* Operátory +, * a  / sú vždy ''binárne'', čo znamená, že sa aplikujú sa na dva operandy.
+
* Operátory +, * a  / sú vždy '''binárne''', čo znamená, že sa aplikujú sa na dva operandy.
* Operátor - môže byť binárny aj ''unárny'' (unárny znamená, že sa aplikuje na jeden operand).
+
* Operátor - môže byť binárny aj '''unárny''' (unárny znamená, že sa aplikuje na jeden operand).
 
** Príklad s binárnym mínus: <tt>1 - 2</tt>.
 
** Príklad s binárnym mínus: <tt>1 - 2</tt>.
 
** Príklad s unárnym mínus: <tt>2 * -(2 + 3)</tt>.
 
** Príklad s unárnym mínus: <tt>2 * -(2 + 3)</tt>.
 
* Nevýhodou postfixovej a prefixovej notácie je, že bez zátvoriek v nich nie je možné rozpoznať binárne a unárne mínus.
 
* Nevýhodou postfixovej a prefixovej notácie je, že bez zátvoriek v nich nie je možné rozpoznať binárne a unárne mínus.
 
** Prefixový výraz <tt>- - 2 3</tt> by napríklad mohol zodpovedať ako výrazu <tt>-2 - 3</tt> aj výrazu <tt>-(2 - 3)</tt>.
 
** Prefixový výraz <tt>- - 2 3</tt> by napríklad mohol zodpovedať ako výrazu <tt>-2 - 3</tt> aj výrazu <tt>-(2 - 3)</tt>.
* Na vyriešenie tohto problému budeme na unárne mínus používať znamienko <tt>~</tt>. V infixových výrazoch budú unárne mínus automaticky rozpoznané a nahradené <tt>~</tt>.
+
* Na vyriešenie tohto problému budeme na unárne mínus používať znamienko <tt>~</tt> (iba interne v našom programe, nepoužíva sa tak všeobecne). V infixových výrazoch budú unárne mínus automaticky rozpoznané a nahradené <tt>~</tt>.
  
 
== Predspracovanie výrazu ==
 
== Predspracovanie výrazu ==
Riadok 102: Riadok 100:
 
};
 
};
 
</syntaxhighlight>
 
</syntaxhighlight>
 +
 +
 +
Napríklad pre výraz <tt>"(2.1+  3.9) / 3"</tt> vznikne nasledujúca dátová štruktúra:
 +
<pre>
 +
tokenSequence:
 +
length: 7
 +
size: nejaké číslo >= 7
 +
items: pole s nasledovnými položkami
 +
 +
token items[0]: op '(', val ?
 +
token items[1]: op ' ', val 2.1
 +
token items[2]: op '+', val ?
 +
token items[3]: op ' ', val 3.9
 +
token items[4]: op ')', val ?
 +
token items[5]: op '/', val ?
 +
token items[6]: op ' ', val 3
 +
</pre>
  
 
Preklad výrazu na postupnosť symbolov realizuje funkcia <tt>tokenize</tt>.  
 
Preklad výrazu na postupnosť symbolov realizuje funkcia <tt>tokenize</tt>.  
* Na načítanie čísla používame funkciu <tt>sscanf</tt>, ktorá vyzerá podobne ako <tt>scanf</tt>, ale načítava zo zadaného reťazca
+
* Na načítanie čísla používame funkciu <tt>sscanf</tt>, ktorá vyzerá podobne ako <tt>scanf</tt>, ale načítava zo zadaného reťazca.
 
** Ako reťazec zadáme <tt>&(str[strPos])</tt>, čo spôsobí, že sa začne načítavať od pozície <tt>strPos</tt>, mohli by sme písať aj <tt>str+strPos</tt>.  
 
** Ako reťazec zadáme <tt>&(str[strPos])</tt>, čo spôsobí, že sa začne načítavať od pozície <tt>strPos</tt>, mohli by sme písať aj <tt>str+strPos</tt>.  
** Formátovací znak <tt>%n</tt> nám do premennej <tt>skip</tt> uloží počet znakov, ktoré sa pri načítaní čísla použili, tento o tento počet potom posunieme premennú <tt>strPos</tt>.
+
** Formátovací znak <tt>%n</tt> nám do premennej <tt>skip</tt> uloží počet znakov, ktoré sa pri načítaní čísla použili, o tento počet potom posunieme premennú <tt>strPos</tt>.
 
* Kód token <tt>newToken = {str[strPos], 0}</tt> inicializuje položku <tt>op</tt> na znak <tt>str[strPos]</tt> a položku <tt>val</tt> na nulu.
 
* Kód token <tt>newToken = {str[strPos], 0}</tt> inicializuje položku <tt>op</tt> na znak <tt>str[strPos]</tt> a položku <tt>val</tt> na nulu.
 
* Pomocné funkcie <tt>init</tt> a <tt>addToken</tt> pracujú s postupnosťou symbolov, nájdete ich v [[#Program_na_pr.C3.A1cu_s_v.C3.BDrazmi|programe na konci prednášky]].
 
* Pomocné funkcie <tt>init</tt> a <tt>addToken</tt> pracujú s postupnosťou symbolov, nájdete ich v [[#Program_na_pr.C3.A1cu_s_v.C3.BDrazmi|programe na konci prednášky]].
Riadok 144: Riadok 159:
 
== Vyhodnocovanie aritmetických výrazov v postfixovej notácii ==
 
== Vyhodnocovanie aritmetických výrazov v postfixovej notácii ==
  
Na vyhodnocovanie výrazov v postfixovej forme budeme používať zásobník, do ktorého budeme postupne vkladať jednotlivé operandy. Využijeme pritom vlastnosť, že operátor má v postfixovom zápise obidva operandy pred sebou. Keď teda narazíme na operátor, jeho operandy sme už prečítali a spracovali. Ide navyše ''o posledné dve prečítané alebo vypočítané hodnoty''.
+
* Budeme používať '''zásobník''', do ktorého budeme vkladať '''čísla''' čakajúce na spracovanie.
 +
* Operátor má v postfixovom zápise obidva operandy pred sebou. Keď narazíme na operátor, jeho operandy sme už prečítali a spracovali. Ide navyše o '''posledné dve''' prečítané alebo vypočítané hodnoty.
  
 
Výraz budeme postupne čítať zľava doprava:
 
Výraz budeme postupne čítať zľava doprava:
* Keď pritom narazíme na operand, vložíme ho na zásobník.  
+
* Keď narazíme na číslo, vložíme ho na zásobník.  
 
* Keď narazíme na operátor:
 
* Keď narazíme na operátor:
 
** Vyberieme zo zásobníka jeho dva operandy.  
 
** Vyberieme zo zásobníka jeho dva operandy.  
 
** Prvé z týchto čísel je pritom druhým operandom a druhé z nich je prvým operandom.
 
** Prvé z týchto čísel je pritom druhým operandom a druhé z nich je prvým operandom.
 
** Vykonáme s týmito operandmi danú operáciu a výsledok tejto operácie vložíme naspäť na zásobník.  
 
** Vykonáme s týmito operandmi danú operáciu a výsledok tejto operácie vložíme naspäť na zásobník.  
* Tento postup opakujeme, až kým neprídeme na koniec výrazu. V tom okamihu by sme mali mať na zásobníku jediný prvok &ndash; výslednú hodnotu výrazu.  
+
* Pri unárnom mínus vyberáme zo zásobníka iba jeden operand.
 +
* Tento postup opakujeme, až kým neprídeme na koniec výrazu. V tom okamihu by sme mali mať na zásobníku jediný prvok, výslednú hodnotu výrazu.
 +
 
 +
Technická poznámka:
 +
* Keďže vo [[#Program_na_pr.C3.A1cu_s_v.C3.BDrazmi|výslednom programe]] budeme potrebovať zásobníky čísel aj znakov, používame v ňom zásobník položiek typu <tt>token</tt>. Ak by sme však robili čisto vyhodnocovanie postfixovej notácie, stačil by nám zásobník s prvkami typu <tt>double</tt>.
  
 
'''Cvičenie:'''  
 
'''Cvičenie:'''  
* Odsimulujme činnosť tohto algoritmu na našom vstupe 65 3 5 * - 2 3 + /
+
* Odsimulujme činnosť tohto algoritmu na našom vstupe <tt>65 3 5 * - 2 3 + /</tt>
 
* Aké všelijaké prípady môžu nastať, keď na vstupe nemáme správny výraz v postfixovej notácii?
 
* Aké všelijaké prípady môžu nastať, keď na vstupe nemáme správny výraz v postfixovej notácii?
  
 
<syntaxhighlight lang="C++">
 
<syntaxhighlight lang="C++">
#include <cstdio>
+
typedef token dataType;
#include <cctype>
+
// Nasleduje kód pre zásobník tokenov
#include <cassert>
+
// ...
using namespace std;
 
  
typedef double dataType;
 
  
/* Sem pride definicia struktury pre zasobnik
+
/** Funkcia aplikuje operátor uložený v opToken na čísla
* a funkcii poskytovanych zasobnikom. */
+
* uložené v num1 a num2, výsledok uloží ako číslo do result.
 
+
* Unárny operátor sa aplikuje iba na num1. */
 
+
void applyOp(token opToken, token num1, token num2, token & result) {
int main() {
+
     result.op = ' ';
     // vstup budeme citat z konzoly
+
     switch (opToken.op) {
    FILE *fr = stdin;
+
     case '~':
       
+
        result.val = -num1.val;
     stack s;
+
         break;
    init(s);
+
    case '+':
      
+
        result.val = num1.val + num2.val;
    while (true) {
+
        break;
        // preskakujeme medzery na vstupe
+
    case '-':
        int c = getc(fr);
+
        result.val = num1.val - num2.val;
        while (c != EOF && c != '\n' && isspace(c)) {
+
        break;
            c = getc(fr);
+
    case '*':
         }
+
        result.val = num1.val * num2.val;
        // koniec riadku alebo EOF znamenaju koniec vyrazu
+
        break;
        if (c == EOF || c == '\n') {
+
    case '/':
            break;
+
        result.val = num1.val / num2.val;
        } else if (isdigit(c)) {
+
        break;
            // ked najdeme cifru, vratime ju
+
    default: // iné operátory nepovoľujeme.
            // a nacitame realne cislo
+
         assert(false);
            ungetc(c, fr);
 
            double num;
 
            fscanf(fr, "%lf", &num);
 
            push(s, num);
 
        } else {
 
            // nacitali sme zrejme nejake znamienko
 
            // vyberieme 2 operandy zo zasobnika
 
            // najskor druhy operand
 
            double num2 = pop(s);
 
            double num1 = pop(s);
 
            // vykoname operaciu podla typu operatora
 
            // a vysledok dame na zasobnik
 
            switch (c) {
 
                case '+':
 
                    push(s, num1 + num2);
 
                    break;
 
                case '-':
 
                    push(s, num1 - num2);
 
                    break;
 
                case '*':
 
                    push(s, num1 * num2);
 
                    break;  
 
                case '/':
 
                    push(s, num1 / num2);
 
                    break;  
 
            }
 
         }
 
 
     }
 
     }
   
 
    // vysledna hodnota je na vrchu zasobnika,
 
    // vyberieme ju a vypiseme
 
    printf("%f\n", pop(s));
 
    // teraz by uz mal byt zasobnik prazdny
 
    assert(isEmpty(s));
 
 
    destroy(s);
 
 
}
 
}
</syntaxhighlight>
 
  
Nasledujúca alternatívna implementácia vyhodnocovania postfixových výrazov sa od predchádzajúcej líši tým, že vstupný výraz najprv uloží do reťazca, ktorý následne vyhodnotí prostredníctvom funkcie <tt>evaluatePostfix</tt>. Drobnou nevýhodou tohto prístupu je, že dĺžka vstupného reťazca je obmedzená konštantou; funkcia vyhodnocujúca výraz uložený v reťazci sa nám však neskôr zíde.
+
/** Funkcia vyhodnotí a vráti hodnotou výrazu v postfixovom tvare. */
 +
double evaluatePostfix(tokenSequence & tokens) {
 +
    // zásobník, do ktorého ukladáme čísla
 +
    stack numberStack;
 +
    init(numberStack);
  
<syntaxhighlight lang="C++">
+
     for (int i = 0; i < tokens.length; i++) {
#include <cstdio>
+
         // aktuálny token zo vstupu
#include <cctype>
+
        token curToken = tokens.items[i];
#include <cassert>
+
         if (curToken.op == ' ') {
using namespace std;
+
             // čísla rovno ukladáme na zásobník
 
+
             push(numberStack, curToken);
typedef double dataType;
 
 
 
 
 
/* Sem pride definicia struktury pre zasobnik a funkcii poskytovanych zasobnikom. */
 
 
 
 
 
double evaluatePostfix(char *expr) {
 
    stack s;
 
     init(s);
 
   
 
    int i = 0;
 
    while (true) {
 
         while (expr[i] != 0 && expr[i] != '\n' && isspace(expr[i])) {
 
            i++;
 
        }
 
         if (expr[i] == 0 || expr[i] == '\n') {
 
             break;
 
        } else if (isdigit(expr[i])) {
 
            double num;
 
            sscanf(&expr[i], "%lf", &num);
 
             push(s, num);
 
            while (isdigit(expr[i]) || expr[i] == '.') {
 
                i++;
 
            }
 
 
         } else {
 
         } else {
             double num2 = pop(s);      
+
             // spracovanie operátora
             double num1 = pop(s);     
+
            token num1, num2, result;
             switch (expr[i]) {
+
             // najskôr vyberieme 1 alebo 2 čísla zo zásobníka
                 case '+':
+
             if (curToken.op == '~') {
                    push(s, num1 + num2);
+
                 num1 = pop(numberStack);
                    break;
+
            } else {
                 case '-':
+
                 num2 = pop(numberStack);
                    push(s, num1 - num2);
+
                 num1 = pop(numberStack);
                    break;
 
                 case '*':
 
                    push(s, num1 * num2);
 
                    break;   
 
                case '/':
 
                    push(s, num1 / num2);
 
                    break;   
 
 
             }
 
             }
             i++;
+
             // na operandy aplikujeme operátor
 +
            applyOp(curToken, num1, num2, result);
 +
            // výsledné číslo uložíme na zásobník
 +
            push(numberStack, result);
 
         }
 
         }
 
     }
 
     }
     double result = pop(s);
+
     // zo zásobníka vyberieme výsledné číslo
     assert(isEmpty(s));
+
    token result = pop(numberStack);
     destroy(s);
+
    // skontrolujeme, že zásobník je prázdny a výsledok je číslo
   
+
     assert(isEmpty(numberStack) && result.op == ' ');
     return result;
+
    // uvoľníme pamäť zásobníka
}
+
     destroy(numberStack);
 
+
     return result.val;
int main() {
 
    FILE *fr = stdin;
 
       
 
    char expr[100];   
 
    fgets(expr, 100, fr);
 
    printf("%f\n", evaluatePostfix(expr));   
 
 
}
 
}
 
</syntaxhighlight>
 
</syntaxhighlight>
Riadok 299: Riadok 251:
  
 
* Pre bežnú prax je dôležitejšie vyhodnocovanie výrazov v klasickej infixovej notácii.  
 
* Pre bežnú prax je dôležitejšie vyhodnocovanie výrazov v klasickej infixovej notácii.  
* Túto úlohu teraz vyriešime tak, že napíšeme program, ktorý preloží aritmetického výrazu z infixovej do postfixovej notácie.  
+
* Túto úlohu teraz vyriešime tak, že napíšeme funkciu, ktorá preloží aritmetický výraz z infixovej do postfixovej notácie.  
 
* Následne ho môžeme vyhodnotiť algoritmom popísaným vyššie.
 
* Následne ho môžeme vyhodnotiť algoritmom popísaným vyššie.
  
 
=== Popis algoritmu ===
 
=== Popis algoritmu ===
  
Uvažujme najprv výrazy bez zátvoriek (a bez unárnych mínusov).  
+
Uvažujme najprv výrazy bez zátvoriek a bez unárnych mínusov.  
 
* Pozostávajú teda z čísel a binárnych operátorov <tt>+, -, *, /</tt>, kde <tt>*</tt> a <tt>/</tt> majú vyššiu prioritu ako <tt>+</tt> a <tt>-</tt>.  
 
* Pozostávajú teda z čísel a binárnych operátorov <tt>+, -, *, /</tt>, kde <tt>*</tt> a <tt>/</tt> majú vyššiu prioritu ako <tt>+</tt> a <tt>-</tt>.  
 
* Všetky tieto operátory sú navyše zľava asociatívne, t.j. napr. <tt>30 / 6 / 5</tt> je to isté ako  <tt>(30 / 6) / 5</tt>.  
 
* Všetky tieto operátory sú navyše zľava asociatívne, t.j. napr. <tt>30 / 6 / 5</tt> je to isté ako  <tt>(30 / 6) / 5</tt>.  
  
Na prevod takéhoto jednoduchého výrazu do postfixového tvaru ním teda stačí prejsť zľava doprava a všimnúť si dve skutočnosti:
+
Na prevod takéhoto výrazu do postfixového tvaru ním stačí prejsť zľava doprava a všimnúť si dve skutočnosti:
 
* Poradie jednotlivých čísel v postfixovom výraze je rovnaké, ako v pôvodnom infixovom výraze.  
 
* Poradie jednotlivých čísel v postfixovom výraze je rovnaké, ako v pôvodnom infixovom výraze.  
* Napríklad výraz <tt>1 + 2 + 3 * 4 - 5</tt> má postfixový tvar <tt>1 2 + 3 4 * + 5 -</tt>.  
+
* Napríklad výraz <tt>1 + 2 - 3 * 4 + 5</tt> má postfixový tvar <tt>1 2 + 3 4 * - 5 +</tt>.  
* Z toho vyplýva, že pri prechádzaní vstupným infixovým výrazom možno čísla priamo vypisovať do výstupného postfixového výrazu bez toho, aby nás ďalej zaujímali.
+
* Pri prechádzaní vstupným infixovým výrazom budeme teda čísla priamo pridávať do výstupného postfixového výrazu.
* Každý operátor treba presunúť spomedzi jeho dvoch argumentov za jeho druhý argument.  
+
* Každý operátor treba presunúť spomedzi jeho dvoch operandov za jeho druhý operand.  
* Ak teda vo vstupnom infixovom výraze narazíme na operátor, nevypíšeme ho hneď do výstupného výrazu, ale uložíme ho pre neskorší výpis na správnej pozícii.
+
* Ak teda vo vstupnom infixovom výraze narazíme na operátor, nepridáme ho hneď do výstupného výrazu, ale uložíme ho pre neskoršie pridanie na správnej pozícii.
* Uložený operátor potom treba vypísať za jeho druhým argumentom. Ak pritom aj samotný tento argument obsahuje nejaké ďalšie operátory, určite musia byť vypísané skôr. Operátory teda budeme ukladať na zásobník.
+
* Uložený operátor treba vypísať za jeho druhým operandom. Ak pritom aj samotný operand obsahuje nejaké ďalšie operátory, určite musia byť vypísané skôr. Operátory teda budeme ukladať na zásobník.
* Zakaždým, keď vo vstupnom infixovom výraze narazíme na operátor, je možné, že tesne pred ním končí argument jedného alebo niekoľkých operátorov uložených na zásobníku. Vďaka ľavej asociatívnosti pritom ide o práve všetky operátory na vrchu zásobníka, ktoré majú vyššiu alebo rovnakú prioritu, ako nájdený operátor. Všetky tieto operátory teda postupne vyberieme zo zásobníka a vypíšeme ich do výstupného reťazca. Až následne na zásobník vložíme nájdený operátor.
+
* Keď vo vstupnom infixovom výraze narazíme na operátor, je možné, že tesne pred ním končí operand jedného alebo niekoľkých operátorov uložených na zásobníku. Vďaka ľavej asociatívnosti pritom ide o práve všetky operátory na vrchu zásobníka, ktoré majú vyššiu alebo rovnakú prioritu, ako nájdený operátor. Všetky tieto operátory teda postupne vyberieme zo zásobníka a vypíšeme ich do výstupného reťazca. Až následne na zásobník vložíme nájdený operátor.
 
* Na konci vstupného reťazca vypíšeme všetky operátory, ktoré zostali na zásobníku.
 
* Na konci vstupného reťazca vypíšeme všetky operátory, ktoré zostali na zásobníku.
  
 
Z technických dôvodov budeme na spodku zásobníka uchovávať &bdquo;umelé dno&rdquo; <tt>#</tt>, ktoré budeme chápať ako symbol s nižšou prioritou ako všetky operátory.  
 
Z technických dôvodov budeme na spodku zásobníka uchovávať &bdquo;umelé dno&rdquo; <tt>#</tt>, ktoré budeme chápať ako symbol s nižšou prioritou ako všetky operátory.  
* Situáciu, keď pri vyberaní operátorov zo zásobníka narazíme na jeho dno tak budeme môcť riešiť konzistentne so situáciou, keď  narazíme na operátor s nižšou prioritou &ndash; v oboch prípadoch chceme s vyberaním prestať.   
+
* Situáciu, keď pri vyberaní operátorov zo zásobníka narazíme na jeho dno tak budeme môcť riešiť konzistentne so situáciou, keď  narazíme na operátor s nižšou prioritou: v oboch prípadoch chceme s vyberaním prestať.   
  
Na vstupnom výraze <tt>1 + 2 + 3 * 4 - 5</tt> bude práve popísaný algoritmus pracovať nasledovne:
+
Na vstupnom výraze <tt>1 + 2 - 3 * 4 + 5</tt> bude práve popísaný algoritmus pracovať nasledovne:
 
<pre>
 
<pre>
Vstupný symbol    Výstupný reťazec  Zásobník (dno vľavo)  
+
Vstupný symbol Výstupný výraz   Zásobník (dno vľavo)  
------------------------------------------------------------------------------------------------------------
+
-------------------------------------------------------------------------------------------------------
            1                      #                 vypíš číslo 1 na výstup
+
          1                      #           vypíš 1  
                  1                  #
+
                1                  #
  
            +    1                  #                 # má nižšiu prioritu ako +, nevyberaj ho
+
          +    1                  #           # má nižšiu prioritu ako +, nevyberaj ho
                  1                  # +               vlož + na zásobník
+
                1                  # +         vlož + na zásobník
  
            2    1                  # +               vypíš číslo 2 na výstup
+
          2    1                  # +         vypíš 2
                  1 2                # +  
+
                1 2                # +  
  
            +   1 2                # +               + má rovnakú prioritu ako +, vyber + a vypíš
+
          -   1 2                # +         + má rovnakú prioritu ako -, vyber + a vypíš
                  1 2 +              #                 # má nižšiu prioritu ako +, nevyberaj ho
+
                1 2 +              #           # má nižšiu prioritu ako -, nevyberaj ho
                  1 2 +              #                 vlož + na zásobník
+
                1 2 +              #           vlož - na zásobník
                  1 2 +              # +    
+
                1 2 +              # -    
  
            3    1 2 +              # +              vypíš číslo 3 na výstup
+
          3    1 2 +              # -          vypíš 3
                  1 2 + 3            # +
+
                1 2 + 3            # -
  
            *    1 2 + 3            # +              + má nižšiu prioritu ako *, nevyberaj ho
+
          *    1 2 + 3            # -          - má nižšiu prioritu ako *, nevyberaj ho
                  1 2 + 3            # + *             vlož * na zásobník
+
                1 2 + 3            # - *       vlož * na zásobník
  
            4    1 2 + 3            # + *             vypíš číslo 4 na výstup
+
          4    1 2 + 3            # - *       vypíš 4
                  1 2 + 3 4          # + *                     
+
                1 2 + 3 4          # - *                     
  
            -   1 2 + 3 4          # + *             * má vyššiu prioritu ako -, vyber - a vypíš
+
          +   1 2 + 3 4          # - *       * má vyššiu prioritu ako +, vyber * a vypíš
                  1 2 + 3 4 *        # +              + má rovnakú prioritu ako -, vyber + a vypíš
+
                1 2 + 3 4 *        # -          - má rovnakú prioritu ako +, vyber - a vypíš
                  1 2 + 3 4 * +     #                 # má nižšiu prioritu ako -, nevyberaj ho
+
                1 2 + 3 4 * -     #           # má nižšiu prioritu ako +, nevyberaj ho
                  1 2 + 3 4 * +     # -              vlož - na zásobník
+
                1 2 + 3 4 * -     # +          vlož - na zásobník
  
            5    1 2 + 3 4 * +     # -              vypíš číslo 5 na výstup
+
          5    1 2 + 3 4 * -     # +          vypíš 5
                  1 2 + 3 4 * + 5    # -                  
+
                1 2 + 3 4 * - 5    # +                  
  
[koniec vstupu]   1 2 + 3 4 * + 5    # -              vyber a vypíš operátory na zásobníku
+
    [koniec]   1 2 + 3 4 * - 5    # +          vyber operátory na zásobníku a vypíš
                  1 2 + 3 4 * + 5 - #                 <-- VÝSLEDNÝ POSTFIXOVÝ VÝRAZ
+
                1 2 + 3 4 * - 5 +  #           <-- VÝSLEDNÝ POSTFIXOVÝ VÝRAZ
 
</pre>  
 
</pre>  
  
Do tejto schémy je už jednoduché zapracovať aj zátvorky:
+
Pridanie zátvoriek:
* Keď vo vstupnom infixovom reťazci narazíme na ľavú zátvorku, vložíme ju do zásobníka. Podobne ako pri <tt>#</tt> ju budeme považovať za symbol s nižšou prioritou, než všetky binárne operátory (argument operátora spred tejto zátvorky totiž určite nemôže končiť v jej vnútri).
+
* Keď vo vstupnom infixovom reťazci narazíme na ľavú zátvorku, vložíme ju do zásobníka. Podobne ako pri <tt>#</tt> ju budeme považovať za symbol s nižšou prioritou, než všetky binárne operátory. To má dva dôsledky:
 +
** Pri vkladaní zátvorky teda nevyhadzujeme operátory zo zásobníka
 +
** Operátory vo vnútri zátvorky nespôsobia jej vyhodenie ani vyhodenie symbolov pod ňou
 
* Keď narazíme na pravú zátvorku, potrebujeme vypísať všetky doposiaľ nevypísané operátory uzatvorené touto zátvorkou. Preto vyberieme a vypíšeme na výstup všetky operátory zo zásobníka až po prvú ľavú zátvorku (ktorú zo zásobníka taktiež vyberieme).
 
* Keď narazíme na pravú zátvorku, potrebujeme vypísať všetky doposiaľ nevypísané operátory uzatvorené touto zátvorkou. Preto vyberieme a vypíšeme na výstup všetky operátory zo zásobníka až po prvú ľavú zátvorku (ktorú zo zásobníka taktiež vyberieme).
 +
 +
Pridanie unárneho mínus:
 +
* Unárne mínus má vyššiu prioritu ako binárne operátory. Predpokladáme, že ho máme zapísané ako <tt>~</tt>.
 +
* Je však sprava asociatívne, t.j. <tt>--2</tt> je to isté ako <tt>-(-2)</tt> a v postfixovom tvare to bude <tt>2 ~ ~</tt>.
 +
* Preto ak je aktuálny operátor unárne mínus <tt>~</tt>, nevyhadzujeme iné unárne mínus zo zásobníka. Toto je v programe dosiahnuté tak, že nové unárne mínus ("pravé") má vyššiu prioritu ako to, čo už je na zásobníku ("ľavé").
  
 
=== Implementácia ===
 
=== Implementácia ===
 
Funkcia <tt>infixToPostfix</tt>, realizujúca prevod z infixovej do postfixovej notácie:
 
  
 
<syntaxhighlight lang="C++">
 
<syntaxhighlight lang="C++">
#include <cstdio>
+
/** Pomocná funkcia, ktorá vráti prioritu operátora.
#include <cassert>
+
* Argument right určuje, či ide o pravý z dvoch porovnávaných operátorov */
#include <cctype>
+
int priority(char op, bool right) {
using namespace std;
+
     if (op == '#' || op == '(') return 0;
 
 
typedef char dataType;
 
 
 
 
 
/* Sem pride definicia struktury pre zasobnik a funkcii poskytovanych zasobnikom. */
 
 
 
int precedence(char op) {
 
     if (op == '#' || op == '(') return 0;  
 
 
     if (op == '-' || op == '+') return 1;
 
     if (op == '-' || op == '+') return 1;
 
     if (op == '*' || op == '/') return 2;
 
     if (op == '*' || op == '/') return 2;
     assert(false); // sem by sme sa nemali dostat   
+
    if (op == '~' && !right) return 3;
 +
    if (op == '~' && right) return 4;
 +
     assert(false); // sem by sme sa nemali dostať
 
}
 
}
  
/* Skonvertuje infixovy vyraz infix  
+
/** Skonvertuje infixový výraz infix do postfixovej formy */
* do postfixovej formy  
+
void infixToPostfix(tokenSequence & infix, tokenSequence & postfix) {
* a vysledok ulozi do retazca postfix */
+
    // inicializuje výslednú postupnosť tokenov
void infixToPostfix(const char *infix, char *postfix) {
+
    init(postfix, infix.length);
     stack s;
+
 
     init(s);
+
    // vytvoríme zásobník operátorov a na spodok dáme #
     push(s, '#');
+
     stack opStack;
      
+
     init(opStack);
    int j = 0; // index do vystupneho retazca
+
     token curToken = {'#', 0};
     for (int i = 0; infix[i] != 0; i++) {
+
     push(opStack, curToken);
         if (isdigit(infix[i]) || infix[i] == '.') {
+
 
            postfix[j++] = infix[i];
+
     for (int i = 0; i < infix.length; i++) {
         } else if (isspace(infix[i])) {  
+
         // aktuálny token zo vstupu
             // biele znaky preskakujeme
+
        curToken = infix.items[i];
         } else if (infix[i] == '(') {  
+
         if (curToken.op == ' ') {
             // zaciatok zatvorky na zasobnik
+
             // čísla rovno skopírujeme do výstupu
             push(s, infix[i]);
+
            addToken(postfix, curToken);
         } else if (infix[i] == ')') {
+
         } else if (curToken.op == '(') {
             /* koniec zatvorky:  
+
             // začiatok zátvorky uložíme na zásobník
            * vypiseme operatory, co boli v zatvorke
+
             push(opStack, curToken);
            * (a este nie su vypisane)*/
+
         } else if (curToken.op == ')') {
             char popped = pop(s);
+
             // koniec zátvorky:
            postfix[j++] = ' ';
+
            // na výstup pridáme zo zásobníka operátory,
             while (popped != '(') {
+
            // ktoré boli v zátvorke
                 postfix[j++] = popped;
+
             token popped = pop(opStack);
                postfix[j++] = ' ';
+
             while (popped.op != '(') {
                 popped = pop(s);
+
                 addToken(postfix, popped);
 +
                 popped = pop(opStack);
 
             }
 
             }
         }
+
         } else {
        else { // spracovanie operatora
+
            // spracovanie operátora:
             postfix[j++] = ' '; // pridame medzeru
+
             // na výstup pridáme zo zásobníka operátory s vyššou prioritou
             int p = precedence(infix[i]);  
+
             int p = priority(curToken.op, true);
             while (precedence(peek(s)) >= p) {
+
             while (priority(peek(opStack).op, false) >= p) {
                 postfix[j++] = pop(s);
+
                 token popped = pop(opStack);
                 postfix[j++] = ' ';
+
                 addToken(postfix, popped);
 
             }
 
             }
             push(s, infix[i]);
+
            // aktuálny operátor dáme na zásobník
 +
             push(opStack, curToken);
 
         }
 
         }
 
     }
 
     }
  
     while (!isEmpty(s)) {
+
    // zvyšné operátory presunieme zo zásobníka na výstup
         char c = pop(s);
+
     while (peek(opStack).op != '#') {
         if (c != '#') {
+
         token popped = pop(opStack);
            postfix[j++] = ' ';
+
         addToken(postfix, popped);
            postfix[j++] = c;
 
        }
 
 
     }
 
     }
    postfix[j] = 0;
+
     destroy(opStack);
     destroy(s);
 
 
}
 
}
 +
</syntaxhighlight>
  
const int maxN = 100;
+
''Cvičenie'': Rozšírte program vyššie o operáciu umocňovania <tt>^</tt> s prioritou vyššou ako <tt>*</tt> (dajte pozor na fakt, že umocňovanie je na rozdiel od operácií <tt>+, -, *, /</tt> sprava asociatívne).
  
int main() {
 
    char infix[maxN];
 
    char postfix[2 * maxN];
 
   
 
    fgets(infix, maxN, stdin);
 
    infixToPostfix(infix, postfix);
 
   
 
    printf("Postfixovy tvar vyrazu: %s\n", postfix);
 
}
 
</syntaxhighlight>
 
  
''Cvičenie'': Rozšírte program vyššie o operáciu umocňovania <tt>^</tt> s prioritou vyššou ako <tt>*</tt> (dajte si pritom pozor na fakt, že umocňovanie je na rozdiel od operácií <tt>+, -, *, /</tt> sprava asociatívne).
+
== Predspracovanie unárneho mínus ==
  
=== Rozšírenie na infixové výrazy obsahujúce unárne mínus ===
+
* Pre prevodom infixového výrazu do postfixového tvaru potrebujeme v infixovom výraze nahradiť unárne mínus znakom <tt>~</tt>.
 +
* Robí to funkcia <tt>fixUnaryMinus</tt>.
 +
* Mínus je v korektnom infixovom výraze unárne práve vtedy, keď nenasleduje za číslom, ani za pravou zátvorkou, čo testuje pomocná funkcia <tt>isOperand</tt>.
  
* Prevod infixového výrazu do postfixového tvaru môžeme rozšíriť o spracovanie unárneho operátora <tt>-</tt>, tým, že ho z výrazu odstránime pred prevodom.
+
<syntaxhighlight lang="C++">
* Napíšeme funkciu <tt>normalise</tt>, ktorá v danom infixovom výraze nahradí všetky výskyty unárneho mínusu reťazcom <tt>(0-1)*</tt> a výsledok uloží do (opäť infixového) výrazu <tt>out</tt>.  
+
/** Pomocná funkcia, ktorá vráti, či token je koncom operandu v infixovej notácii */
* Mínus je v korektnom infixovom výraze unárny práve vtedy, keď nenasleduje za číslom, ani za pravou zátvorkou (biele znaky pritom ignorujeme).
+
bool isOperand(token curToken) {
 +
    return curToken.op == ' ' || curToken.op == ')';
 +
}
  
<syntaxhighlight lang="C++">
+
/** Funkcia, ktorá v infixovom výraze zmení unárne mínus na ~ */
void normalise(const char *in, char *out) {
+
void fixUnaryMinus(tokenSequence & infix) {
    int j = 0; // index do vystupneho retazca
+
     for (int i = 0; i < infix.length; i++) {
    bool hasOperand = false;
+
         if(infix.items[i].op == '-'  
     for (int i = 0; in[i] != 0; i++) {
+
          && (i == 0 || !isOperand(infix.items[i - 1]))) {
         if (in[i] == '-' && !hasOperand) {
+
             infix.items[i].op = '~';
            out[j++] = '(';
 
            out[j++] = '0';
 
            out[j++] = '-';
 
            out[j++] = '1';
 
            out[j++] = ')';
 
            out[j++] = '*';
 
        } else if (isdigit(in[i]) || in[i] == '.'
 
                  || in[i] == ')') {
 
            out[j++] = in[i];
 
            hasOperand = true;
 
        } else if (isspace(in[i])) {
 
             out[j++] = in[i];
 
        } else {
 
            out[j++] = in[i];
 
            hasOperand = false;
 
 
         }
 
         }
 
     }
 
     }
    out[j] = 0;
 
 
}
 
}
 
</syntaxhighlight>
 
</syntaxhighlight>
Riadok 487: Riadok 416:
 
==Záverečné poznámky==
 
==Záverečné poznámky==
  
* Infixové výrazy vieme teda vyhodnotiť tak, že najskôr ich prevedieme na postfixové a tie potom vyhodnotíme.
+
* Infixové výrazy vieme vyhodnotiť tak, že najskôr ich prevedieme na postfixové a tie potom vyhodnotíme.
* Obidva procesy by sa dali vykonávať aj súčasne (počas prechodu reťazcom by sme používali jeden zásobník operandov a jeden zásobník operátorov).
+
** Pri vyhodnocovaní postfixovej formy používame zásobník čísel (operandov).
* Všeobecnejšie a elegantnejšie prístupy k analýze a vyhodnocovanie výrazov ale napríklad aj celých programov uvidíte na predmete Kompilátory (Mgr. štúdium), ktorý využíva poznatky z predmetu Formálne jazyky a automaty (semester 2Z).
+
** Pri prevode z infixovej formy na postfixovú používame zásobník operátorov.
 +
* Obidva procesy sa dajú vykonávať aj súčasne (počas prechodu výrazom používame jeden zásobník čísel a jeden zásobník operátorov).
 +
** Toto je pre zaujímavosť implementované vo funkcii <tt>evaluateInfix</tt> v [[#Program_na_pr.C3.A1cu_s_v.C3.BDrazmi|priloženom programe]].
 +
* Všeobecnejšie a elegantnejšie prístupy k analýze a vyhodnocovaniu výrazov ale aj celých programov uvidíte na predmete Kompilátory (Mgr. štúdium), ktorý využíva poznatky z predmetu Formálne jazyky a automaty (semester 2Z).
 +
 
  
 
=== Typ dát na zásobníku ===
 
=== Typ dát na zásobníku ===
  
Ak by sme chceli v tom istom programe spraviť aj prevod z infixu do postfixu aj vyhodnotenie postfixu (naraz alebo jedno po druhom), máme problém:
+
V našom programe sme potrebovali zásobník čísel aj zásobník znakov.
* Funkcia <tt>evaluatePostfix</tt> využíva zásobník prvkov typu <tt>double</tt> ale funkcia <tt>infixToPostfix</tt> využíva zásobník prvkov typu <tt>char</tt>.  
+
* Vyriešili sme to tým, že na zásobník dávame položky typu <tt>token</tt>, ktoré obsahujú znak aj číslo.  
* Pri našej implementácii vieme do zásobníka vkladať iba jeden typ dát
+
* Nie je to však príliš elegantné a plytve pamäťou na nepotrebné údaje.
* Ak by sme ako <tt>dataType</tt> pre zásobník zvolili <tt>double</tt>, pri vkladaní a vyberaní znakov by sa znaky konvertovali na reálne čísla a naspať. Program by bol síce funkčný, ale nie príliš elegantný.
 
 
* Druhá možnosť je dvakrát implementovať celý zásobník pre rôzne typy dát, kopírovanie a menenie kódu je však tiež niečo, čomu sa chceme vyhnúť.
 
* Druhá možnosť je dvakrát implementovať celý zásobník pre rôzne typy dát, kopírovanie a menenie kódu je však tiež niečo, čomu sa chceme vyhnúť.
* Najlepšie by bolo použiť techniku generického programovania, ktorá je k dispozícii vo veľa jazykoch, vrátane C++, ale nie C. Touto technikou vieme zásobník implementovať raz a použiť s rôznymi typmi.
+
* Najlepšie by bolo použiť techniku generického programovania, ktorá je k dispozícii vo veľa jazykoch, vrátane C++, ale nie C. Touto technikou vieme zásobník implementovať raz a použiť s rôznymi typmi. Ukážku tejto techniky uvidíme na poslednej prednáške a viac sa dozviete na Programovaní (2) v letnom semestri.
 +
 
 +
Na konci prednášky sme ešte prebrali úvodné časti [[Prednáška 20|prednášky 20]].
  
 
==Program na prácu s výrazmi==
 
==Program na prácu s výrazmi==
  
<pre>
+
<syntaxhighlight lang="C++">
 
#include <cstdio>
 
#include <cstdio>
 
#include <cctype>
 
#include <cctype>
Riadok 657: Riadok 591:
 
* Unárny operátor sa aplikuje iba na num1. */
 
* Unárny operátor sa aplikuje iba na num1. */
 
void applyOp(token opToken, token num1, token num2, token & result) {
 
void applyOp(token opToken, token num1, token num2, token & result) {
    // kontrola, že num1 a num2 sú čísla
 
    assert(num1.op == ' ' && num2.op == ' ');
 
 
     result.op = ' ';
 
     result.op = ' ';
 
     switch (opToken.op) {
 
     switch (opToken.op) {
Riadok 688: Riadok 620:
  
 
     for (int i = 0; i < tokens.length; i++) {
 
     for (int i = 0; i < tokens.length; i++) {
 +
        // aktuálny token zo vstupu
 
         token curToken = tokens.items[i];
 
         token curToken = tokens.items[i];
 
         if (curToken.op == ' ') {
 
         if (curToken.op == ' ') {
Riadok 785: Riadok 718:
 
     if (curToken.op == '~') {
 
     if (curToken.op == '~') {
 
         num1 = pop(numberStack);
 
         num1 = pop(numberStack);
        num2 = num1;
 
 
     } else {
 
     } else {
 
         num2 = pop(numberStack);
 
         num2 = pop(numberStack);
Riadok 862: Riadok 794:
  
 
/** Funkcia, ktorá v infixovom výraze zmení unárne mínus na ~ */
 
/** Funkcia, ktorá v infixovom výraze zmení unárne mínus na ~ */
void fixUnaryMinus(tokenSequence &infix) {
+
void fixUnaryMinus(tokenSequence & infix) {
 
     for (int i = 0; i < infix.length; i++) {
 
     for (int i = 0; i < infix.length; i++) {
         if(infix.items[i].op=='-'  
+
         if (infix.items[i].op == '-'
          && (i==0 || !isOperand(infix.items[i-1]))) {
+
                && (i == 0 || !isOperand(infix.items[i - 1]))) {
 
             infix.items[i].op = '~';
 
             infix.items[i].op = '~';
 
         }
 
         }
Riadok 871: Riadok 803:
 
}
 
}
  
/** Hlavný program načítava a vykonáva postupnosť príkazov tokenize, postfix, infix a end.  
+
/** Hlavný program načítava a vykonáva postupnosť príkazov tokenize, postfix, infix a end.
  * Príkaz tokenize tokenizuje a vypíše vstupný výraz.  
+
  * Príkaz tokenize tokenizuje a vypíše vstupný výraz.
  * Príkaz postfix načíta výraz v postfixovom formáte a vypíše jeho hodnotu.  
+
  * Príkaz postfix načíta výraz v postfixovom formáte a vypíše jeho hodnotu.
 
  * Príkaz infix načíta výraz v infixovom formáte, upraví v ňom unárne - na ~.
 
  * Príkaz infix načíta výraz v infixovom formáte, upraví v ňom unárne - na ~.
 
  * prevedie ho do postfixového formátu, vyhodnotí postfixový výraz a naopokon
 
  * prevedie ho do postfixového formátu, vyhodnotí postfixový výraz a naopokon
Riadok 921: Riadok 853:
 
     }
 
     }
 
}
 
}
</pre>
+
</syntaxhighlight>

Aktuálna revízia z 07:15, 2. december 2024

Oznamy

Prednášky

  • Tento týždeň a budúci pondelok ešte prednášky v normálnom režime.
  • Budúcu stredu 11.12. v prvej polovici prednášky informácie k skúške a rady k skúškovému všeobecne, potom doberieme posledné povinné učivo.
  • Posledný týždeň semestra v pondelok 16.12. nepovinná prednáška o nepreberaných črtách jazykov C a C++, v stredu 18.12. prednáška pravdepodobne nebude.

Cvičenia a úlohy

  • Cvičenia bežia normálne každý utorok, piatkové cvičenia už iba 2x.
  • Zajtrajšia rozcvička bude na papieri, môžete si priniesť ťahák, učivo po prednášku 17.
  • Tretiu domácu úlohu treba odovzdať do tohto piatka (6.12.) 22:00.

Semestrálny test

  • Budúcu stredu, viď oznamy z minulej prednášky.
  • Bude obsahovať učivo po prednášku 20 vrátane. Na opravnom termíne môže byť aj učivo z ďalších prednášok.
  • V stredu po prednáške na testovač pridáme niektoré príklady z budúcich cvičení, aby ste ich mohli vopred použiť ako tréning na písomku.

Na termíny sa bude dať prihlasovať od dnes 19:00

  • Kapacita termínov bude obmedzená, prihláste sa teda radšej skôr, neskôr to môžete zmeniť.
  • Ak vidíte konflikt niektorého termínu s hromadnou skúškou alebo písomkou z iného predmetu, dajte mi prosím vedieť čím skôr.
  • Decembrový termín odporúčame hlavne študentom, ktorým programovanie nerobí problémy.
  • Viac informácií o skúške je na stránke Zimný semester, skúška, spolu cez to prejdeme budúcu stredu.
  • Na testovač budúcu stredu pridáme zopár tréningových príkladov na skúšku.

Aritmetické výrazy

Nejaký čas sa teraz budeme venovať spracovaniu aritmetických výrazov pozostávajúcich z reálnych čísel, operácií +,-,*,/ a zátvoriek (,). Hlavnou úlohou je vyhodnotenie daného výrazu; napríklad pre výraz

(65 - 3 * 5) / (2 + 3)

chceme vedieť povedať, že jeho hodnota je 10. Najprv ale zavedieme dva alternatívne spôsoby zápisu aritmetických výrazov, z ktorých jeden nám vyhodnocovanie výrazov značne uľahčí.

Infixová notácia

  • Bežný spôsob zápisu aritmetických výrazov sa v matematike nazýva aj infixovou notáciou.
  • Binárne operátory (ako napríklad +,-,*,/) sa v tejto notácii píšu medzi svojimi dvoma operandmi.
  • Poradie vykonávania operácií sa riadi zátvorkami a prioritou operácií.

Napríklad

(65 – 3 * 5) / (2 + 3)

je infixový výraz s hodnotou 10.

Prefixová notácia

Pri prefixovej notácii (často podľa jej pôvodcu Jana Łukasiewicza nazývanej aj poľskou notáciou) sa každý operátor v aritmetickom výraze zapisuje pred svojimi dvoma operandmi.

Napríklad výraz (65 – 3 * 5) / (2 + 3) má prefixový zápis

/ - 65 * 3 5 + 2 3

Zaujímavosť: programovací jazyk Lisp a jeho varianty využívajú prefixovú notáciu na všetky výrazy, píšu však aj zátvorky, napríklad (+ 1 2).

Postfixová notácia

Pri postfixovej notácii (často nazývanej aj obrátenou poľskou notáciou) je situácia opačná: operátor sa zapisuje bezprostredne za svojimi dvoma operandmi.

Výraz (65 – 3 * 5) / (2 + 3) má teda postfixový zápis

65 3 5 * - 2 3 + /
  • Postfixová a prefixová notácia sú pre človeka o niečo ťažšie čitateľné, než bežná infixová notácia (čo môže byť aj otázkou zvyku).
  • Uvidíme však, že výrazy v postfixovej notácii sa dajú jednoducho vyhodnocovať.
  • Výhodou postfixovej a prefixovej notácie oproti infixovej je aj to, že nepotrebujú zátvorky.

Unárne mínus

  • Operátory +, * a / sú vždy binárne, čo znamená, že sa aplikujú sa na dva operandy.
  • Operátor - môže byť binárny aj unárny (unárny znamená, že sa aplikuje na jeden operand).
    • Príklad s binárnym mínus: 1 - 2.
    • Príklad s unárnym mínus: 2 * -(2 + 3).
  • Nevýhodou postfixovej a prefixovej notácie je, že bez zátvoriek v nich nie je možné rozpoznať binárne a unárne mínus.
    • Prefixový výraz - - 2 3 by napríklad mohol zodpovedať ako výrazu -2 - 3 aj výrazu -(2 - 3).
  • Na vyriešenie tohto problému budeme na unárne mínus používať znamienko ~ (iba interne v našom programe, nepoužíva sa tak všeobecne). V infixových výrazoch budú unárne mínus automaticky rozpoznané a nahradené ~.

Predspracovanie výrazu

Používateľ zadá výraz ako text v niektorej notácii. Aby sa nám s ním lepšie pracovalo, prevedieme ho najskôr na postupnosť symbolov (angl. token), pričom každý symbol bude buď číslo reprezentované v premennej typu double alebo znak reprezentujúci operátor alebo zátvorku.

Jednotlivé symboly budeme ukladať do záznamov typu token

struct token {
    char op;   
    double val;
};
  • Ak štruktúra obsahuje číslo, op bude medzera a samotné číslo bude v položke val.
  • Ak štruktúra reprezentuje iný symbol, tento symbol bude v položke op a položka val sa nebude používať.

Postupnosť symbolov uložíme do štruktúry tokenSequence, ktorá obsahuje pole položiek typu token a tiež koľko položiek bolo do poľa uložených.

struct tokenSequence {
    token * items;  // pole tokenov
    int size;       // veľkosť alokovaného poľa
    int length;     // počet tokenov uložených v poli
};


Napríklad pre výraz "(2.1+ 3.9) / 3" vznikne nasledujúca dátová štruktúra:

tokenSequence:
length: 7
size: nejaké číslo >= 7
items: pole s nasledovnými položkami

token items[0]: op '(', val ?
token items[1]: op ' ', val 2.1
token items[2]: op '+', val ?
token items[3]: op ' ', val 3.9
token items[4]: op ')', val ?
token items[5]: op '/', val ?
token items[6]: op ' ', val 3

Preklad výrazu na postupnosť symbolov realizuje funkcia tokenize.

  • Na načítanie čísla používame funkciu sscanf, ktorá vyzerá podobne ako scanf, ale načítava zo zadaného reťazca.
    • Ako reťazec zadáme &(str[strPos]), čo spôsobí, že sa začne načítavať od pozície strPos, mohli by sme písať aj str+strPos.
    • Formátovací znak %n nám do premennej skip uloží počet znakov, ktoré sa pri načítaní čísla použili, o tento počet potom posunieme premennú strPos.
  • Kód token newToken = {str[strPos], 0} inicializuje položku op na znak str[strPos] a položku val na nulu.
  • Pomocné funkcie init a addToken pracujú s postupnosťou symbolov, nájdete ich v programe na konci prednášky.
void tokenize(char * str, tokenSequence & tokens) {
    init(tokens, strlen(str));  // inicializujeme prázdnu postupnosť

    int strPos = 0;  // pozícia v rámci reťazca
    while (str[strPos] != 0) {  // kým nie sme na konci str
        if (isspace(str[strPos])) {  // preskakujeme biele znaky
            strPos++;
        } else if (isdigit(str[strPos]) || str[strPos] == '.') {
            // keď nájdeme cifru alebo bodku (začiatok čísla)
            double val;
            int skip;
            // načítame toto číslo pomocou sscanf, 
            // do skip uložíme počet znakov čísla
            sscanf(&(str[strPos]), "%lf%n", &val, &skip);
            // vytvoríme a uložíme token
            token newToken = {' ', val};
            addToken(tokens, newToken);
            // preskočíme všetky znaky čísla
            strPos += skip;
        } else {
            // spracovanie zátvoriek alebo operátora
            assert(strchr("+-/*()~", str[strPos]) != NULL);
            // vytvoríme a uložíme token
            token newToken = {str[strPos], 0};
            addToken(tokens, newToken);
            strPos++;
        }
    }
}

Vyhodnocovanie aritmetických výrazov v postfixovej notácii

  • Budeme používať zásobník, do ktorého budeme vkladať čísla čakajúce na spracovanie.
  • Operátor má v postfixovom zápise obidva operandy pred sebou. Keď narazíme na operátor, jeho operandy sme už prečítali a spracovali. Ide navyše o posledné dve prečítané alebo vypočítané hodnoty.

Výraz budeme postupne čítať zľava doprava:

  • Keď narazíme na číslo, vložíme ho na zásobník.
  • Keď narazíme na operátor:
    • Vyberieme zo zásobníka jeho dva operandy.
    • Prvé z týchto čísel je pritom druhým operandom a druhé z nich je prvým operandom.
    • Vykonáme s týmito operandmi danú operáciu a výsledok tejto operácie vložíme naspäť na zásobník.
  • Pri unárnom mínus vyberáme zo zásobníka iba jeden operand.
  • Tento postup opakujeme, až kým neprídeme na koniec výrazu. V tom okamihu by sme mali mať na zásobníku jediný prvok, výslednú hodnotu výrazu.

Technická poznámka:

  • Keďže vo výslednom programe budeme potrebovať zásobníky čísel aj znakov, používame v ňom zásobník položiek typu token. Ak by sme však robili čisto vyhodnocovanie postfixovej notácie, stačil by nám zásobník s prvkami typu double.

Cvičenie:

  • Odsimulujme činnosť tohto algoritmu na našom vstupe 65 3 5 * - 2 3 + /
  • Aké všelijaké prípady môžu nastať, keď na vstupe nemáme správny výraz v postfixovej notácii?
typedef token dataType;
// Nasleduje kód pre zásobník tokenov
// ...


/** Funkcia aplikuje operátor uložený v opToken na čísla
* uložené v num1 a num2, výsledok uloží ako číslo do result.
* Unárny operátor sa aplikuje iba na num1. */
void applyOp(token opToken, token num1, token num2, token & result) {
    result.op = ' ';
    switch (opToken.op) {
    case '~':
        result.val = -num1.val;
        break;
    case '+':
        result.val = num1.val + num2.val;
        break;
    case '-':
        result.val = num1.val - num2.val;
        break;
    case '*':
        result.val = num1.val * num2.val;
        break;
    case '/':
        result.val = num1.val / num2.val;
        break;
    default: // iné operátory nepovoľujeme.
        assert(false);
    }
}

/** Funkcia vyhodnotí a vráti hodnotou výrazu v postfixovom tvare. */
double evaluatePostfix(tokenSequence & tokens) {
    // zásobník, do ktorého ukladáme čísla
    stack numberStack;
    init(numberStack);

    for (int i = 0; i < tokens.length; i++) {
        // aktuálny token zo vstupu
        token curToken = tokens.items[i];
        if (curToken.op == ' ') {
            // čísla rovno ukladáme na zásobník
            push(numberStack, curToken);
        } else {
            // spracovanie operátora
            token num1, num2, result;
            // najskôr vyberieme 1 alebo 2 čísla zo zásobníka
            if (curToken.op == '~') {
                num1 = pop(numberStack);
            } else {
                num2 = pop(numberStack);
                num1 = pop(numberStack);
            }
            // na operandy aplikujeme operátor
            applyOp(curToken, num1, num2, result);
            // výsledné číslo uložíme na zásobník
            push(numberStack, result);
        }
    }
    // zo zásobníka vyberieme výsledné číslo
    token result = pop(numberStack);
    // skontrolujeme, že zásobník je prázdny a výsledok je číslo
    assert(isEmpty(numberStack) && result.op == ' ');
    // uvoľníme pamäť zásobníka
    destroy(numberStack);
    return result.val;
}

Prevod výrazu z infixovej do postfixovej notácie

  • Pre bežnú prax je dôležitejšie vyhodnocovanie výrazov v klasickej infixovej notácii.
  • Túto úlohu teraz vyriešime tak, že napíšeme funkciu, ktorá preloží aritmetický výraz z infixovej do postfixovej notácie.
  • Následne ho môžeme vyhodnotiť algoritmom popísaným vyššie.

Popis algoritmu

Uvažujme najprv výrazy bez zátvoriek a bez unárnych mínusov.

  • Pozostávajú teda z čísel a binárnych operátorov +, -, *, /, kde * a / majú vyššiu prioritu ako + a -.
  • Všetky tieto operátory sú navyše zľava asociatívne, t.j. napr. 30 / 6 / 5 je to isté ako (30 / 6) / 5.

Na prevod takéhoto výrazu do postfixového tvaru ním stačí prejsť zľava doprava a všimnúť si dve skutočnosti:

  • Poradie jednotlivých čísel v postfixovom výraze je rovnaké, ako v pôvodnom infixovom výraze.
  • Napríklad výraz 1 + 2 - 3 * 4 + 5 má postfixový tvar 1 2 + 3 4 * - 5 +.
  • Pri prechádzaní vstupným infixovým výrazom budeme teda čísla priamo pridávať do výstupného postfixového výrazu.
  • Každý operátor treba presunúť spomedzi jeho dvoch operandov za jeho druhý operand.
  • Ak teda vo vstupnom infixovom výraze narazíme na operátor, nepridáme ho hneď do výstupného výrazu, ale uložíme ho pre neskoršie pridanie na správnej pozícii.
  • Uložený operátor treba vypísať za jeho druhým operandom. Ak pritom aj samotný operand obsahuje nejaké ďalšie operátory, určite musia byť vypísané skôr. Operátory teda budeme ukladať na zásobník.
  • Keď vo vstupnom infixovom výraze narazíme na operátor, je možné, že tesne pred ním končí operand jedného alebo niekoľkých operátorov uložených na zásobníku. Vďaka ľavej asociatívnosti pritom ide o práve všetky operátory na vrchu zásobníka, ktoré majú vyššiu alebo rovnakú prioritu, ako nájdený operátor. Všetky tieto operátory teda postupne vyberieme zo zásobníka a vypíšeme ich do výstupného reťazca. Až následne na zásobník vložíme nájdený operátor.
  • Na konci vstupného reťazca vypíšeme všetky operátory, ktoré zostali na zásobníku.

Z technických dôvodov budeme na spodku zásobníka uchovávať „umelé dno” #, ktoré budeme chápať ako symbol s nižšou prioritou ako všetky operátory.

  • Situáciu, keď pri vyberaní operátorov zo zásobníka narazíme na jeho dno tak budeme môcť riešiť konzistentne so situáciou, keď narazíme na operátor s nižšou prioritou: v oboch prípadoch chceme s vyberaním prestať.

Na vstupnom výraze 1 + 2 - 3 * 4 + 5 bude práve popísaný algoritmus pracovať nasledovne:

Vstupný symbol  Výstupný výraz    Zásobník (dno vľavo) 
-------------------------------------------------------------------------------------------------------
           1                       #            vypíš 1 
                1                  #

           +    1                  #            # má nižšiu prioritu ako +, nevyberaj ho
                1                  # +          vlož + na zásobník

           2    1                  # +          vypíš 2
                1 2                # + 

           -    1 2                # +          + má rovnakú prioritu ako -, vyber + a vypíš
                1 2 +              #            # má nižšiu prioritu ako -, nevyberaj ho
                1 2 +              #            vlož - na zásobník
                1 2 +              # -   

           3    1 2 +              # -          vypíš 3
                1 2 + 3            # - 

           *    1 2 + 3            # -          - má nižšiu prioritu ako *, nevyberaj ho
                1 2 + 3            # - *        vlož * na zásobník

           4    1 2 + 3            # - *        vypíš 4
                1 2 + 3 4          # - *                     

           +    1 2 + 3 4          # - *        * má vyššiu prioritu ako +, vyber * a vypíš
                1 2 + 3 4 *        # -          - má rovnakú prioritu ako +, vyber - a vypíš
                1 2 + 3 4 * -      #            # má nižšiu prioritu ako +, nevyberaj ho
                1 2 + 3 4 * -      # +          vlož - na zásobník

           5    1 2 + 3 4 * -      # +          vypíš 5
                1 2 + 3 4 * - 5    # +                 

    [koniec]    1 2 + 3 4 * - 5    # +          vyber operátory na zásobníku a vypíš
                1 2 + 3 4 * - 5 +  #            <-- VÝSLEDNÝ POSTFIXOVÝ VÝRAZ

Pridanie zátvoriek:

  • Keď vo vstupnom infixovom reťazci narazíme na ľavú zátvorku, vložíme ju do zásobníka. Podobne ako pri # ju budeme považovať za symbol s nižšou prioritou, než všetky binárne operátory. To má dva dôsledky:
    • Pri vkladaní zátvorky teda nevyhadzujeme operátory zo zásobníka
    • Operátory vo vnútri zátvorky nespôsobia jej vyhodenie ani vyhodenie symbolov pod ňou
  • Keď narazíme na pravú zátvorku, potrebujeme vypísať všetky doposiaľ nevypísané operátory uzatvorené touto zátvorkou. Preto vyberieme a vypíšeme na výstup všetky operátory zo zásobníka až po prvú ľavú zátvorku (ktorú zo zásobníka taktiež vyberieme).

Pridanie unárneho mínus:

  • Unárne mínus má vyššiu prioritu ako binárne operátory. Predpokladáme, že ho máme zapísané ako ~.
  • Je však sprava asociatívne, t.j. --2 je to isté ako -(-2) a v postfixovom tvare to bude 2 ~ ~.
  • Preto ak je aktuálny operátor unárne mínus ~, nevyhadzujeme iné unárne mínus zo zásobníka. Toto je v programe dosiahnuté tak, že nové unárne mínus ("pravé") má vyššiu prioritu ako to, čo už je na zásobníku ("ľavé").

Implementácia

/** Pomocná funkcia, ktorá vráti prioritu operátora.
 * Argument right určuje, či ide o pravý z dvoch porovnávaných operátorov */
int priority(char op, bool right) {
    if (op == '#' || op == '(') return 0;
    if (op == '-' || op == '+') return 1;
    if (op == '*' || op == '/') return 2;
    if (op == '~' && !right) return 3;
    if (op == '~' && right) return 4;
    assert(false); // sem by sme sa nemali dostať
}

/** Skonvertuje infixový výraz infix do postfixovej formy */
void infixToPostfix(tokenSequence & infix, tokenSequence & postfix) {
    // inicializuje výslednú postupnosť tokenov
    init(postfix, infix.length);

    // vytvoríme zásobník operátorov a na spodok dáme #
    stack opStack;
    init(opStack);
    token curToken = {'#', 0};
    push(opStack, curToken);

    for (int i = 0; i < infix.length; i++) {
        // aktuálny token zo vstupu
        curToken = infix.items[i];
        if (curToken.op == ' ') {
            // čísla rovno skopírujeme do výstupu
            addToken(postfix, curToken);
        } else if (curToken.op == '(') {
            // začiatok zátvorky uložíme na zásobník
            push(opStack, curToken);
        } else if (curToken.op == ')') {
            // koniec zátvorky:
            // na výstup pridáme zo zásobníka operátory,
            // ktoré boli v zátvorke
            token popped = pop(opStack);
            while (popped.op != '(') {
                addToken(postfix, popped);
                popped = pop(opStack);
            }
        } else {
            // spracovanie operátora:
            // na výstup pridáme zo zásobníka operátory s vyššou prioritou
            int p = priority(curToken.op, true);
            while (priority(peek(opStack).op, false) >= p) {
                token popped = pop(opStack);
                addToken(postfix, popped);
            }
            // aktuálny operátor dáme na zásobník
            push(opStack, curToken);
        }
    }

    // zvyšné operátory presunieme zo zásobníka na výstup
    while (peek(opStack).op != '#') {
        token popped = pop(opStack);
        addToken(postfix, popped);
    }
    destroy(opStack);
}

Cvičenie: Rozšírte program vyššie o operáciu umocňovania ^ s prioritou vyššou ako * (dajte pozor na fakt, že umocňovanie je na rozdiel od operácií +, -, *, / sprava asociatívne).


Predspracovanie unárneho mínus

  • Pre prevodom infixového výrazu do postfixového tvaru potrebujeme v infixovom výraze nahradiť unárne mínus znakom ~.
  • Robí to funkcia fixUnaryMinus.
  • Mínus je v korektnom infixovom výraze unárne práve vtedy, keď nenasleduje za číslom, ani za pravou zátvorkou, čo testuje pomocná funkcia isOperand.
/** Pomocná funkcia, ktorá vráti, či token je koncom operandu v infixovej notácii */
bool isOperand(token curToken) {
    return curToken.op == ' ' || curToken.op == ')';
}

/** Funkcia, ktorá v infixovom výraze zmení unárne mínus na ~ */
void fixUnaryMinus(tokenSequence & infix) {
    for (int i = 0; i < infix.length; i++) {
        if(infix.items[i].op == '-' 
           && (i == 0 || !isOperand(infix.items[i - 1]))) {
            infix.items[i].op = '~';
        }
    }
}

Záverečné poznámky

  • Infixové výrazy vieme vyhodnotiť tak, že najskôr ich prevedieme na postfixové a tie potom vyhodnotíme.
    • Pri vyhodnocovaní postfixovej formy používame zásobník čísel (operandov).
    • Pri prevode z infixovej formy na postfixovú používame zásobník operátorov.
  • Obidva procesy sa dajú vykonávať aj súčasne (počas prechodu výrazom používame jeden zásobník čísel a jeden zásobník operátorov).
  • Všeobecnejšie a elegantnejšie prístupy k analýze a vyhodnocovaniu výrazov ale aj celých programov uvidíte na predmete Kompilátory (Mgr. štúdium), ktorý využíva poznatky z predmetu Formálne jazyky a automaty (semester 2Z).


Typ dát na zásobníku

V našom programe sme potrebovali zásobník čísel aj zásobník znakov.

  • Vyriešili sme to tým, že na zásobník dávame položky typu token, ktoré obsahujú znak aj číslo.
  • Nie je to však príliš elegantné a plytve pamäťou na nepotrebné údaje.
  • Druhá možnosť je dvakrát implementovať celý zásobník pre rôzne typy dát, kopírovanie a menenie kódu je však tiež niečo, čomu sa chceme vyhnúť.
  • Najlepšie by bolo použiť techniku generického programovania, ktorá je k dispozícii vo veľa jazykoch, vrátane C++, ale nie C. Touto technikou vieme zásobník implementovať raz a použiť s rôznymi typmi. Ukážku tejto techniky uvidíme na poslednej prednáške a viac sa dozviete na Programovaní (2) v letnom semestri.

Na konci prednášky sme ešte prebrali úvodné časti prednášky 20.

Program na prácu s výrazmi

#include <cstdio>
#include <cctype>
#include <cassert>
#include <cstring>
using namespace std;

/** Štruktúra pre jednu súčasť výrazu: znamienko alebo číslo */
struct token {
    char op;     // znamienko alebo medzera, ak ide o číslo
    double val;  // číselná hodnota, ak je op medzera
};

/** Štruktúra pre postupnosť tokenov */
struct tokenSequence {
    token * items;  // pole tokenov
    int size;       // veľkosť alokovaného poľa
    int length;     // počet tokenov uložených v poli
};

/** Funkcia inicializuje prázdnu postupnosť tokenov
pričom alokuje pole požadovanej veľkosti. */
void init(tokenSequence & tokens, int size) {
    tokens.items = new token[size];
    tokens.size = size;
    tokens.length = 0;
}

/** Funkcia do postupnosti tokenov pridá nový token. */
void addToken(tokenSequence & tokens, token & newToken) {
    assert(tokens.length < tokens.size);
    tokens.items[tokens.length] = newToken;
    tokens.length++;
}

/** Funkcia odalokuje pamäť alokovanú pre postupnosť tokenov */
void destroy(tokenSequence & tokens) {
    delete[] tokens.items;
}

/** Funkcia vypíše postupnosť tokenov, každý v hranatých zátvorkách. */
void printTokens(tokenSequence & tokens) {
    for (int i = 0; i < tokens.length; i++) {
        token curToken = tokens.items[i];
        if (curToken.op == ' ') {
            printf(" [val %g]", curToken.val);
        } else {
            printf(" [op %c]", curToken.op);
        }
    }
    printf("\n");
}

/** Funkcia vypíše postupnosť tokenov ako aritmetický výraz. */
void printTokenExpression(tokenSequence & tokens) {
    for (int i = 0; i < tokens.length; i++) {
        token curToken = tokens.items[i];
        if (curToken.op == ' ') {
            printf(" %g", curToken.val);
        } else {
            printf(" %c", curToken.op);
        }
    }
    printf("\n");
}

/** Funkcia konvertuje výraz z reťazca na postupnosť tokenov. */
void tokenize(char * str, tokenSequence & tokens) {
    init(tokens, strlen(str));  // inicializujeme prázdnu postupnosť

    int strPos = 0;  // pozícia v rámci reťazca
    while (str[strPos] != 0) {  // kým nie sme na konci str
        if (isspace(str[strPos])) {  // preskakujeme biele znaky
            strPos++;
        } else if (isdigit(str[strPos]) || str[strPos] == '.') {
            // keď nájdeme cifru alebo bodku (začiatok čísla)
            double val;
            int skip;
            // načítame toto číslo pomocou sscanf, do skip uložíme počet znakov čísla
            sscanf(&(str[strPos]), "%lf%n", &val, &skip);
            // vytvoríme a uložíme token
            token newToken = {' ', val};
            addToken(tokens, newToken);
            // preskočíme všetky znaky čísla
            strPos += skip;
        } else {
            // spracovanie zátvoriek alebo operátora
            assert(strchr("+-/*()~", str[strPos]) != NULL);
            // vytvoríme a uložíme token
            token newToken = {str[strPos], 0};
            addToken(tokens, newToken);
            strPos++;
        }
    }
}

// Nasleduje kód pre zásobník tokenov
typedef token dataType;

/** Uzol spájaného zoznamu pre zásobník */
struct node {
    dataType data; // dáta uložené v uzle
    node * next;   // smerník na ďalší uzol zoznamu
};

/** Štruktúra pre zásobník implementovaný pomocou zoznamu*/
struct stack {
    node * top; // Smernik na vrch zasobníka  alebo NULL
};

/** Funkcia inicializuje prázdny zásobník */
void init(stack & s) {
    s.top = NULL;
}

/** Funkcia zistí, či je zásobník prázdny */
bool isEmpty(stack & s) {
    return s.top == NULL;
}

/** Funkcia pridá prvok item na vrch zásobníka */
void push(stack & s, dataType item) {
    node * tmp = new node;
    tmp->data = item;
    tmp->next = s.top;
    s.top = tmp;
}

/** Funkcia odoberie prvok z vrchu zasobnika a vráti ho */
dataType pop(stack & s) {
    assert(!isEmpty(s));
    dataType result = s.top->data;
    node * tmp = s.top->next;
    delete s.top;
    s.top = tmp;
    return result;
}

/** Funkcia vráti prvok na vrchu zásobníka, ale nechá ho v zásobníku */
dataType peek(stack & s) {
    assert(!isEmpty(s));
    return s.top->data;
}

/** Funkcia uvoľní pamäť zásobníka */
void destroy(stack & s) {
    while (!isEmpty(s)) {
        pop(s);
    }
}

/** Funkcia aplikuje operátor uložený v opToken na čísla
* uložené v num1 a num2, výsledok uloží ako číslo do result.
* Unárny operátor sa aplikuje iba na num1. */
void applyOp(token opToken, token num1, token num2, token & result) {
    result.op = ' ';
    switch (opToken.op) {
    case '~':
        result.val = -num1.val;
        break;
    case '+':
        result.val = num1.val + num2.val;
        break;
    case '-':
        result.val = num1.val - num2.val;
        break;
    case '*':
        result.val = num1.val * num2.val;
        break;
    case '/':
        result.val = num1.val / num2.val;
        break;
    default: // iné operátory nepovoľujeme.
        assert(false);
    }
}

/** Funkcia vyhodnotí a vráti hodnotou výrazu v postfixovom tvare. */
double evaluatePostfix(tokenSequence & tokens) {
    // zásobník, do ktorého ukladáme čísla
    stack numberStack;
    init(numberStack);

    for (int i = 0; i < tokens.length; i++) {
        // aktuálny token zo vstupu
        token curToken = tokens.items[i];
        if (curToken.op == ' ') {
            // čísla rovno ukladáme na zásobník
            push(numberStack, curToken);
        } else {
            // spracovanie operátora
            token num1, num2, result;
            // najskôr vyberieme 1 alebo 2 čísla zo zásobníka
            if (curToken.op == '~') {
                num1 = pop(numberStack);
            } else {
                num2 = pop(numberStack);
                num1 = pop(numberStack);
            }
            // na operandy aplikujeme operátor
            applyOp(curToken, num1, num2, result);
            // výsledné číslo uložíme na zásobník
            push(numberStack, result);
        }
    }
    // zo zásobníka vyberieme výsledné číslo
    token result = pop(numberStack);
    // skontrolujeme, že zásobník je prázdny a výsledok je číslo
    assert(isEmpty(numberStack) && result.op == ' ');
    // uvoľníme pamäť zásobníka
    destroy(numberStack);
    return result.val;
}

/** Pomocná funkcia, ktorá vráti prioritu operátora.
* Argument right určuje, či ide o pravý z dvoch porovnávaných operátorov */
int priority(char op, bool right) {
    if (op == '#' || op == '(') return 0;
    if (op == '-' || op == '+') return 1;
    if (op == '*' || op == '/') return 2;
    if (op == '~' && !right) return 3;
    if (op == '~' && right) return 4;
    assert(false); // sem by sme sa nemali dostať
}

/** Skonvertuje infixový výraz infix do postfixovej formy */
void infixToPostfix(tokenSequence & infix, tokenSequence & postfix) {
    // inicializuje výslednú postupnosť tokenov
    init(postfix, infix.length);

    // vytvoríme zásobník operátorov a na spodok dáme #
    stack opStack;
    init(opStack);
    token curToken = {'#', 0};
    push(opStack, curToken);

    for (int i = 0; i < infix.length; i++) {
        // aktuálny token zo vstupu
        curToken = infix.items[i];
        if (curToken.op == ' ') {
            // čísla rovno skopírujeme do výstupu
            addToken(postfix, curToken);
        } else if (curToken.op == '(') {
            // začiatok zátvorky uložíme na zásobník
            push(opStack, curToken);
        } else if (curToken.op == ')') {
            // koniec zátvorky:
            // na výstup pridáme zo zásobníka operátory,
            // ktoré boli v zátvorke
            token popped = pop(opStack);
            while (popped.op != '(') {
                addToken(postfix, popped);
                popped = pop(opStack);
            }
        } else {
            // spracovanie operátora:
            // na výstup pridáme zo zásobníka operátory s vyššou prioritou
            int p = priority(curToken.op, true);
            while (priority(peek(opStack).op, false) >= p) {
                token popped = pop(opStack);
                addToken(postfix, popped);
            }
            // aktuálny operátor dáme na zásobník
            push(opStack, curToken);
        }
    }

    // zvyšné operátory presunieme zo zásobníka na výstup
    while (peek(opStack).op != '#') {
        token popped = pop(opStack);
        addToken(postfix, popped);
    }
    destroy(opStack);
}

/** Pomocná funkcia, ktorá zo zásobníka vyberie
* jedno alebo dve čísla, aplikuje na nich operátor a výsledok uloží na zásobník. */
void processOp(stack & numberStack, token curToken) {
    token num1, num2, result;
    // najskôr vyberieme 1 alebo 2 čísla zo zásobníka
    if (curToken.op == '~') {
        num1 = pop(numberStack);
    } else {
        num2 = pop(numberStack);
        num1 = pop(numberStack);
    }
    // na operandy aplikujeme operátor
    applyOp(curToken, num1, num2, result);
    // výsledné číslo uložíme na zásobník
    push(numberStack, result);
}

/** Spočíta hodnotu výrau v infixovej forme,
 * kombinuje infixToPostfix a evaluatePostfix */
double evaluateInfix(tokenSequence & infix) {
    // zásobník, do ktorého ukladáme čísla
    stack numberStack;
    init(numberStack);

    // vytvoríme zásobník operátorov a na spodok dáme #
    stack opStack;
    init(opStack);
    token curToken = {'#', 0};
    push(opStack, curToken);

    for (int i = 0; i < infix.length; i++) {
        // aktuálny token zo vstupu
        curToken = infix.items[i];
        if (curToken.op == ' ') {
            // čísla ukladáme na zásobník
            push(numberStack, curToken);
        } else if (curToken.op == '(') {
            // začiatok zátvorky uložíme na zásobník
            push(opStack, curToken);
        } else if (curToken.op == ')') {
            // koniec zátvorky:
            // spracujeme zo zásobníka operátory,
            // ktoré boli v zátvorke
            token popped = pop(opStack);
            while (popped.op != '(') {
                processOp(numberStack, popped);
                popped = pop(opStack);
            }
        } else {
            // spracovanie operátora:
            // spracujeme zo zásobníka operátory s vyššou prioritou
            int p = priority(curToken.op, true);
            while (priority(peek(opStack).op, false) >= p) {
                token popped = pop(opStack);
                processOp(numberStack, popped);
            }
            // aktuálny operátor dáme na zásobník
            push(opStack, curToken);
        }
    }

    // spracujeme zvyšné operátory zo zásobníka
    while (peek(opStack).op != '#') {
        token popped = pop(opStack);
        processOp(numberStack, popped);
    }
    destroy(opStack);

    // zo zásobníka vyberieme výsledné číslo
    token result = pop(numberStack);
    // skontrolujeme, že ásobník je prázdny a výsledok je číslo
    assert(isEmpty(numberStack) && result.op == ' ');
    // uvoľníme pamäť zásobníka čísel
    destroy(numberStack);
    return result.val;
}

/** Pomocná funkcia, ktorá vráti, či token je koncom operandu v infixovej notácii */
bool isOperand(token curToken) {
    return curToken.op == ' ' || curToken.op == ')';
}

/** Funkcia, ktorá v infixovom výraze zmení unárne mínus na ~ */
void fixUnaryMinus(tokenSequence & infix) {
    for (int i = 0; i < infix.length; i++) {
        if (infix.items[i].op == '-'
                && (i == 0 || !isOperand(infix.items[i - 1]))) {
            infix.items[i].op = '~';
        }
    }
}

/** Hlavný program načítava a vykonáva postupnosť príkazov tokenize, postfix, infix a end.
 * Príkaz tokenize tokenizuje a vypíše vstupný výraz.
 * Príkaz postfix načíta výraz v postfixovom formáte a vypíše jeho hodnotu.
 * Príkaz infix načíta výraz v infixovom formáte, upraví v ňom unárne - na ~.
 * prevedie ho do postfixového formátu, vyhodnotí postfixový výraz a naopokon
 * vyhodnotí aj priamo infixovú formu výrazu.  */
int main() {
    const int maxLine = 100;
    char command[maxLine];
    char expression[maxLine];

    while (true) {
        int ret = scanf("%s", command);
        if (ret < 1 || strcmp(command, "end") == 0) {
            break;
        } else if (strcmp(command, "tokenize") == 0) {
            fgets(expression, maxLine, stdin);
            tokenSequence tokens;
            tokenize(expression, tokens);
            printf(" tokens:");
            printTokens(tokens);
            destroy(tokens);
        } else if (strcmp(command, "postfix") == 0) {
            fgets(expression, maxLine, stdin);
            tokenSequence postfix;
            tokenize(expression, postfix);
            double value = evaluatePostfix(postfix);
            printf(" value: %g\n", value);
            destroy(postfix);
        }
        if (strcmp(command, "infix") == 0) {
            fgets(expression, maxLine, stdin);
            tokenSequence infix;
            tokenize(expression, infix);
            fixUnaryMinus(infix);
            printf(" infix:");
            printTokenExpression(infix);
            tokenSequence postfix;
            infixToPostfix(infix, postfix);
            printf(" postfix:");
            printTokenExpression(postfix);
            double value = evaluatePostfix(postfix);
            printf(" value of postfix: %g\n", value);
            double value2 = evaluateInfix(infix);
            printf(" value of infix: %g\n", value2);
            destroy(infix);
            destroy(postfix);
        }
    }
}