Programovanie (1) v C/C++
1-INF-127, ZS 2025/26

Úvod · Pravidlá · Prednášky · Softvér · Testovač
· Kontaktujte nás pomocou e-mailovej adresy E-prg.png (bude odpovedať ten z nás, kto má príslušnú otázku na starosti alebo kto má práve čas).
· Prosíme študentov, aby si pravidelne čítali e-maily na @uniba.sk adrese.


Prednáška 20: Rozdiel medzi revíziami

Z Programovanie
Skočit na navigaci Skočit na vyhledávání
Riadok 17: Riadok 17:
 
** Čo si ukladáme do zásobníka?
 
** Čo si ukladáme do zásobníka?
  
== Aritmetický výraz ako strom ==
+
=== Unárne mínus===
  
[[Image:PROG-P21-aritm.png|thumb|right|Strom pre výraz <tt>(65 – 3 * 5)/(2 + 3)</tt>]]
+
* Operátory +, * a  / sú vždy '''binárne''', čo znamená, že sa aplikujú sa na dva operandy.
 +
* Operátor - môže byť binárny aj '''unárny''' (unárny znamená, že sa aplikuje na jeden operand).
 +
** Príklad s binárnym mínus: <tt>1 - 2</tt>.
 +
** Príklad s unárnym mínus: <tt>2 * -(2 + 3)</tt>.
 +
* Nevýhodou postfixovej a prefixovej notácie je, že bez zátvoriek v nich nie je možné rozpoznať binárne a unárne mínus.
 +
** Prefixový výraz <tt>- - 2 3</tt> by napríklad mohol zodpovedať ako výrazu <tt>-2 - 3</tt> aj výrazu <tt>-(2 - 3)</tt>.
 +
* Na vyriešenie tohto problému budeme na unárne mínus používať znamienko <tt>~</tt> (iba interne v našom programe, nepoužíva sa tak všeobecne). V infixových výrazoch budú unárne mínus automaticky rozpoznané a nahradené <tt>~</tt>.
  
Aritmetické výrazy môžeme veľmi prirodzene reprezentovať vo forme ''stromu''
+
== Predspracovanie výrazu ==
* Operátory a čísla tvoria tzv. ''uzly'' (alebo ''vrcholy'') stromu.
 
* Operátory tvoria tzv. ''vnútorné uzly'' stromu, každý z nich má dve ''deti'' zodpovedajúce podvýrazom pre jednotlivé operandy.
 
** Pre jednoduchosť na dnešnej prednáške neuvažujeme unárne mínus, dalo by sa však ľahko dorobiť.
 
* Čísla tvoria tzv. ''listy'' stromu, tie už nemajú žiadne deti.
 
* Strom obsahuje jediný uzol, ktorý nemá rodiča. Tento sa nazýva ''koreň'' stromu a reprezentuje celý aritmetický výraz.
 
* Informatici stromy väčšinou kreslia &bdquo;hore nohami&rdquo;, s koreňom na vrchu.
 
  
Uzol takéhoto stromu tak môžeme reprezentovať napríklad nasledujúcou štruktúrou:
+
Používateľ zadá výraz ako text v niektorej notácii. Aby sa nám s ním lepšie pracovalo, prevedieme ho najskôr na postupnosť symbolov (angl. '''token'''), pričom každý symbol bude buď číslo reprezentované v premennej typu <tt>double</tt> alebo znak reprezentujúci operátor alebo zátvorku.
  
 +
Jednotlivé symboly budeme ukladať do záznamov typu <tt>token</tt>
 
<syntaxhighlight lang="C++">
 
<syntaxhighlight lang="C++">
struct treeNode {
+
struct token {
     // číselná hodnota (len v listoch)
+
     char op; 
 
     double val;
 
     double val;
 +
};
 +
</syntaxhighlight>
 +
* Ak štruktúra obsahuje číslo, <tt>op</tt> bude medzera a samotné číslo bude v položke <tt>val</tt>.
 +
* Ak štruktúra reprezentuje iný symbol, tento symbol bude v položke <tt>op</tt> a položka <tt>val</tt> sa nebude používať.
  
    // operátor vo vnútorných uzloch, pre listy medzera
+
Postupnosť symbolov uložíme do štruktúry <tt>tokenSequence</tt>, ktorá obsahuje pole položiek typu <tt>token</tt> a tiež koľko položiek bolo do poľa uložených.
     char op;
+
<syntaxhighlight lang="C++">
 
+
struct tokenSequence {
     // smerníky na podstromy
+
     token * items; // pole tokenov
     treeNode * left, * right;
+
     int size;      // veľkosť alokovaného poľa
 +
     int length;     // počet tokenov uložených v poli
 
};
 
};
 
</syntaxhighlight>
 
</syntaxhighlight>
  
Pre vnútorné uzly stromu (zodpovedajúce operátorom) pritom:
 
* Smerníky <tt>left</tt> a <tt>right</tt> budú ukazovať na korene podstromov reprezentujúcich ľavý resp. pravý podvýraz.
 
* Znak <tt>op</tt> bude zodpovedať danému operátoru (napríklad <tt>'+'</tt>).
 
* Hodnota <tt>val</tt> ostane nevyužitá.
 
  
Pre listy (zodpovedajúce číselným hodnotám) naopak:
+
Napríklad pre výraz <tt>"(2.1+  3.9) / 3"</tt> vznikne nasledujúca dátová štruktúra:
* Smerníky <tt>left</tt> a <tt>right</tt> budú mať hodnotu <tt>NULL</tt>.
+
<pre>
* Znak <tt>op</tt> bude medzera <tt>' '</tt> (podľa <tt>op</tt> teda môžeme rozlišovať, či ide o číslo alebo o operátor).
+
tokenSequence:
* Vo <tt>val</tt> bude uložená hodnota daného čísla.
+
length: 7
 +
size: nejaké číslo >= 7
 +
items: pole s nasledovnými položkami
 +
 
 +
token items[0]: op '(', val ?
 +
token items[1]: op ' ', val 2.1
 +
token items[2]: op '+', val ?
 +
token items[3]: op ' ', val 3.9
 +
token items[4]: op ')', val ?
 +
token items[5]: op '/', val ?
 +
token items[6]: op ' ', val 3
 +
</pre>
 +
 
 +
Preklad výrazu na postupnosť symbolov realizuje funkcia <tt>tokenize</tt>.
 +
* Na načítanie čísla používame funkciu <tt>sscanf</tt>, ktorá vyzerá podobne ako <tt>scanf</tt>, ale načítava zo zadaného reťazca.
 +
** Ako reťazec zadáme <tt>&(str[strPos])</tt>, čo spôsobí, že sa začne načítavať od pozície <tt>strPos</tt>, mohli by sme písať aj <tt>str+strPos</tt>.
 +
** Formátovací znak <tt>%n</tt> nám do premennej <tt>skip</tt> uloží počet znakov, ktoré sa pri načítaní čísla použili, o tento počet potom posunieme premennú <tt>strPos</tt>.
 +
* Kód token <tt>newToken = {str[strPos], 0}</tt> inicializuje položku <tt>op</tt> na znak <tt>str[strPos]</tt> a položku <tt>val</tt> na nulu.
 +
* Pomocné funkcie <tt>init</tt> a <tt>addToken</tt> pracujú s postupnosťou symbolov, nájdete ich v [[#Program_na_pr.C3.A1cu_s_v.C3.BDrazmi|programe na konci prednášky]].
 +
 
 +
<syntaxhighlight lang="C++">
 +
void tokenize(char * str, tokenSequence & tokens) {
 +
    init(tokens, strlen(str));  // inicializujeme prázdnu postupnosť
 +
 
 +
    int strPos = 0;  // pozícia v rámci reťazca
 +
    while (str[strPos] != 0) {  // kým nie sme na konci str
 +
        if (isspace(str[strPos])) {  // preskakujeme biele znaky
 +
            strPos++;
 +
        } else if (isdigit(str[strPos]) || str[strPos] == '.') {
 +
            // keď nájdeme cifru alebo bodku (začiatok čísla)
 +
            double val;
 +
            int skip;
 +
            // načítame toto číslo pomocou sscanf,
 +
            // do skip uložíme počet znakov čísla
 +
            sscanf(&(str[strPos]), "%lf%n", &val, &skip);
 +
            // vytvoríme a uložíme token
 +
            token newToken = {' ', val};
 +
            addToken(tokens, newToken);
 +
            // preskočíme všetky znaky čísla
 +
            strPos += skip;
 +
        } else {
 +
            // spracovanie zátvoriek alebo operátora
 +
            assert(strchr("+-/*()~", str[strPos]) != NULL);
 +
            // vytvoríme a uložíme token
 +
            token newToken = {str[strPos], 0};
 +
            addToken(tokens, newToken);
 +
            strPos++;
 +
        }
 +
    }
 +
}
 +
</syntaxhighlight>
 +
 
 +
== Vyhodnocovanie aritmetických výrazov v postfixovej notácii ==
  
Celý strom pritom budeme reprezentovať jeho koreňom.
+
* Budeme používať '''zásobník''', do ktorého budeme vkladať '''čísla''' čakajúce na spracovanie.
 +
* Operátor má v postfixovom zápise obidva operandy pred sebou. Keď narazíme na operátor, jeho operandy sme už prečítali a spracovali. Ide navyše o '''posledné dve''' prečítané alebo vypočítané hodnoty.
  
V tejto reprezentácii sú niektoré položky štruktúry <tt>treeNode</tt> nevyužité (napr. <tt>val</tt> vo vnútorných vrcholoch). S využitím objektového programovania (letný semester) budeme vedieť stromy pre aritmetické výrazy reprezentovať elegantnejšie.
+
Výraz budeme postupne čítať zľava doprava:
 +
* Keď narazíme na číslo, vložíme ho na zásobník.
 +
* Keď narazíme na operátor:
 +
** Vyberieme zo zásobníka jeho dva operandy.
 +
** Prvé z týchto čísel je pritom druhým operandom a druhé z nich je prvým operandom.
 +
** Vykonáme s týmito operandmi danú operáciu a výsledok tejto operácie vložíme naspäť na zásobník.
 +
* Pri unárnom mínus vyberáme zo zásobníka iba jeden operand.
 +
* Tento postup opakujeme, až kým neprídeme na koniec výrazu. V tom okamihu by sme mali mať na zásobníku jediný prvok, výslednú hodnotu výrazu.  
  
=== Vytvorenie uzlu ===
+
Technická poznámka:
 +
* Keďže vo [[#Program_na_pr.C3.A1cu_s_v.C3.BDrazmi|výslednom programe]] budeme potrebovať zásobníky čísel aj znakov, používame v ňom zásobník položiek typu <tt>token</tt>. Ak by sme však robili čisto vyhodnocovanie postfixovej notácie, stačil by nám zásobník s prvkami typu <tt>double</tt>.
  
Nasledujúce funkcie vytvoria nový vnútorný uzol (pre operátor) resp. nový list (pre číslo):
+
'''Cvičenie:'''
 +
* Odsimulujme činnosť tohto algoritmu na našom vstupe <tt>65 3 5 * - 2 3 + /</tt>
 +
* Aké všelijaké prípady môžu nastať, keď na vstupe nemáme správny výraz v postfixovej notácii?
  
 
<syntaxhighlight lang="C++">
 
<syntaxhighlight lang="C++">
treeNode * createOp(char op, treeNode * left, treeNode * right) {
+
typedef token dataType;
     treeNode * v = new treeNode;
+
// Nasleduje kód pre zásobník tokenov
     v->left = left;
+
// ...
     v->right = right;
+
 
     v->op = op;
+
 
     return v;  
+
/** Funkcia aplikuje operátor uložený v opToken na čísla
 +
* uložené v num1 a num2, výsledok uloží ako číslo do result.
 +
* Unárny operátor sa aplikuje iba na num1. */
 +
void applyOp(token opToken, token num1, token num2, token & result) {
 +
     result.op = ' ';
 +
     switch (opToken.op) {
 +
    case '~':
 +
        result.val = -num1.val;
 +
        break;
 +
    case '+':
 +
        result.val = num1.val + num2.val;
 +
        break;
 +
     case '-':
 +
        result.val = num1.val - num2.val;
 +
        break;
 +
     case '*':
 +
        result.val = num1.val * num2.val;
 +
        break;
 +
    case '/':
 +
        result.val = num1.val / num2.val;
 +
        break;
 +
     default: // iné operátory nepovoľujeme.
 +
        assert(false);
 +
    }
 
}
 
}
  
treeNode * createNum(double val) {
+
/** Funkcia vyhodnotí a vráti hodnotou výrazu v postfixovom tvare. */
     treeNode * v = new treeNode;
+
double evaluatePostfix(tokenSequence & tokens) {
    v->left = NULL;
+
     // zásobník, do ktorého ukladáme čísla
     v->right = NULL;
+
    stack numberStack;
     v->op = ' ';
+
    init(numberStack);
     v->val = val;
+
 
     return v;
+
    for (int i = 0; i < tokens.length; i++) {
 +
        // aktuálny token zo vstupu
 +
        token curToken = tokens.items[i];
 +
        if (curToken.op == ' ') {
 +
            // čísla rovno ukladáme na zásobník
 +
            push(numberStack, curToken);
 +
        } else {
 +
            // spracovanie operátora
 +
            token num1, num2, result;
 +
            // najskôr vyberieme 1 alebo 2 čísla zo zásobníka
 +
            if (curToken.op == '~') {
 +
                num1 = pop(numberStack);
 +
            } else {
 +
                num2 = pop(numberStack);
 +
                num1 = pop(numberStack);
 +
            }
 +
            // na operandy aplikujeme operátor
 +
            applyOp(curToken, num1, num2, result);
 +
            // výsledné číslo uložíme na zásobník
 +
            push(numberStack, result);
 +
        }
 +
    }
 +
     // zo zásobníka vyberieme výsledné číslo
 +
    token result = pop(numberStack);
 +
     // skontrolujeme, že zásobník je prázdny a výsledok je číslo
 +
    assert(isEmpty(numberStack) && result.op == ' ');
 +
     // uvoľníme pamäť zásobníka
 +
    destroy(numberStack);
 +
     return result.val;
 
}
 
}
 
</syntaxhighlight>
 
</syntaxhighlight>
  
&bdquo;Ručne&rdquo; teraz môžeme vytvoriť strom pre výraz <tt>(65 – 3 * 5)/(2 + 3)</tt>:
+
== Prevod výrazu z infixovej do postfixovej notácie ==
 +
 
 +
* Pre bežnú prax je dôležitejšie vyhodnocovanie výrazov v klasickej infixovej notácii.
 +
* Túto úlohu teraz vyriešime tak, že napíšeme funkciu, ktorá preloží aritmetický výraz z infixovej do postfixovej notácie.
 +
* Následne ho môžeme vyhodnotiť algoritmom popísaným vyššie.
 +
 
 +
=== Popis algoritmu ===
 +
 
 +
Uvažujme najprv výrazy bez zátvoriek a bez unárnych mínusov.
 +
* Pozostávajú teda z čísel a binárnych operátorov <tt>+, -, *, /</tt>, kde <tt>*</tt> a <tt>/</tt> majú vyššiu prioritu ako <tt>+</tt> a <tt>-</tt>.
 +
* Všetky tieto operátory sú navyše zľava asociatívne, t.j. napr. <tt>30 / 6 / 5</tt> je to isté ako  <tt>(30 / 6) / 5</tt>.
 +
 
 +
Na prevod takéhoto výrazu do postfixového tvaru ním stačí prejsť zľava doprava a všimnúť si dve skutočnosti:
 +
* Poradie jednotlivých čísel v postfixovom výraze je rovnaké, ako v pôvodnom infixovom výraze.
 +
* Napríklad výraz <tt>1 + 2 - 3 * 4 + 5</tt> má postfixový tvar <tt>1 2 + 3 4 * - 5 +</tt>.
 +
* Pri prechádzaní vstupným infixovým výrazom budeme teda čísla priamo pridávať do výstupného postfixového výrazu.
 +
* Každý operátor treba presunúť spomedzi jeho dvoch operandov za jeho druhý operand.
 +
* Ak teda vo vstupnom infixovom výraze narazíme na operátor, nepridáme ho hneď do výstupného výrazu, ale uložíme ho pre neskoršie pridanie na správnej pozícii.
 +
* Uložený operátor treba vypísať za jeho druhým operandom. Ak pritom aj samotný operand obsahuje nejaké ďalšie operátory, určite musia byť vypísané skôr. Operátory teda budeme ukladať na zásobník.
 +
* Keď vo vstupnom infixovom výraze narazíme na operátor, je možné, že tesne pred ním končí operand jedného alebo niekoľkých operátorov uložených na zásobníku. Vďaka ľavej asociatívnosti pritom ide o práve všetky operátory na vrchu zásobníka, ktoré majú vyššiu alebo rovnakú prioritu, ako nájdený operátor. Všetky tieto operátory teda postupne vyberieme zo zásobníka a vypíšeme ich do výstupného reťazca. Až následne na zásobník vložíme nájdený operátor.
 +
* Na konci vstupného reťazca vypíšeme všetky operátory, ktoré zostali na zásobníku.
 +
 
 +
Z technických dôvodov budeme na spodku zásobníka uchovávať &bdquo;umelé dno&rdquo; <tt>#</tt>, ktoré budeme chápať ako symbol s nižšou prioritou ako všetky operátory.
 +
* Situáciu, keď pri vyberaní operátorov zo zásobníka narazíme na jeho dno tak budeme môcť riešiť konzistentne so situáciou, keď  narazíme na operátor s nižšou prioritou: v oboch prípadoch chceme s vyberaním prestať. 
 +
 
 +
Na vstupnom výraze <tt>1 + 2 - 3 * 4 + 5</tt> bude práve popísaný algoritmus pracovať nasledovne:
 +
<pre>
 +
Vstupný symbol  Výstupný výraz    Zásobník (dno vľavo)
 +
-------------------------------------------------------------------------------------------------------
 +
          1                      #            vypíš 1
 +
                1                  #
 +
 
 +
          +    1                  #            # má nižšiu prioritu ako +, nevyberaj ho
 +
                1                  # +          vlož + na zásobník
 +
 
 +
          2    1                  # +          vypíš 2
 +
                1 2                # +
 +
 
 +
          -    1 2                # +          + má rovnakú prioritu ako -, vyber + a vypíš
 +
                1 2 +              #            # má nižšiu prioritu ako -, nevyberaj ho
 +
                1 2 +              #            vlož - na zásobník
 +
                1 2 +              # - 
 +
 
 +
          3   1 2 +              # -          vypíš 3
 +
                1 2 + 3            # -
 +
 
 +
          *   1 2 + 3            # -          - má nižšiu prioritu ako *, nevyberaj ho
 +
                1 2 + 3            # - *        vlož * na zásobník
 +
 
 +
          4    1 2 + 3            # - *        vypíš 4
 +
                1 2 + 3 4          # - *                   
 +
 
 +
          +    1 2 + 3 4          # - *        * má vyššiu prioritu ako +, vyber * a vypíš
 +
                1 2 + 3 4 *        # -          - má rovnakú prioritu ako +, vyber - a vypíš
 +
                1 2 + 3 4 * -      #            # má nižšiu prioritu ako +, nevyberaj ho
 +
                1 2 + 3 4 * -      # +          vlož - na zásobník
 +
 
 +
          5    1 2 + 3 4 * -      # +          vypíš 5
 +
                1 2 + 3 4 * - 5   # +               
 +
 
 +
    [koniec]    1 2 + 3 4 * - 5    # +          vyber operátory na zásobníku a vypíš
 +
                1 2 + 3 4 * - 5 +  #            <-- VÝSLEDNÝ POSTFIXOVÝ VÝRAZ
 +
</pre>
 +
 
 +
Pridanie zátvoriek:
 +
* Keď vo vstupnom infixovom reťazci narazíme na ľavú zátvorku, vložíme ju do zásobníka. Podobne ako pri <tt>#</tt> ju budeme považovať za symbol s nižšou prioritou, než všetky binárne operátory. To má dva dôsledky:
 +
** Pri vkladaní zátvorky teda nevyhadzujeme operátory zo zásobníka
 +
** Operátory vo vnútri zátvorky nespôsobia jej vyhodenie ani vyhodenie symbolov pod ňou
 +
* Keď narazíme na pravú zátvorku, potrebujeme vypísať všetky doposiaľ nevypísané operátory uzatvorené touto zátvorkou. Preto vyberieme a vypíšeme na výstup všetky operátory zo zásobníka až po prvú ľavú zátvorku (ktorú zo zásobníka taktiež vyberieme).
 +
 
 +
Pridanie unárneho mínus:
 +
* Unárne mínus má vyššiu prioritu ako binárne operátory. Predpokladáme, že ho máme zapísané ako <tt>~</tt>.
 +
* Je však sprava asociatívne, t.j. <tt>--2</tt> je to isté ako <tt>-(-2)</tt> a v postfixovom tvare to bude <tt>2 ~ ~</tt>.
 +
* Preto ak je aktuálny operátor unárne mínus <tt>~</tt>, nevyhadzujeme iné unárne mínus zo zásobníka. Toto je v programe dosiahnuté tak, že nové unárne mínus ("pravé") má vyššiu prioritu ako to, čo už je na zásobníku ("ľavé").
 +
 
 +
=== Implementácia ===
 +
 
 
<syntaxhighlight lang="C++">
 
<syntaxhighlight lang="C++">
treeNode * root = createOp('/',  
+
/** Pomocná funkcia, ktorá vráti prioritu operátora.
                    createOp('-',  
+
* Argument right určuje, či ide o pravý z dvoch porovnávaných operátorov */
                      createNum(65),
+
int priority(char op, bool right) {
                      createOp('*', createNum(3), createNum(5))),
+
    if (op == '#' || op == '(') return 0;
                    createOp('+', createNum(2), createNum(3)));
+
    if (op == '-' || op == '+') return 1;
 +
    if (op == '*' || op == '/') return 2;
 +
    if (op == '~' && !right) return 3;
 +
    if (op == '~' && right) return 4;
 +
    assert(false); // sem by sme sa nemali dostať
 +
}
 +
 
 +
/** Skonvertuje infixový výraz infix do postfixovej formy */
 +
void infixToPostfix(tokenSequence & infix, tokenSequence & postfix) {
 +
    // inicializuje výslednú postupnosť tokenov
 +
    init(postfix, infix.length);
 +
 
 +
    // vytvoríme zásobník operátorov a na spodok dáme #
 +
    stack opStack;
 +
    init(opStack);
 +
    token curToken = {'#', 0};
 +
    push(opStack, curToken);
 +
 
 +
    for (int i = 0; i < infix.length; i++) {
 +
        // aktuálny token zo vstupu
 +
        curToken = infix.items[i];
 +
        if (curToken.op == ' ') {
 +
            // čísla rovno skopírujeme do výstupu
 +
            addToken(postfix, curToken);
 +
        } else if (curToken.op == '(') {
 +
            // začiatok zátvorky uložíme na zásobník
 +
            push(opStack, curToken);
 +
        } else if (curToken.op == ')') {
 +
            // koniec zátvorky:
 +
            // na výstup pridáme zo zásobníka operátory,
 +
            // ktoré boli v zátvorke
 +
            token popped = pop(opStack);
 +
            while (popped.op != '(') {
 +
                addToken(postfix, popped);
 +
                popped = pop(opStack);
 +
            }
 +
        } else {
 +
            // spracovanie operátora:
 +
            // na výstup pridáme zo zásobníka operátory s vyššou prioritou
 +
            int p = priority(curToken.op, true);
 +
            while (priority(peek(opStack).op, false) >= p) {
 +
                token popped = pop(opStack);
 +
                addToken(postfix, popped);
 +
            }
 +
            // aktuálny operátor dáme na zásobník
 +
            push(opStack, curToken);
 +
        }
 +
    }
 +
 
 +
    // zvyšné operátory presunieme zo zásobníka na výstup
 +
    while (peek(opStack).op != '#') {
 +
        token popped = pop(opStack);
 +
        addToken(postfix, popped);
 +
    }
 +
    destroy(opStack);
 +
}
 
</syntaxhighlight>
 
</syntaxhighlight>
Alebo po častiach:
+
 
 +
''Cvičenie'': Rozšírte program vyššie o operáciu umocňovania <tt>^</tt> s prioritou vyššou ako <tt>*</tt> (dajte pozor na fakt, že umocňovanie je na rozdiel od operácií <tt>+, -, *, /</tt> sprava asociatívne).
 +
 
 +
 
 +
== Predspracovanie unárneho mínus ==
 +
 
 +
* Pre prevodom infixového výrazu do postfixového tvaru potrebujeme v infixovom výraze nahradiť unárne mínus znakom <tt>~</tt>.
 +
* Robí to funkcia <tt>fixUnaryMinus</tt>.
 +
* Mínus je v korektnom infixovom výraze unárne práve vtedy, keď nenasleduje za číslom, ani za pravou zátvorkou, čo testuje pomocná funkcia <tt>isOperand</tt>.
 +
 
 
<syntaxhighlight lang="C++">
 
<syntaxhighlight lang="C++">
treeNode * v65 = createNum(65);
+
/** Pomocná funkcia, ktorá vráti, či token je koncom operandu v infixovej notácii */
treeNode * v3 = createNum(3);
+
bool isOperand(token curToken) {
treeNode * v5 = createNum(5);
+
    return curToken.op == ' ' || curToken.op == ')';
treeNode * v2 = createNum(2);
+
}
treeNode * v3b = createNum(3);
+
 
treeNode * vKrat = createOp('*', v3, v5);
+
/** Funkcia, ktorá v infixovom výraze zmení unárne mínus na ~ */
treeNode * vMinus = createOp('-', v65, vKrat);
+
void fixUnaryMinus(tokenSequence & infix) {
treeNode * vPlus = createOp('+', v2, v3b);
+
    for (int i = 0; i < infix.length; i++) {
treeNode * vDeleno = createOp('/', vMinus, vPlus);
+
        if(infix.items[i].op == '-'  
 +
          && (i == 0 || !isOperand(infix.items[i - 1]))) {
 +
            infix.items[i].op = '~';
 +
        }
 +
    }
 +
}
 
</syntaxhighlight>
 
</syntaxhighlight>
  
=== Ďalší plán ===
+
==Záverečné poznámky==
Ďalej uvidíme:
+
 
* jednoduchú rekurzívnu funkciu na vyhodnotenie výrazu uloženého ako strom,
+
* Infixové výrazy vieme vyhodnotiť tak, že najskôr ich prevedieme na postfixové a tie potom vyhodnotíme.
* ďalšie rekurzívne funkcie na uvoľnenie pamäte stromu a výpis výrazu,
+
** Pri vyhodnocovaní postfixovej formy používame zásobník čísel (operandov).
* funkciu na vytvorenie stromu z postfixového výrazu.
+
** Pri prevode z infixovej formy na postfixovú používame zásobník operátorov.
 +
* Obidva procesy sa dajú vykonávať aj súčasne (počas prechodu výrazom používame jeden zásobník čísel a jeden zásobník operátorov).
 +
** Toto je pre zaujímavosť implementované vo funkcii <tt>evaluateInfix</tt> v [[#Program_na_pr.C3.A1cu_s_v.C3.BDrazmi|priloženom programe]].
 +
* Všeobecnejšie a elegantnejšie prístupy k analýze a vyhodnocovaniu výrazov ale aj celých programov uvidíte na predmete Kompilátory (Mgr. štúdium), ktorý využíva poznatky z predmetu Formálne jazyky a automaty (semester 2Z).
  
Stromy majú v informatike veľa využití, nielen na aritmetické výrazy. Ďalej sa teda budeme venovať práci so stromami všeobecne.
 
  
=== Vypísanie výrazu reprezentovaného stromom v rôznych notáciách ===
+
=== Typ dát na zásobníku ===
  
Infixovú, prefixovú, resp. postfixovú reprezentáciu aritmetického výrazu reprezentovaného stromom s koreňom <tt>root</tt> možno získať pomocou nasledujúcich funkcií.  
+
V našom programe sme potrebovali zásobník čísel aj zásobník znakov.
* Opäť používajú rekurziu na prejdenie celého stromu.
+
* Vyriešili sme to tým, že na zásobník dávame položky typu <tt>token</tt>, ktoré obsahujú znak aj číslo.  
* Líšia sa hlavne umiestnením príkazu na vypísanie operátora (pred, medzi alebo za rekurzívnym vypísaním podvýrazov).
+
* Nie je to však príliš elegantné a plytve pamäťou na nepotrebné údaje.
* Infixová notácia potrebuje aj zátvorky. Táto funkcia ich pre istotu dáva všade. Rozmyslite si, ako by sme ich vedeli vypísať iba tam, kde treba.
+
* Druhá možnosť je dvakrát implementovať celý zásobník pre rôzne typy dát, kopírovanie a menenie kódu je však tiež niečo, čomu sa chceme vyhnúť.
* Ako by sme funkcie rozšírili pre unárne mínus?
+
* Najlepšie by bolo použiť techniku generického programovania, ktorá je k dispozícii vo veľa jazykoch, vrátane C++, ale nie C. Touto technikou vieme zásobník implementovať raz a použiť s rôznymi typmi. Ukážku tejto techniky uvidíme na poslednej prednáške a viac sa dozviete na Programovaní (2) v letnom semestri.
 +
 
 +
Na konci prednášky sme ešte prebrali úvodné časti [[Prednáška 20|prednášky 20]].
 +
 
 +
==Program na prácu s výrazmi==
  
 
<syntaxhighlight lang="C++">
 
<syntaxhighlight lang="C++">
/** Funkcia vypíše aritmetický výraz v inorder poradí */
+
#include <cstdio>
void printInorder(treeNode * root) {
+
#include <cctype>
     if (root->op == ' ') {
+
#include <cassert>
         printf("%g", root->val);
+
#include <cstring>
 +
using namespace std;
 +
 
 +
/** Štruktúra pre jednu súčasť výrazu: znamienko alebo číslo */
 +
struct token {
 +
    char op;    // znamienko alebo medzera, ak ide o číslo
 +
    double val;  // číselná hodnota, ak je op medzera
 +
};
 +
 
 +
/** Štruktúra pre postupnosť tokenov */
 +
struct tokenSequence {
 +
    token * items;  // pole tokenov
 +
    int size;      // veľkosť alokovaného poľa
 +
    int length;    // počet tokenov uložených v poli
 +
};
 +
 
 +
/** Funkcia inicializuje prázdnu postupnosť tokenov
 +
pričom alokuje pole požadovanej veľkosti. */
 +
void init(tokenSequence & tokens, int size) {
 +
    tokens.items = new token[size];
 +
    tokens.size = size;
 +
    tokens.length = 0;
 +
}
 +
 
 +
/** Funkcia do postupnosti tokenov pridá nový token. */
 +
void addToken(tokenSequence & tokens, token & newToken) {
 +
    assert(tokens.length < tokens.size);
 +
    tokens.items[tokens.length] = newToken;
 +
    tokens.length++;
 +
}
 +
 
 +
/** Funkcia odalokuje pamäť alokovanú pre postupnosť tokenov */
 +
void destroy(tokenSequence & tokens) {
 +
    delete[] tokens.items;
 +
}
 +
 
 +
/** Funkcia vypíše postupnosť tokenov, každý v hranatých zátvorkách. */
 +
void printTokens(tokenSequence & tokens) {
 +
    for (int i = 0; i < tokens.length; i++) {
 +
        token curToken = tokens.items[i];
 +
        if (curToken.op == ' ') {
 +
            printf(" [val %g]", curToken.val);
 +
        } else {
 +
            printf(" [op %c]", curToken.op);
 +
        }
 +
    }
 +
    printf("\n");
 +
}
 +
 
 +
/** Funkcia vypíše postupnosť tokenov ako aritmetický výraz. */
 +
void printTokenExpression(tokenSequence & tokens) {
 +
     for (int i = 0; i < tokens.length; i++) {
 +
        token curToken = tokens.items[i];
 +
        if (curToken.op == ' ') {
 +
            printf(" %g", curToken.val);
 +
         } else {
 +
            printf(" %c", curToken.op);
 +
        }
 +
    }
 +
    printf("\n");
 +
}
 +
 
 +
/** Funkcia konvertuje výraz z reťazca na postupnosť tokenov. */
 +
void tokenize(char * str, tokenSequence & tokens) {
 +
    init(tokens, strlen(str));  // inicializujeme prázdnu postupnosť
 +
 
 +
    int strPos = 0;  // pozícia v rámci reťazca
 +
    while (str[strPos] != 0) {  // kým nie sme na konci str
 +
        if (isspace(str[strPos])) {  // preskakujeme biele znaky
 +
            strPos++;
 +
        } else if (isdigit(str[strPos]) || str[strPos] == '.') {
 +
            // keď nájdeme cifru alebo bodku (začiatok čísla)
 +
            double val;
 +
            int skip;
 +
            // načítame toto číslo pomocou sscanf, do skip uložíme počet znakov čísla
 +
            sscanf(&(str[strPos]), "%lf%n", &val, &skip);
 +
            // vytvoríme a uložíme token
 +
            token newToken = {' ', val};
 +
            addToken(tokens, newToken);
 +
            // preskočíme všetky znaky čísla
 +
            strPos += skip;
 +
        } else {
 +
            // spracovanie zátvoriek alebo operátora
 +
            assert(strchr("+-/*()~", str[strPos]) != NULL);
 +
            // vytvoríme a uložíme token
 +
            token newToken = {str[strPos], 0};
 +
            addToken(tokens, newToken);
 +
            strPos++;
 +
        }
 +
    }
 +
}
 +
 
 +
// Nasleduje kód pre zásobník tokenov
 +
typedef token dataType;
 +
 
 +
/** Uzol spájaného zoznamu pre zásobník */
 +
struct node {
 +
    dataType data; // dáta uložené v uzle
 +
    node * next;  // smerník na ďalší uzol zoznamu
 +
};
 +
 
 +
/** Štruktúra pre zásobník implementovaný pomocou zoznamu*/
 +
struct stack {
 +
    node * top; // Smernik na vrch zasobníka  alebo NULL
 +
};
 +
 
 +
/** Funkcia inicializuje prázdny zásobník */
 +
void init(stack & s) {
 +
    s.top = NULL;
 +
}
 +
 
 +
/** Funkcia zistí, či je zásobník prázdny */
 +
bool isEmpty(stack & s) {
 +
    return s.top == NULL;
 +
}
 +
 
 +
/** Funkcia pridá prvok item na vrch zásobníka */
 +
void push(stack & s, dataType item) {
 +
    node * tmp = new node;
 +
    tmp->data = item;
 +
    tmp->next = s.top;
 +
    s.top = tmp;
 +
}
 +
 
 +
/** Funkcia odoberie prvok z vrchu zasobnika a vráti ho */
 +
dataType pop(stack & s) {
 +
    assert(!isEmpty(s));
 +
    dataType result = s.top->data;
 +
    node * tmp = s.top->next;
 +
    delete s.top;
 +
    s.top = tmp;
 +
    return result;
 +
}
 +
 
 +
/** Funkcia vráti prvok na vrchu zásobníka, ale nechá ho v zásobníku */
 +
dataType peek(stack & s) {
 +
    assert(!isEmpty(s));
 +
    return s.top->data;
 +
}
 +
 
 +
/** Funkcia uvoľní pamäť zásobníka */
 +
void destroy(stack & s) {
 +
    while (!isEmpty(s)) {
 +
        pop(s);
 +
    }
 +
}
 +
 
 +
/** Funkcia aplikuje operátor uložený v opToken na čísla
 +
* uložené v num1 a num2, výsledok uloží ako číslo do result.
 +
* Unárny operátor sa aplikuje iba na num1. */
 +
void applyOp(token opToken, token num1, token num2, token & result) {
 +
    result.op = ' ';
 +
    switch (opToken.op) {
 +
    case '~':
 +
        result.val = -num1.val;
 +
        break;
 +
    case '+':
 +
        result.val = num1.val + num2.val;
 +
        break;
 +
    case '-':
 +
        result.val = num1.val - num2.val;
 +
        break;
 +
    case '*':
 +
        result.val = num1.val * num2.val;
 +
        break;
 +
    case '/':
 +
        result.val = num1.val / num2.val;
 +
        break;
 +
    default: // iné operátory nepovoľujeme.
 +
        assert(false);
 +
    }
 +
}
 +
 
 +
/** Funkcia vyhodnotí a vráti hodnotou výrazu v postfixovom tvare. */
 +
double evaluatePostfix(tokenSequence & tokens) {
 +
    // zásobník, do ktorého ukladáme čísla
 +
    stack numberStack;
 +
    init(numberStack);
 +
 
 +
    for (int i = 0; i < tokens.length; i++) {
 +
        // aktuálny token zo vstupu
 +
        token curToken = tokens.items[i];
 +
        if (curToken.op == ' ') {
 +
            // čísla rovno ukladáme na zásobník
 +
            push(numberStack, curToken);
 +
        } else {
 +
            // spracovanie operátora
 +
            token num1, num2, result;
 +
            // najskôr vyberieme 1 alebo 2 čísla zo zásobníka
 +
            if (curToken.op == '~') {
 +
                num1 = pop(numberStack);
 +
            } else {
 +
                num2 = pop(numberStack);
 +
                num1 = pop(numberStack);
 +
            }
 +
            // na operandy aplikujeme operátor
 +
            applyOp(curToken, num1, num2, result);
 +
            // výsledné číslo uložíme na zásobník
 +
            push(numberStack, result);
 +
        }
 +
    }
 +
    // zo zásobníka vyberieme výsledné číslo
 +
    token result = pop(numberStack);
 +
    // skontrolujeme, že zásobník je prázdny a výsledok je číslo
 +
    assert(isEmpty(numberStack) && result.op == ' ');
 +
    // uvoľníme pamäť zásobníka
 +
    destroy(numberStack);
 +
    return result.val;
 +
}
 +
 
 +
/** Pomocná funkcia, ktorá vráti prioritu operátora.
 +
* Argument right určuje, či ide o pravý z dvoch porovnávaných operátorov */
 +
int priority(char op, bool right) {
 +
    if (op == '#' || op == '(') return 0;
 +
    if (op == '-' || op == '+') return 1;
 +
    if (op == '*' || op == '/') return 2;
 +
    if (op == '~' && !right) return 3;
 +
    if (op == '~' && right) return 4;
 +
    assert(false); // sem by sme sa nemali dostať
 +
}
 +
 
 +
/** Skonvertuje infixový výraz infix do postfixovej formy */
 +
void infixToPostfix(tokenSequence & infix, tokenSequence & postfix) {
 +
    // inicializuje výslednú postupnosť tokenov
 +
    init(postfix, infix.length);
 +
 
 +
    // vytvoríme zásobník operátorov a na spodok dáme #
 +
    stack opStack;
 +
    init(opStack);
 +
    token curToken = {'#', 0};
 +
    push(opStack, curToken);
 +
 
 +
    for (int i = 0; i < infix.length; i++) {
 +
        // aktuálny token zo vstupu
 +
        curToken = infix.items[i];
 +
        if (curToken.op == ' ') {
 +
            // čísla rovno skopírujeme do výstupu
 +
            addToken(postfix, curToken);
 +
        } else if (curToken.op == '(') {
 +
            // začiatok zátvorky uložíme na zásobník
 +
            push(opStack, curToken);
 +
        } else if (curToken.op == ')') {
 +
            // koniec zátvorky:
 +
            // na výstup pridáme zo zásobníka operátory,
 +
            // ktoré boli v zátvorke
 +
            token popped = pop(opStack);
 +
            while (popped.op != '(') {
 +
                addToken(postfix, popped);
 +
                popped = pop(opStack);
 +
            }
 +
        } else {
 +
            // spracovanie operátora:
 +
            // na výstup pridáme zo zásobníka operátory s vyššou prioritou
 +
            int p = priority(curToken.op, true);
 +
            while (priority(peek(opStack).op, false) >= p) {
 +
                token popped = pop(opStack);
 +
                addToken(postfix, popped);
 +
            }
 +
            // aktuálny operátor dáme na zásobník
 +
            push(opStack, curToken);
 +
        }
 +
    }
 +
 
 +
    // zvyšné operátory presunieme zo zásobníka na výstup
 +
    while (peek(opStack).op != '#') {
 +
        token popped = pop(opStack);
 +
        addToken(postfix, popped);
 +
    }
 +
    destroy(opStack);
 +
}
 +
 
 +
/** Pomocná funkcia, ktorá zo zásobníka vyberie
 +
* jedno alebo dve čísla, aplikuje na nich operátor a výsledok uloží na zásobník. */
 +
void processOp(stack & numberStack, token curToken) {
 +
    token num1, num2, result;
 +
    // najskôr vyberieme 1 alebo 2 čísla zo zásobníka
 +
    if (curToken.op == '~') {
 +
        num1 = pop(numberStack);
 
     } else {
 
     } else {
         printf("(");
+
         num2 = pop(numberStack);
         printInorder(root->left);
+
         num1 = pop(numberStack);
        printf(" %c ", root->op);
 
        printInorder(root->right);
 
        printf(")");
 
 
     }
 
     }
 +
    // na operandy aplikujeme operátor
 +
    applyOp(curToken, num1, num2, result);
 +
    // výsledné číslo uložíme na zásobník
 +
    push(numberStack, result);
 
}
 
}
  
/** Funkcia vypíše aritmetický výraz v preorder poradí */
+
/** Spočíta hodnotu výrau v infixovej forme,
void printPreorder(treeNode * root) {
+
* kombinuje infixToPostfix a evaluatePostfix */
     if (root->op == ' ') {
+
double evaluateInfix(tokenSequence & infix) {
         printf("%g ", root->val);
+
    // zásobník, do ktorého ukladáme čísla
    } else {
+
    stack numberStack;
         printf("%c ", root->op);
+
    init(numberStack);
         printPreorder(root->left);
+
 
         printPreorder(root->right);
+
    // vytvoríme zásobník operátorov a na spodok dáme #
 +
    stack opStack;
 +
    init(opStack);
 +
    token curToken = {'#', 0};
 +
    push(opStack, curToken);
 +
 
 +
     for (int i = 0; i < infix.length; i++) {
 +
        // aktuálny token zo vstupu
 +
        curToken = infix.items[i];
 +
        if (curToken.op == ' ') {
 +
            // čísla ukladáme na zásobník
 +
            push(numberStack, curToken);
 +
         } else if (curToken.op == '(') {
 +
            // začiatok zátvorky uložíme na zásobník
 +
            push(opStack, curToken);
 +
        } else if (curToken.op == ')') {
 +
            // koniec zátvorky:
 +
            // spracujeme zo zásobníka operátory,
 +
            // ktoré boli v zátvorke
 +
            token popped = pop(opStack);
 +
            while (popped.op != '(') {
 +
                processOp(numberStack, popped);
 +
                popped = pop(opStack);
 +
            }
 +
         } else {
 +
            // spracovanie operátora:
 +
            // spracujeme zo zásobníka operátory s vyššou prioritou
 +
            int p = priority(curToken.op, true);
 +
            while (priority(peek(opStack).op, false) >= p) {
 +
                token popped = pop(opStack);
 +
                processOp(numberStack, popped);
 +
            }
 +
            // aktuálny operátor dáme na zásobník
 +
            push(opStack, curToken);
 +
        }
 +
    }
 +
 
 +
    // spracujeme zvyšné operátory zo zásobníka
 +
    while (peek(opStack).op != '#') {
 +
        token popped = pop(opStack);
 +
         processOp(numberStack, popped);
 +
    }
 +
    destroy(opStack);
 +
 
 +
    // zo zásobníka vyberieme výsledné číslo
 +
    token result = pop(numberStack);
 +
    // skontrolujeme, že ásobník je prázdny a výsledok je číslo
 +
    assert(isEmpty(numberStack) && result.op == ' ');
 +
    // uvoľníme pamäť zásobníka čísel
 +
    destroy(numberStack);
 +
    return result.val;
 +
}
 +
 
 +
/** Pomocná funkcia, ktorá vráti, či token je koncom operandu v infixovej notácii */
 +
bool isOperand(token curToken) {
 +
    return curToken.op == ' ' || curToken.op == ')';
 +
}
 +
 
 +
/** Funkcia, ktorá v infixovom výraze zmení unárne mínus na ~ */
 +
void fixUnaryMinus(tokenSequence & infix) {
 +
    for (int i = 0; i < infix.length; i++) {
 +
         if (infix.items[i].op == '-'
 +
                && (i == 0 || !isOperand(infix.items[i - 1]))) {
 +
            infix.items[i].op = '~';
 +
        }
 
     }
 
     }
 
}
 
}
  
/** Funkcia vypíše aritmetický výraz v postorder poradí */
+
/** Hlavný program načítava a vykonáva postupnosť príkazov tokenize, postfix, infix a end.
void printPostorder(treeNode * root) {
+
* Príkaz tokenize tokenizuje a vypíše vstupný výraz.
     if (root->op == ' ') {
+
* Príkaz postfix načíta výraz v postfixovom formáte a vypíše jeho hodnotu.
         printf("%g ", root->val);
+
* Príkaz infix načíta výraz v infixovom formáte, upraví v ňom unárne - na ~.
    } else {
+
* prevedie ho do postfixového formátu, vyhodnotí postfixový výraz a naopokon
        printPostorder(root->left);
+
* vyhodnotí aj priamo infixovú formu výrazu.  */
        printPostorder(root->right);
+
int main() {
        printf("%c ", root->op);
+
     const int maxLine = 100;
 +
    char command[maxLine];
 +
    char expression[maxLine];
 +
 
 +
    while (true) {
 +
        int ret = scanf("%s", command);
 +
        if (ret < 1 || strcmp(command, "end") == 0) {
 +
            break;
 +
         } else if (strcmp(command, "tokenize") == 0) {
 +
            fgets(expression, maxLine, stdin);
 +
            tokenSequence tokens;
 +
            tokenize(expression, tokens);
 +
            printf(" tokens:");
 +
            printTokens(tokens);
 +
            destroy(tokens);
 +
        } else if (strcmp(command, "postfix") == 0) {
 +
            fgets(expression, maxLine, stdin);
 +
            tokenSequence postfix;
 +
            tokenize(expression, postfix);
 +
            double value = evaluatePostfix(postfix);
 +
            printf(" value: %g\n", value);
 +
            destroy(postfix);
 +
        }
 +
        if (strcmp(command, "infix") == 0) {
 +
            fgets(expression, maxLine, stdin);
 +
            tokenSequence infix;
 +
            tokenize(expression, infix);
 +
            fixUnaryMinus(infix);
 +
            printf(" infix:");
 +
            printTokenExpression(infix);
 +
            tokenSequence postfix;
 +
            infixToPostfix(infix, postfix);
 +
            printf(" postfix:");
 +
            printTokenExpression(postfix);
 +
            double value = evaluatePostfix(postfix);
 +
            printf(" value of postfix: %g\n", value);
 +
            double value2 = evaluateInfix(infix);
 +
            printf(" value of infix: %g\n", value2);
 +
            destroy(infix);
 +
            destroy(postfix);
 +
        }
 
     }
 
     }
 
}
 
}
 
</syntaxhighlight>
 
</syntaxhighlight>
  
=== Vytvorenie stromu z postfixového výrazu ===
+
== Vytvorenie stromu z postfixového výrazu ==
  
 
Pripomeňme si z [[Prednáška 19|minulej prednášky]] funkciu na vyhodnocovanie postfixového výrazu:
 
Pripomeňme si z [[Prednáška 19|minulej prednášky]] funkciu na vyhodnocovanie postfixového výrazu:

Verzia zo dňa a času 13:45, 28. november 2025

Oznamy

  • Na testovači dnes pribudnú nejaké úlohy z budúcich cvičení, ktoré vám pomôžu s prípravou na test.
  • V piatok sú cvičenia nepovinné, budú na nich vzorové riešenia testu. Môžeme vám tiež poradiť s riešením úloh z cvičení alebo domácej úlohy, prípadne ak máte otázky k ukážkovým príkladom na test.
  • Termín DÚ3 je v piatok večer.
  • Takisto do piatka je potrebné hlásiť záujem o prípadný preklad zadaní, viď informácie k testu

Opakovanie z minulej prednášky

Aritmetické výrazy

  • Bežná infixová notácia, napr. (65 – 3*5)/(2 + 3)
  • Postfixová notácia 65 3 5 * - 2 3 + /
  • Prefixová notácia / - 65 * 3 5 + 2 3
  • Prefixová a postfixová notácia nepotrebujú zátvorky
  • Prevod z infixovej notácie na postfixovú pomocou zásobníka
    • Čo si ukladáme do zásobníka?
  • Vyhodnocovanie postfixovej notácie pomocou zásobníka
    • Čo si ukladáme do zásobníka?

Unárne mínus

  • Operátory +, * a / sú vždy binárne, čo znamená, že sa aplikujú sa na dva operandy.
  • Operátor - môže byť binárny aj unárny (unárny znamená, že sa aplikuje na jeden operand).
    • Príklad s binárnym mínus: 1 - 2.
    • Príklad s unárnym mínus: 2 * -(2 + 3).
  • Nevýhodou postfixovej a prefixovej notácie je, že bez zátvoriek v nich nie je možné rozpoznať binárne a unárne mínus.
    • Prefixový výraz - - 2 3 by napríklad mohol zodpovedať ako výrazu -2 - 3 aj výrazu -(2 - 3).
  • Na vyriešenie tohto problému budeme na unárne mínus používať znamienko ~ (iba interne v našom programe, nepoužíva sa tak všeobecne). V infixových výrazoch budú unárne mínus automaticky rozpoznané a nahradené ~.

Predspracovanie výrazu

Používateľ zadá výraz ako text v niektorej notácii. Aby sa nám s ním lepšie pracovalo, prevedieme ho najskôr na postupnosť symbolov (angl. token), pričom každý symbol bude buď číslo reprezentované v premennej typu double alebo znak reprezentujúci operátor alebo zátvorku.

Jednotlivé symboly budeme ukladať do záznamov typu token

struct token {
    char op;   
    double val;
};
  • Ak štruktúra obsahuje číslo, op bude medzera a samotné číslo bude v položke val.
  • Ak štruktúra reprezentuje iný symbol, tento symbol bude v položke op a položka val sa nebude používať.

Postupnosť symbolov uložíme do štruktúry tokenSequence, ktorá obsahuje pole položiek typu token a tiež koľko položiek bolo do poľa uložených.

struct tokenSequence {
    token * items;  // pole tokenov
    int size;       // veľkosť alokovaného poľa
    int length;     // počet tokenov uložených v poli
};


Napríklad pre výraz "(2.1+ 3.9) / 3" vznikne nasledujúca dátová štruktúra:

tokenSequence:
length: 7
size: nejaké číslo >= 7
items: pole s nasledovnými položkami

token items[0]: op '(', val ?
token items[1]: op ' ', val 2.1
token items[2]: op '+', val ?
token items[3]: op ' ', val 3.9
token items[4]: op ')', val ?
token items[5]: op '/', val ?
token items[6]: op ' ', val 3

Preklad výrazu na postupnosť symbolov realizuje funkcia tokenize.

  • Na načítanie čísla používame funkciu sscanf, ktorá vyzerá podobne ako scanf, ale načítava zo zadaného reťazca.
    • Ako reťazec zadáme &(str[strPos]), čo spôsobí, že sa začne načítavať od pozície strPos, mohli by sme písať aj str+strPos.
    • Formátovací znak %n nám do premennej skip uloží počet znakov, ktoré sa pri načítaní čísla použili, o tento počet potom posunieme premennú strPos.
  • Kód token newToken = {str[strPos], 0} inicializuje položku op na znak str[strPos] a položku val na nulu.
  • Pomocné funkcie init a addToken pracujú s postupnosťou symbolov, nájdete ich v programe na konci prednášky.
void tokenize(char * str, tokenSequence & tokens) {
    init(tokens, strlen(str));  // inicializujeme prázdnu postupnosť

    int strPos = 0;  // pozícia v rámci reťazca
    while (str[strPos] != 0) {  // kým nie sme na konci str
        if (isspace(str[strPos])) {  // preskakujeme biele znaky
            strPos++;
        } else if (isdigit(str[strPos]) || str[strPos] == '.') {
            // keď nájdeme cifru alebo bodku (začiatok čísla)
            double val;
            int skip;
            // načítame toto číslo pomocou sscanf, 
            // do skip uložíme počet znakov čísla
            sscanf(&(str[strPos]), "%lf%n", &val, &skip);
            // vytvoríme a uložíme token
            token newToken = {' ', val};
            addToken(tokens, newToken);
            // preskočíme všetky znaky čísla
            strPos += skip;
        } else {
            // spracovanie zátvoriek alebo operátora
            assert(strchr("+-/*()~", str[strPos]) != NULL);
            // vytvoríme a uložíme token
            token newToken = {str[strPos], 0};
            addToken(tokens, newToken);
            strPos++;
        }
    }
}

Vyhodnocovanie aritmetických výrazov v postfixovej notácii

  • Budeme používať zásobník, do ktorého budeme vkladať čísla čakajúce na spracovanie.
  • Operátor má v postfixovom zápise obidva operandy pred sebou. Keď narazíme na operátor, jeho operandy sme už prečítali a spracovali. Ide navyše o posledné dve prečítané alebo vypočítané hodnoty.

Výraz budeme postupne čítať zľava doprava:

  • Keď narazíme na číslo, vložíme ho na zásobník.
  • Keď narazíme na operátor:
    • Vyberieme zo zásobníka jeho dva operandy.
    • Prvé z týchto čísel je pritom druhým operandom a druhé z nich je prvým operandom.
    • Vykonáme s týmito operandmi danú operáciu a výsledok tejto operácie vložíme naspäť na zásobník.
  • Pri unárnom mínus vyberáme zo zásobníka iba jeden operand.
  • Tento postup opakujeme, až kým neprídeme na koniec výrazu. V tom okamihu by sme mali mať na zásobníku jediný prvok, výslednú hodnotu výrazu.

Technická poznámka:

  • Keďže vo výslednom programe budeme potrebovať zásobníky čísel aj znakov, používame v ňom zásobník položiek typu token. Ak by sme však robili čisto vyhodnocovanie postfixovej notácie, stačil by nám zásobník s prvkami typu double.

Cvičenie:

  • Odsimulujme činnosť tohto algoritmu na našom vstupe 65 3 5 * - 2 3 + /
  • Aké všelijaké prípady môžu nastať, keď na vstupe nemáme správny výraz v postfixovej notácii?
typedef token dataType;
// Nasleduje kód pre zásobník tokenov
// ...


/** Funkcia aplikuje operátor uložený v opToken na čísla
* uložené v num1 a num2, výsledok uloží ako číslo do result.
* Unárny operátor sa aplikuje iba na num1. */
void applyOp(token opToken, token num1, token num2, token & result) {
    result.op = ' ';
    switch (opToken.op) {
    case '~':
        result.val = -num1.val;
        break;
    case '+':
        result.val = num1.val + num2.val;
        break;
    case '-':
        result.val = num1.val - num2.val;
        break;
    case '*':
        result.val = num1.val * num2.val;
        break;
    case '/':
        result.val = num1.val / num2.val;
        break;
    default: // iné operátory nepovoľujeme.
        assert(false);
    }
}

/** Funkcia vyhodnotí a vráti hodnotou výrazu v postfixovom tvare. */
double evaluatePostfix(tokenSequence & tokens) {
    // zásobník, do ktorého ukladáme čísla
    stack numberStack;
    init(numberStack);

    for (int i = 0; i < tokens.length; i++) {
        // aktuálny token zo vstupu
        token curToken = tokens.items[i];
        if (curToken.op == ' ') {
            // čísla rovno ukladáme na zásobník
            push(numberStack, curToken);
        } else {
            // spracovanie operátora
            token num1, num2, result;
            // najskôr vyberieme 1 alebo 2 čísla zo zásobníka
            if (curToken.op == '~') {
                num1 = pop(numberStack);
            } else {
                num2 = pop(numberStack);
                num1 = pop(numberStack);
            }
            // na operandy aplikujeme operátor
            applyOp(curToken, num1, num2, result);
            // výsledné číslo uložíme na zásobník
            push(numberStack, result);
        }
    }
    // zo zásobníka vyberieme výsledné číslo
    token result = pop(numberStack);
    // skontrolujeme, že zásobník je prázdny a výsledok je číslo
    assert(isEmpty(numberStack) && result.op == ' ');
    // uvoľníme pamäť zásobníka
    destroy(numberStack);
    return result.val;
}

Prevod výrazu z infixovej do postfixovej notácie

  • Pre bežnú prax je dôležitejšie vyhodnocovanie výrazov v klasickej infixovej notácii.
  • Túto úlohu teraz vyriešime tak, že napíšeme funkciu, ktorá preloží aritmetický výraz z infixovej do postfixovej notácie.
  • Následne ho môžeme vyhodnotiť algoritmom popísaným vyššie.

Popis algoritmu

Uvažujme najprv výrazy bez zátvoriek a bez unárnych mínusov.

  • Pozostávajú teda z čísel a binárnych operátorov +, -, *, /, kde * a / majú vyššiu prioritu ako + a -.
  • Všetky tieto operátory sú navyše zľava asociatívne, t.j. napr. 30 / 6 / 5 je to isté ako (30 / 6) / 5.

Na prevod takéhoto výrazu do postfixového tvaru ním stačí prejsť zľava doprava a všimnúť si dve skutočnosti:

  • Poradie jednotlivých čísel v postfixovom výraze je rovnaké, ako v pôvodnom infixovom výraze.
  • Napríklad výraz 1 + 2 - 3 * 4 + 5 má postfixový tvar 1 2 + 3 4 * - 5 +.
  • Pri prechádzaní vstupným infixovým výrazom budeme teda čísla priamo pridávať do výstupného postfixového výrazu.
  • Každý operátor treba presunúť spomedzi jeho dvoch operandov za jeho druhý operand.
  • Ak teda vo vstupnom infixovom výraze narazíme na operátor, nepridáme ho hneď do výstupného výrazu, ale uložíme ho pre neskoršie pridanie na správnej pozícii.
  • Uložený operátor treba vypísať za jeho druhým operandom. Ak pritom aj samotný operand obsahuje nejaké ďalšie operátory, určite musia byť vypísané skôr. Operátory teda budeme ukladať na zásobník.
  • Keď vo vstupnom infixovom výraze narazíme na operátor, je možné, že tesne pred ním končí operand jedného alebo niekoľkých operátorov uložených na zásobníku. Vďaka ľavej asociatívnosti pritom ide o práve všetky operátory na vrchu zásobníka, ktoré majú vyššiu alebo rovnakú prioritu, ako nájdený operátor. Všetky tieto operátory teda postupne vyberieme zo zásobníka a vypíšeme ich do výstupného reťazca. Až následne na zásobník vložíme nájdený operátor.
  • Na konci vstupného reťazca vypíšeme všetky operátory, ktoré zostali na zásobníku.

Z technických dôvodov budeme na spodku zásobníka uchovávať „umelé dno” #, ktoré budeme chápať ako symbol s nižšou prioritou ako všetky operátory.

  • Situáciu, keď pri vyberaní operátorov zo zásobníka narazíme na jeho dno tak budeme môcť riešiť konzistentne so situáciou, keď narazíme na operátor s nižšou prioritou: v oboch prípadoch chceme s vyberaním prestať.

Na vstupnom výraze 1 + 2 - 3 * 4 + 5 bude práve popísaný algoritmus pracovať nasledovne:

Vstupný symbol  Výstupný výraz    Zásobník (dno vľavo) 
-------------------------------------------------------------------------------------------------------
           1                       #            vypíš 1 
                1                  #

           +    1                  #            # má nižšiu prioritu ako +, nevyberaj ho
                1                  # +          vlož + na zásobník

           2    1                  # +          vypíš 2
                1 2                # + 

           -    1 2                # +          + má rovnakú prioritu ako -, vyber + a vypíš
                1 2 +              #            # má nižšiu prioritu ako -, nevyberaj ho
                1 2 +              #            vlož - na zásobník
                1 2 +              # -   

           3    1 2 +              # -          vypíš 3
                1 2 + 3            # - 

           *    1 2 + 3            # -          - má nižšiu prioritu ako *, nevyberaj ho
                1 2 + 3            # - *        vlož * na zásobník

           4    1 2 + 3            # - *        vypíš 4
                1 2 + 3 4          # - *                     

           +    1 2 + 3 4          # - *        * má vyššiu prioritu ako +, vyber * a vypíš
                1 2 + 3 4 *        # -          - má rovnakú prioritu ako +, vyber - a vypíš
                1 2 + 3 4 * -      #            # má nižšiu prioritu ako +, nevyberaj ho
                1 2 + 3 4 * -      # +          vlož - na zásobník

           5    1 2 + 3 4 * -      # +          vypíš 5
                1 2 + 3 4 * - 5    # +                 

    [koniec]    1 2 + 3 4 * - 5    # +          vyber operátory na zásobníku a vypíš
                1 2 + 3 4 * - 5 +  #            <-- VÝSLEDNÝ POSTFIXOVÝ VÝRAZ

Pridanie zátvoriek:

  • Keď vo vstupnom infixovom reťazci narazíme na ľavú zátvorku, vložíme ju do zásobníka. Podobne ako pri # ju budeme považovať za symbol s nižšou prioritou, než všetky binárne operátory. To má dva dôsledky:
    • Pri vkladaní zátvorky teda nevyhadzujeme operátory zo zásobníka
    • Operátory vo vnútri zátvorky nespôsobia jej vyhodenie ani vyhodenie symbolov pod ňou
  • Keď narazíme na pravú zátvorku, potrebujeme vypísať všetky doposiaľ nevypísané operátory uzatvorené touto zátvorkou. Preto vyberieme a vypíšeme na výstup všetky operátory zo zásobníka až po prvú ľavú zátvorku (ktorú zo zásobníka taktiež vyberieme).

Pridanie unárneho mínus:

  • Unárne mínus má vyššiu prioritu ako binárne operátory. Predpokladáme, že ho máme zapísané ako ~.
  • Je však sprava asociatívne, t.j. --2 je to isté ako -(-2) a v postfixovom tvare to bude 2 ~ ~.
  • Preto ak je aktuálny operátor unárne mínus ~, nevyhadzujeme iné unárne mínus zo zásobníka. Toto je v programe dosiahnuté tak, že nové unárne mínus ("pravé") má vyššiu prioritu ako to, čo už je na zásobníku ("ľavé").

Implementácia

/** Pomocná funkcia, ktorá vráti prioritu operátora.
 * Argument right určuje, či ide o pravý z dvoch porovnávaných operátorov */
int priority(char op, bool right) {
    if (op == '#' || op == '(') return 0;
    if (op == '-' || op == '+') return 1;
    if (op == '*' || op == '/') return 2;
    if (op == '~' && !right) return 3;
    if (op == '~' && right) return 4;
    assert(false); // sem by sme sa nemali dostať
}

/** Skonvertuje infixový výraz infix do postfixovej formy */
void infixToPostfix(tokenSequence & infix, tokenSequence & postfix) {
    // inicializuje výslednú postupnosť tokenov
    init(postfix, infix.length);

    // vytvoríme zásobník operátorov a na spodok dáme #
    stack opStack;
    init(opStack);
    token curToken = {'#', 0};
    push(opStack, curToken);

    for (int i = 0; i < infix.length; i++) {
        // aktuálny token zo vstupu
        curToken = infix.items[i];
        if (curToken.op == ' ') {
            // čísla rovno skopírujeme do výstupu
            addToken(postfix, curToken);
        } else if (curToken.op == '(') {
            // začiatok zátvorky uložíme na zásobník
            push(opStack, curToken);
        } else if (curToken.op == ')') {
            // koniec zátvorky:
            // na výstup pridáme zo zásobníka operátory,
            // ktoré boli v zátvorke
            token popped = pop(opStack);
            while (popped.op != '(') {
                addToken(postfix, popped);
                popped = pop(opStack);
            }
        } else {
            // spracovanie operátora:
            // na výstup pridáme zo zásobníka operátory s vyššou prioritou
            int p = priority(curToken.op, true);
            while (priority(peek(opStack).op, false) >= p) {
                token popped = pop(opStack);
                addToken(postfix, popped);
            }
            // aktuálny operátor dáme na zásobník
            push(opStack, curToken);
        }
    }

    // zvyšné operátory presunieme zo zásobníka na výstup
    while (peek(opStack).op != '#') {
        token popped = pop(opStack);
        addToken(postfix, popped);
    }
    destroy(opStack);
}

Cvičenie: Rozšírte program vyššie o operáciu umocňovania ^ s prioritou vyššou ako * (dajte pozor na fakt, že umocňovanie je na rozdiel od operácií +, -, *, / sprava asociatívne).


Predspracovanie unárneho mínus

  • Pre prevodom infixového výrazu do postfixového tvaru potrebujeme v infixovom výraze nahradiť unárne mínus znakom ~.
  • Robí to funkcia fixUnaryMinus.
  • Mínus je v korektnom infixovom výraze unárne práve vtedy, keď nenasleduje za číslom, ani za pravou zátvorkou, čo testuje pomocná funkcia isOperand.
/** Pomocná funkcia, ktorá vráti, či token je koncom operandu v infixovej notácii */
bool isOperand(token curToken) {
    return curToken.op == ' ' || curToken.op == ')';
}

/** Funkcia, ktorá v infixovom výraze zmení unárne mínus na ~ */
void fixUnaryMinus(tokenSequence & infix) {
    for (int i = 0; i < infix.length; i++) {
        if(infix.items[i].op == '-' 
           && (i == 0 || !isOperand(infix.items[i - 1]))) {
            infix.items[i].op = '~';
        }
    }
}

Záverečné poznámky

  • Infixové výrazy vieme vyhodnotiť tak, že najskôr ich prevedieme na postfixové a tie potom vyhodnotíme.
    • Pri vyhodnocovaní postfixovej formy používame zásobník čísel (operandov).
    • Pri prevode z infixovej formy na postfixovú používame zásobník operátorov.
  • Obidva procesy sa dajú vykonávať aj súčasne (počas prechodu výrazom používame jeden zásobník čísel a jeden zásobník operátorov).
  • Všeobecnejšie a elegantnejšie prístupy k analýze a vyhodnocovaniu výrazov ale aj celých programov uvidíte na predmete Kompilátory (Mgr. štúdium), ktorý využíva poznatky z predmetu Formálne jazyky a automaty (semester 2Z).


Typ dát na zásobníku

V našom programe sme potrebovali zásobník čísel aj zásobník znakov.

  • Vyriešili sme to tým, že na zásobník dávame položky typu token, ktoré obsahujú znak aj číslo.
  • Nie je to však príliš elegantné a plytve pamäťou na nepotrebné údaje.
  • Druhá možnosť je dvakrát implementovať celý zásobník pre rôzne typy dát, kopírovanie a menenie kódu je však tiež niečo, čomu sa chceme vyhnúť.
  • Najlepšie by bolo použiť techniku generického programovania, ktorá je k dispozícii vo veľa jazykoch, vrátane C++, ale nie C. Touto technikou vieme zásobník implementovať raz a použiť s rôznymi typmi. Ukážku tejto techniky uvidíme na poslednej prednáške a viac sa dozviete na Programovaní (2) v letnom semestri.

Na konci prednášky sme ešte prebrali úvodné časti prednášky 20.

Program na prácu s výrazmi

#include <cstdio>
#include <cctype>
#include <cassert>
#include <cstring>
using namespace std;

/** Štruktúra pre jednu súčasť výrazu: znamienko alebo číslo */
struct token {
    char op;     // znamienko alebo medzera, ak ide o číslo
    double val;  // číselná hodnota, ak je op medzera
};

/** Štruktúra pre postupnosť tokenov */
struct tokenSequence {
    token * items;  // pole tokenov
    int size;       // veľkosť alokovaného poľa
    int length;     // počet tokenov uložených v poli
};

/** Funkcia inicializuje prázdnu postupnosť tokenov
pričom alokuje pole požadovanej veľkosti. */
void init(tokenSequence & tokens, int size) {
    tokens.items = new token[size];
    tokens.size = size;
    tokens.length = 0;
}

/** Funkcia do postupnosti tokenov pridá nový token. */
void addToken(tokenSequence & tokens, token & newToken) {
    assert(tokens.length < tokens.size);
    tokens.items[tokens.length] = newToken;
    tokens.length++;
}

/** Funkcia odalokuje pamäť alokovanú pre postupnosť tokenov */
void destroy(tokenSequence & tokens) {
    delete[] tokens.items;
}

/** Funkcia vypíše postupnosť tokenov, každý v hranatých zátvorkách. */
void printTokens(tokenSequence & tokens) {
    for (int i = 0; i < tokens.length; i++) {
        token curToken = tokens.items[i];
        if (curToken.op == ' ') {
            printf(" [val %g]", curToken.val);
        } else {
            printf(" [op %c]", curToken.op);
        }
    }
    printf("\n");
}

/** Funkcia vypíše postupnosť tokenov ako aritmetický výraz. */
void printTokenExpression(tokenSequence & tokens) {
    for (int i = 0; i < tokens.length; i++) {
        token curToken = tokens.items[i];
        if (curToken.op == ' ') {
            printf(" %g", curToken.val);
        } else {
            printf(" %c", curToken.op);
        }
    }
    printf("\n");
}

/** Funkcia konvertuje výraz z reťazca na postupnosť tokenov. */
void tokenize(char * str, tokenSequence & tokens) {
    init(tokens, strlen(str));  // inicializujeme prázdnu postupnosť

    int strPos = 0;  // pozícia v rámci reťazca
    while (str[strPos] != 0) {  // kým nie sme na konci str
        if (isspace(str[strPos])) {  // preskakujeme biele znaky
            strPos++;
        } else if (isdigit(str[strPos]) || str[strPos] == '.') {
            // keď nájdeme cifru alebo bodku (začiatok čísla)
            double val;
            int skip;
            // načítame toto číslo pomocou sscanf, do skip uložíme počet znakov čísla
            sscanf(&(str[strPos]), "%lf%n", &val, &skip);
            // vytvoríme a uložíme token
            token newToken = {' ', val};
            addToken(tokens, newToken);
            // preskočíme všetky znaky čísla
            strPos += skip;
        } else {
            // spracovanie zátvoriek alebo operátora
            assert(strchr("+-/*()~", str[strPos]) != NULL);
            // vytvoríme a uložíme token
            token newToken = {str[strPos], 0};
            addToken(tokens, newToken);
            strPos++;
        }
    }
}

// Nasleduje kód pre zásobník tokenov
typedef token dataType;

/** Uzol spájaného zoznamu pre zásobník */
struct node {
    dataType data; // dáta uložené v uzle
    node * next;   // smerník na ďalší uzol zoznamu
};

/** Štruktúra pre zásobník implementovaný pomocou zoznamu*/
struct stack {
    node * top; // Smernik na vrch zasobníka  alebo NULL
};

/** Funkcia inicializuje prázdny zásobník */
void init(stack & s) {
    s.top = NULL;
}

/** Funkcia zistí, či je zásobník prázdny */
bool isEmpty(stack & s) {
    return s.top == NULL;
}

/** Funkcia pridá prvok item na vrch zásobníka */
void push(stack & s, dataType item) {
    node * tmp = new node;
    tmp->data = item;
    tmp->next = s.top;
    s.top = tmp;
}

/** Funkcia odoberie prvok z vrchu zasobnika a vráti ho */
dataType pop(stack & s) {
    assert(!isEmpty(s));
    dataType result = s.top->data;
    node * tmp = s.top->next;
    delete s.top;
    s.top = tmp;
    return result;
}

/** Funkcia vráti prvok na vrchu zásobníka, ale nechá ho v zásobníku */
dataType peek(stack & s) {
    assert(!isEmpty(s));
    return s.top->data;
}

/** Funkcia uvoľní pamäť zásobníka */
void destroy(stack & s) {
    while (!isEmpty(s)) {
        pop(s);
    }
}

/** Funkcia aplikuje operátor uložený v opToken na čísla
* uložené v num1 a num2, výsledok uloží ako číslo do result.
* Unárny operátor sa aplikuje iba na num1. */
void applyOp(token opToken, token num1, token num2, token & result) {
    result.op = ' ';
    switch (opToken.op) {
    case '~':
        result.val = -num1.val;
        break;
    case '+':
        result.val = num1.val + num2.val;
        break;
    case '-':
        result.val = num1.val - num2.val;
        break;
    case '*':
        result.val = num1.val * num2.val;
        break;
    case '/':
        result.val = num1.val / num2.val;
        break;
    default: // iné operátory nepovoľujeme.
        assert(false);
    }
}

/** Funkcia vyhodnotí a vráti hodnotou výrazu v postfixovom tvare. */
double evaluatePostfix(tokenSequence & tokens) {
    // zásobník, do ktorého ukladáme čísla
    stack numberStack;
    init(numberStack);

    for (int i = 0; i < tokens.length; i++) {
        // aktuálny token zo vstupu
        token curToken = tokens.items[i];
        if (curToken.op == ' ') {
            // čísla rovno ukladáme na zásobník
            push(numberStack, curToken);
        } else {
            // spracovanie operátora
            token num1, num2, result;
            // najskôr vyberieme 1 alebo 2 čísla zo zásobníka
            if (curToken.op == '~') {
                num1 = pop(numberStack);
            } else {
                num2 = pop(numberStack);
                num1 = pop(numberStack);
            }
            // na operandy aplikujeme operátor
            applyOp(curToken, num1, num2, result);
            // výsledné číslo uložíme na zásobník
            push(numberStack, result);
        }
    }
    // zo zásobníka vyberieme výsledné číslo
    token result = pop(numberStack);
    // skontrolujeme, že zásobník je prázdny a výsledok je číslo
    assert(isEmpty(numberStack) && result.op == ' ');
    // uvoľníme pamäť zásobníka
    destroy(numberStack);
    return result.val;
}

/** Pomocná funkcia, ktorá vráti prioritu operátora.
* Argument right určuje, či ide o pravý z dvoch porovnávaných operátorov */
int priority(char op, bool right) {
    if (op == '#' || op == '(') return 0;
    if (op == '-' || op == '+') return 1;
    if (op == '*' || op == '/') return 2;
    if (op == '~' && !right) return 3;
    if (op == '~' && right) return 4;
    assert(false); // sem by sme sa nemali dostať
}

/** Skonvertuje infixový výraz infix do postfixovej formy */
void infixToPostfix(tokenSequence & infix, tokenSequence & postfix) {
    // inicializuje výslednú postupnosť tokenov
    init(postfix, infix.length);

    // vytvoríme zásobník operátorov a na spodok dáme #
    stack opStack;
    init(opStack);
    token curToken = {'#', 0};
    push(opStack, curToken);

    for (int i = 0; i < infix.length; i++) {
        // aktuálny token zo vstupu
        curToken = infix.items[i];
        if (curToken.op == ' ') {
            // čísla rovno skopírujeme do výstupu
            addToken(postfix, curToken);
        } else if (curToken.op == '(') {
            // začiatok zátvorky uložíme na zásobník
            push(opStack, curToken);
        } else if (curToken.op == ')') {
            // koniec zátvorky:
            // na výstup pridáme zo zásobníka operátory,
            // ktoré boli v zátvorke
            token popped = pop(opStack);
            while (popped.op != '(') {
                addToken(postfix, popped);
                popped = pop(opStack);
            }
        } else {
            // spracovanie operátora:
            // na výstup pridáme zo zásobníka operátory s vyššou prioritou
            int p = priority(curToken.op, true);
            while (priority(peek(opStack).op, false) >= p) {
                token popped = pop(opStack);
                addToken(postfix, popped);
            }
            // aktuálny operátor dáme na zásobník
            push(opStack, curToken);
        }
    }

    // zvyšné operátory presunieme zo zásobníka na výstup
    while (peek(opStack).op != '#') {
        token popped = pop(opStack);
        addToken(postfix, popped);
    }
    destroy(opStack);
}

/** Pomocná funkcia, ktorá zo zásobníka vyberie
* jedno alebo dve čísla, aplikuje na nich operátor a výsledok uloží na zásobník. */
void processOp(stack & numberStack, token curToken) {
    token num1, num2, result;
    // najskôr vyberieme 1 alebo 2 čísla zo zásobníka
    if (curToken.op == '~') {
        num1 = pop(numberStack);
    } else {
        num2 = pop(numberStack);
        num1 = pop(numberStack);
    }
    // na operandy aplikujeme operátor
    applyOp(curToken, num1, num2, result);
    // výsledné číslo uložíme na zásobník
    push(numberStack, result);
}

/** Spočíta hodnotu výrau v infixovej forme,
 * kombinuje infixToPostfix a evaluatePostfix */
double evaluateInfix(tokenSequence & infix) {
    // zásobník, do ktorého ukladáme čísla
    stack numberStack;
    init(numberStack);

    // vytvoríme zásobník operátorov a na spodok dáme #
    stack opStack;
    init(opStack);
    token curToken = {'#', 0};
    push(opStack, curToken);

    for (int i = 0; i < infix.length; i++) {
        // aktuálny token zo vstupu
        curToken = infix.items[i];
        if (curToken.op == ' ') {
            // čísla ukladáme na zásobník
            push(numberStack, curToken);
        } else if (curToken.op == '(') {
            // začiatok zátvorky uložíme na zásobník
            push(opStack, curToken);
        } else if (curToken.op == ')') {
            // koniec zátvorky:
            // spracujeme zo zásobníka operátory,
            // ktoré boli v zátvorke
            token popped = pop(opStack);
            while (popped.op != '(') {
                processOp(numberStack, popped);
                popped = pop(opStack);
            }
        } else {
            // spracovanie operátora:
            // spracujeme zo zásobníka operátory s vyššou prioritou
            int p = priority(curToken.op, true);
            while (priority(peek(opStack).op, false) >= p) {
                token popped = pop(opStack);
                processOp(numberStack, popped);
            }
            // aktuálny operátor dáme na zásobník
            push(opStack, curToken);
        }
    }

    // spracujeme zvyšné operátory zo zásobníka
    while (peek(opStack).op != '#') {
        token popped = pop(opStack);
        processOp(numberStack, popped);
    }
    destroy(opStack);

    // zo zásobníka vyberieme výsledné číslo
    token result = pop(numberStack);
    // skontrolujeme, že ásobník je prázdny a výsledok je číslo
    assert(isEmpty(numberStack) && result.op == ' ');
    // uvoľníme pamäť zásobníka čísel
    destroy(numberStack);
    return result.val;
}

/** Pomocná funkcia, ktorá vráti, či token je koncom operandu v infixovej notácii */
bool isOperand(token curToken) {
    return curToken.op == ' ' || curToken.op == ')';
}

/** Funkcia, ktorá v infixovom výraze zmení unárne mínus na ~ */
void fixUnaryMinus(tokenSequence & infix) {
    for (int i = 0; i < infix.length; i++) {
        if (infix.items[i].op == '-'
                && (i == 0 || !isOperand(infix.items[i - 1]))) {
            infix.items[i].op = '~';
        }
    }
}

/** Hlavný program načítava a vykonáva postupnosť príkazov tokenize, postfix, infix a end.
 * Príkaz tokenize tokenizuje a vypíše vstupný výraz.
 * Príkaz postfix načíta výraz v postfixovom formáte a vypíše jeho hodnotu.
 * Príkaz infix načíta výraz v infixovom formáte, upraví v ňom unárne - na ~.
 * prevedie ho do postfixového formátu, vyhodnotí postfixový výraz a naopokon
 * vyhodnotí aj priamo infixovú formu výrazu.  */
int main() {
    const int maxLine = 100;
    char command[maxLine];
    char expression[maxLine];

    while (true) {
        int ret = scanf("%s", command);
        if (ret < 1 || strcmp(command, "end") == 0) {
            break;
        } else if (strcmp(command, "tokenize") == 0) {
            fgets(expression, maxLine, stdin);
            tokenSequence tokens;
            tokenize(expression, tokens);
            printf(" tokens:");
            printTokens(tokens);
            destroy(tokens);
        } else if (strcmp(command, "postfix") == 0) {
            fgets(expression, maxLine, stdin);
            tokenSequence postfix;
            tokenize(expression, postfix);
            double value = evaluatePostfix(postfix);
            printf(" value: %g\n", value);
            destroy(postfix);
        }
        if (strcmp(command, "infix") == 0) {
            fgets(expression, maxLine, stdin);
            tokenSequence infix;
            tokenize(expression, infix);
            fixUnaryMinus(infix);
            printf(" infix:");
            printTokenExpression(infix);
            tokenSequence postfix;
            infixToPostfix(infix, postfix);
            printf(" postfix:");
            printTokenExpression(postfix);
            double value = evaluatePostfix(postfix);
            printf(" value of postfix: %g\n", value);
            double value2 = evaluateInfix(infix);
            printf(" value of infix: %g\n", value2);
            destroy(infix);
            destroy(postfix);
        }
    }
}

Vytvorenie stromu z postfixového výrazu

Pripomeňme si z minulej prednášky funkciu na vyhodnocovanie postfixového výrazu:

/** Funkcia vyhodnotí a vráti hodnotou výrazu v postfixovom tvare. */
double evaluatePostfix(tokenSequence & tokens) {
    // zásobník, do ktorého ukladáme čísla
    stack numberStack;
    init(numberStack);

    for (int i = 0; i < tokens.length; i++) {
        // aktuálny token zo vstupu
        token curToken = tokens.items[i];
        if (curToken.op == ' ') {
            // čísla rovno ukladáme na zásobník
            push(numberStack, curToken);
        } else {
            // spracovanie operátora
            token num1, num2, result;
            // najskôr vyberieme 1 alebo 2 čísla zo zásobníka
            if (curToken.op == '~') {
                num1 = pop(numberStack);
            } else {
                num2 = pop(numberStack);
                num1 = pop(numberStack);
            }
            // na operandy aplikujeme operátor
            applyOp(curToken, num1, num2, result);
            // výsledné číslo uložíme na zásobník
            push(numberStack, result);
        }
    }
    // zo zásobníka vyberieme výsledné číslo
    token result = pop(numberStack);
    // skontrolujeme, že zásobník je prázdny a výsledok je číslo
    assert(isEmpty(numberStack) && result.op == ' ');
    // uvoľníme pamäť zásobníka
    destroy(numberStack);
    return result.val;
}


  • Túto funkciu možno jednoducho prepísať tak, aby namiesto vyhodnocovania výrazu konštruovala zodpovedajúci aritmetický strom.
  • Namiesto hodnôt jednotlivých podvýrazov stačí na zásobníku uchovávať korene stromov, ktoré tieto podvýrazy reprezentujú.
  • Aplikácii aritmetickej operácie bude zodpovedať spojenie dvoch podstromov do jedného stromu.
  • V tomto prípade nepoužívame postupnosť symbolov (tokenov), ale priamo spracovávame postfixový výraz vo forme reťazca.
typedef treeNode *dataType;


/* Sem príde definícia štruktúry pre zásobník a všetkých funkcií poskytovaných zásobníkom. */
treeNode * postfixToTree(char * str) {
    // zásobník, do ktorého ukladáme korene podstromov
    stack treeStack;
    init(treeStack);

    int strPos = 0;  // pozícia v rámci reťazca
    while (str[strPos] != 0) {  // kým nie sme na konci str
        if (isspace(str[strPos])) {  // preskakujeme biele znaky
            strPos++;
        } else if (isdigit(str[strPos]) || str[strPos] == '.') {
            // keď nájdeme cifru alebo bodku (začiatok čísla)
            double val;
            int skip;
            // načítame toto číslo pomocou sscanf,
            // do skip uložíme počet znakov čísla
            sscanf(&(str[strPos]), "%lf%n", &val, &skip);
            // preskočíme všetky znaky čísla
            strPos += skip;

            // vytvoríme list a uložíme na zásobník
            push(treeStack, createNum(val));
        } else {
            // spracovanie operátora
            assert(strchr("+-/*", str[strPos]) != NULL);
            treeNode * left, * right;
            // najskôr vyberieme 2 podstromy zo zásobníka
            // vytvoríme nový koreň,
            // ktorý bude ich rodičom a vložíme na zásobník
            right = pop(treeStack);
            left = pop(treeStack);
            push(treeStack, createOp(str[strPos], left, right));
            strPos++;
        }
    }
    // zo zásobníka vyberieme výsledný strom
    treeNode * result = pop(treeStack);
    // skontrolujeme, že zásobník je prázdny
    assert(isEmpty(treeStack));
    // uvoľníme pamäť zásobníka
    destroy(treeStack);
    return result;
}

Ukážkový program pracujúci so stromami pre aritmetické výrazy

Nasledujúci program prečíta z konzoly aritmetický výraz v postfixovom tvare, skonštruuje jeho aritmetický strom a následne preň zavolá funkcie na výpočet hodnoty výrazu a jeho výpis v rôznych notáciách. Celý program je na konci prednášky.

int main() {
    // načítame postfixový výraz do reťazca
    const int maxLine = 100;
    char postfix[maxLine];
    fgets(postfix, maxLine, stdin);
    // výraz konvertujeme na strom
    treeNode * root = postfixToTree(postfix);
    // spočítame hodnotu výrazu
    double value = evaluateTree(root);
    printf(" value: %g\n", value);
    // vypíšeme vo všetkých troch notáciách
    printf(" inorder: ");
    printInorder(stdout, root);
    printf("\n predorder: ");
    printPreorder(stdout, root);
    printf("\n postdorder: ");
    printPostorder(stdout, root);
    printf("\n");
    // uvoľníme pamäť
    destroyTree(root);
}

Program pre aritmetické výrazy ako stromy

#include <cstdio>
#include <cctype>
#include <cassert>
#include <cstring>
using namespace std;

struct treeNode {
    // číselná hodnota (len v listoch)
    double val;

    // operátor vo vnútorných uzloch, pre listy medzera
    char op;

    // smerníky na podstromy
    treeNode * left, * right;
};

/** Funkcia vráti nový uzol pre operátor */
treeNode * createOp(char op, treeNode * left, treeNode * right) {
    treeNode * v = new treeNode;
    v->left = left;
    v->right = right;
    v->op = op;
    return v;
}

/** Funkcia vráti nový uzol pre číslo */
treeNode * createNum(double val) {
    treeNode * v = new treeNode;
    v->left = NULL;
    v->right = NULL;
    v->op = ' ';
    v->val = val;
    return v;
}


// Nasleduje kód pre zásobník uzlov stromu
typedef treeNode * dataType;

/** Uzol spájaného zoznamu pre zásobník */
struct node {
    dataType data; // dáta uložené v uzle
    node * next;   // smerník na ďalší uzol zoznamu
};

/** Štruktúra pre zásobník implementovaný pomocou zoznamu*/
struct stack {
    node * top; // Smernik na vrch zasobníka  alebo NULL
};

/** Funkcia inicializuje prázdny zásobník */
void init(stack & s) {
    s.top = NULL;
}

/** Funkcia zistí, či je zásobník prázdny */
bool isEmpty(stack & s) {
    return s.top == NULL;
}

/** Funkcia pridá prvok item na vrch zásobníka */
void push(stack & s, dataType item) {
    node * tmp = new node;
    tmp->data = item;
    tmp->next = s.top;
    s.top = tmp;
}

/** Funkcia odoberie prvok z vrchu zasobnika a vráti ho */
dataType pop(stack & s) {
    assert(!isEmpty(s));
    dataType result = s.top->data;
    node * tmp = s.top->next;
    delete s.top;
    s.top = tmp;
    return result;
}

/** Funkcia vráti prvok na vrchu zásobníka, ale nechá ho v zásobníku */
dataType peek(stack & s) {
    assert(!isEmpty(s));
    return s.top->data;
}

/** Funkcia uvoľní pamäť zásobníka */
void destroy(stack & s) {
    while (!isEmpty(s)) {
        pop(s);
    }
}

/** Funkcia konvertuje výraz v postfixovom tvare na strom */
treeNode * postfixToTree(char * str) {
    // zásobník, do ktorého ukladáme korene podstromov
    stack treeStack;
    init(treeStack);

    int strPos = 0;  // pozícia v rámci reťazca
    while (str[strPos] != 0) {  // kým nie sme na konci str
        if (isspace(str[strPos])) {  // preskakujeme biele znaky
            strPos++;
        } else if (isdigit(str[strPos]) || str[strPos] == '.') {
            // keď nájdeme cifru alebo bodku (začiatok čísla)
            double val;
            int skip;
            // načítame toto číslo pomocou sscanf,
            // do skip uložíme počet znakov čísla
            sscanf(&(str[strPos]), "%lf%n", &val, &skip);
            // preskočíme všetky znaky čísla
            strPos += skip;

            // vytvoríme list a uložíme na zásobník
            push(treeStack, createNum(val));
        } else {
            // spracovanie operátora
            assert(strchr("+-/*", str[strPos]) != NULL);
            treeNode * left, * right;
            // najskôr vyberieme 2 podstromy zo zásobníka
            // vytvoríme nový koreň,
            // ktorý bude ich rodičom a vložíme na zásobník
            right = pop(treeStack);
            left = pop(treeStack);
            push(treeStack, createOp(str[strPos], left, right));
            strPos++;
        }
    }
    // zo zásobníka vyberieme výsledný strom
    treeNode * result = pop(treeStack);
    // skontrolujeme, že zásobník je prázdny
    assert(isEmpty(treeStack));
    // uvoľníme pamäť zásobníka
    destroy(treeStack);
    return result;
}

/** Funkcia spočíta hodnotu výrazu reprezentovaného stromom */
double evaluateTree(treeNode * root) {
    assert(root != NULL);
    if (root->op == ' ') {
        return root->val;
    } else {
        double valLeft = evaluateTree(root->left);
        double valRight = evaluateTree(root->right);
        switch (root->op) {
        case '+':
            return valLeft + valRight;
            break;
        case '-':
            return valLeft - valRight;
            break;
        case '*':
            return valLeft * valRight;
            break;
        case '/':
            return valLeft / valRight;
            break;
        default:
            assert(false);
            break;
        }
    }
    return 0; // realne nedosiahnutelny prikaz
}

/** Funkcia uvoľní pamäť daného stromu */
void destroyTree(treeNode * root) {
    if (root != NULL) {
        destroyTree(root->left);
        destroyTree(root->right);
        delete root;
    }
}

/** Funkcia vypíše aritmetický výraz v inorder poradí */
void printInorder(treeNode * root) {
    if (root->op == ' ') {
        printf("%g", root->val);
    } else {
        printf("(");
        printInorder(root->left);
        printf(" %c ", root->op);
        printInorder(root->right);
        printf(")");
    }
}

/** Funkcia vypíše aritmetický výraz v preorder poradí */
void printPreorder(treeNode * root) {
    if (root->op == ' ') {
        printf("%g ", root->val);
    } else {
        printf("%c ", root->op);
        printPreorder(root->left);
        printPreorder(root->right);
    }
}

/** Funkcia vypíše aritmetický výraz v postorder poradí */
void printPostorder(treeNode * root) {
    if (root->op == ' ') {
        printf("%g ", root->val);
    } else {
        printPostorder(root->left);
        printPostorder(root->right);
        printf("%c ", root->op);
    }
}


int main() {
    // načítame postfixový výraz do reťazca
    const int maxLine = 100;
    char postfix[maxLine];
    fgets(postfix, maxLine, stdin);
    // výraz konvertujeme na strom
    treeNode * root = postfixToTree(postfix);
    // spočítame hodnotu výrazu
    double value = evaluateTree(root);
    printf(" value: %g\n", value);
    // vypíšeme vo všetkých troch notáciách
    printf(" inorder: ");
    printInorder(root);
    printf("\n predorder: ");
    printPreorder(root);
    printf("\n postdorder: ");
    printPostorder(root);
    printf("\n");
    // uvoľníme pamäť
    destroyTree(root);
}