Programovanie (2) v Jave
1-INF-166, letný semester 2023/24

Prednášky · Pravidlá · Softvér · Testovač
· Vyučujúcich predmetu možno kontaktovať mailom na adresách uvedených na hlavnej stránke. Hromadná mailová adresa zo zimného semestra v letnom semestri nefunguje.
· JavaFX: cesta k adresáru lib je v počítačových učebniach /usr/share/openjfx/lib.


Prednáška 22: Rozdiel medzi revíziami

Z Programovanie
Skočit na navigaci Skočit na vyhledávání
Riadok 9: Riadok 9:
  
 
Nezabudnite hlásiť čím skôr prípadné konflikty [[Zimný semester, skúška|termínov skúšky]] s inými predmetmi.
 
Nezabudnite hlásiť čím skôr prípadné konflikty [[Zimný semester, skúška|termínov skúšky]] s inými predmetmi.
 
== Binárne vyhľadávacie stromy ==
 
 
 
===Opakovanie===
 
[[Image:P22-BST.png|200px|right|thumb|Príklad binárneho vyhľadávacieho stromu.]]
 
Binárny vyhľadávací strom (binary search tree) je dátová štruktúra určená na ukladanie dynamickej množiny prvkov.
 
* V binárnom vyhľadávacom strome má každý vrchol 0, 1 alebo 2 deti
 
* V každom vrchole máme položku s dátami (pre jednoduchosť typu <tt>int</tt>)
 
* Pre každý vrchol ''v'' stromu platí:
 
** Každý vrchol v ľavom podstrome ''v'' má hodnotu <tt>data</tt> menšiu ako vrchol ''v''
 
** Každý vrchol v pravom podstrome ''v'' má hodnotu <tt>data</tt> väčšiu ako vrchol ''v''
 
 
<syntaxhighlight lang="C++">
 
struct node {
 
    /* vrchol binárneho vyhľadávacieho stromu  */
 
    int data;      /* hodnota */
 
    node * parent;  /* rodič vrchola, NULL v koreni */
 
    node * left;    /* ľavé dieťa, NULL ak neexistuje */
 
    node * right;  /* pravé dieťa, NULL ak neexistuje */
 
};
 
 
/* Samotná štruktúra binárneho vyhľadávacieho stromu (obal pre používateľa). */
 
struct binarySearchTree {
 
    node *root;  /* koreň stromu, NULL pre prázdny strom */
 
};
 
</syntaxhighlight>
 
 
 
Videli sme vyhľadávanie prvku v binárnom vyhľadávacom strome. Čas výpočtu je v najhoršom prípade úmerný výške stromu.
 
 
=== Vkladanie do binárneho vyhľadávacieho stromu ===
 
 
Nasledujúca funkcia <tt>insertNode</tt> vloží uzol <tt>*v</tt> na správne miesto podstromu zakoreneného v <tt>*root</tt> ako jeho list.
 
* Predpokladáme, že prvok v strome nie je.
 
* Putujeme po strome podobne ako pri vyhľadávaní prvku, až kým nenarazíme na nulový smerník.
 
** Na tomto mieste by mal byť nový prvok, takže ho tam pridáme ako nový list
 
** Uvádzame rekurzívnu verziu, dá sa aj cyklom, podobne ako pri hľadaní
 
* Funkcia <tt>bstInsert</tt> vytvorí uzol s daným kľúčom <tt>key</tt> a pomocou funkcie <tt>insertNode</tt> ho vloží do binárneho vyhľadávacieho stromu <tt>t</tt>.
 
 
<syntaxhighlight lang="C++">
 
/* Vloží uzol v na správne miesto podstromu zakoreneného v root */
 
void insertNode(node *root, node *v) {
 
    assert(root != NULL && v != NULL);
 
    if (v->data < root->data) {
 
        if (root->left == NULL) {
 
            root->left = v;
 
            v->parent = root;
 
        } else {
 
            insertNode(root->left, v);
 
        }
 
    } else {
 
        if (root->right == NULL) {
 
            root->right = v;
 
            v->parent = root;
 
        } else {
 
            insertNode(root->right, v);
 
        }
 
    }
 
}
 
 
/* Vloží do stromu t nový uzol s kľúčom key. */
 
void bstInsert(binarySearchTree &t, int key) {
 
    node *v = new node;
 
    v->data = key;
 
    v->left = NULL;
 
    v->right = NULL;
 
    v->parent = NULL;
 
    if (t.root == NULL) {
 
        t.root = v;
 
    } else {
 
        insertNode(t.root, v);
 
    }
 
}
 
</syntaxhighlight>
 
 
Čas vkladania je tiež v najhoršom prípade úmerný hĺbke stromu.
 
 
'''Cvičenia'''
 
* Napíšte nerekurzívny variant funkcie <tt>insertNode</tt>.
 
* Napíšte funkciu <tt>treeSort</tt>, ktorá z poľa celých čísel <tt>a</tt> pomocou volaní funkcie <tt>bstInsert</tt> vytvorí binárny vyhľadávací strom a následne pomocou prehľadávania tohto stromu v poradí ''inorder'' pole <tt>a</tt> utriedi.
 
* Ako bude vyzerať strom po nasledujúcej postupnosti operácií?
 
<pre>
 
    binarySearchTree t;
 
    bstInit(t);
 
    bstInsert(t, 2);
 
    bstInsert(t, 5);
 
    bstInsert(t, 3);
 
    bstInsert(t, 10);
 
    bstInsert(t, 7); 
 
</pre>
 
 
===Minimum a následník===
 
Uvedieme teraz dve funkcie, ktoré sa zídu pri mazaní prvku zo stromu, ale môžu sa zísť aj inokedy.
 
 
Prvá funkcia <tt>minNode</tt> nájde vo vyhľadávacom strome uzol, v ktorom je uložená najmenšia hodnota.
 
* Všetky prvky menšie ako koreň sú v ľavom podstrome, bude tam zrejme aj minimum.
 
* Tá istá úvaha platí pre koreň ľavého podstromu.
 
* Ideme teda doľava kým sa dá, posledný vrchol vrátime (list alebo vrchol, ktorý má iba pravé dieťa).
 
* Nie je treba teda prechádzať celý strom a nemusíme sa ani pozerať na položku data v uzloch.
 
* Dá sa napísať cyklom aj rekurzívne.
 
* Obalom pre používateľa bude funkcia <tt>bstMin</tt>, ktorá pomocou funkcie <tt>minNode</tt> nájde minimálny kľúč v danom binárnom vyhľadávacom strome <tt>t</tt>.
 
 
<syntaxhighlight lang="C++">
 
/* Vrati uzol s minimalnou hodnotou data v podstrome s korenom v. */
 
node *minNode(node *v) {
 
    assert(v != NULL);
 
    while (v->left != NULL) {
 
        v = v->left;
 
    }
 
    return v;
 
}
 
 
/* Vrati minimalny kluc uzla v strome t. */
 
int bstMin(binarySearchTree &t) {
 
    assert(t.root != NULL);
 
    return minNode(t.root)->data;
 
}
 
</syntaxhighlight>
 
 
''Cvičenia'':
 
* Napíšte rekurzívny variant funkcie <tt>minNode</tt>.
 
* Ako by bolo treba funkciu zmeniť, aby hľadala maximum?
 
 
 
Funkcia <tt>successorNode</tt> nájde pre daný uzol <tt>v</tt> jeho ''následníka'' (angl. ''successor'') v binárnom vyhľadávacom strome, čiže uzol, ktorý vo vzostupnom poradí podľa kľúčov nasleduje bezprostredne za uzlom <tt>v</tt>.
 
* Ak má uzol <tt>v</tt> pravé dieťa, následník uzla <tt>v</tt> bude vrchol s minimálnou hodnotou data v pravom podstrome
 
* V opačnom prípade môže byť následníkom uzla <tt>v</tt> jeho rodič, ak <tt>v</tt> je jeho ľavé dieťa.
 
* Ak je <tt>v</tt> pravým dieťaťom svojho rodiča, môže to byť jeho prarodič (ak je rodič uzla <tt>v</tt> ľavým dieťaťom tohto prarodiča), atď.
 
* Vo všeobecnosti teda ide o najbližšieho predka uzla <tt>v</tt> takého, že <tt>v</tt> patrí do jeho ľavého podstromu.
 
* V strome existuje práve jeden uzol bez následníka (najväčší prvok).
 
** Ako presne sa bude funkcia nižšie pre tento prvok správať?
 
 
<syntaxhighlight lang="C++">
 
/* Vrati uzol, ktory vo vzostupnom poradi uzlov podla klucov nasleduje za v.
 
* Ak taky uzol neexistuje, vrati NULL. */
 
node *successorNode(node *v) {
 
    assert(v != NULL);
 
    if (v->right != NULL) {
 
        return minNode(v->right);
 
    }
 
    while (v->parent != NULL && v == v->parent->right) {
 
        v = v->parent;
 
    }
 
    return v->parent;
 
}
 
</syntaxhighlight>
 
 
=== Mazanie z binárneho vyhľadávacieho stromu ===
 
 
Nasledujúca funkcia <tt>bstRemove</tt> zmaže z binárneho vyhľadávacieho stromu <tt>t</tt> uzol s kľúčom <tt>key</tt> (ak sa taký uzol v strome vyskytuje).
 
 
* Najprv pomocou funkcie <tt>findNode</tt> nájde uzol <tt>v</tt> s kľúčom <tt>key</tt>.
 
* Ak je ''v'' list, jednoducho ho zmažeme.
 
* Ak má ''v'' jedno dieťa, toto dieťa prevesíme priamo pod rodiča ''v'' a ''v'' zmažeme.
 
* Ak má ''v'' dve deti, nájdeme nasledovníka ''v'', t.j. minimum v pravom podstrome ''v''.
 
* Tento nasledovník nemá ľavé dieťa, vieme ho teda zmazať.
 
* Jeho údaje presunieme do vrcholu ''v''.
 
* Tiež treba dať pozor na mazanie koreňa.
 
 
<syntaxhighlight lang="C++">
 
/* Zmaze zo stromu t uzol s klucom key, ak tam taky je. */
 
void bstRemove(binarySearchTree &t, int key) {
 
    // Najde uzol v s hodnotou, ktoru treba vymazat.
 
    node *v = findNode(t.root, key);                 
 
    if (v == NULL) {
 
        return;
 
    }
 
   
 
    // Najde uzol *rm stromu t, ktory sa napokon realne zmaze. 
 
    node *rm;                                         
 
    if (v->left == NULL || v->right == NULL) {       
 
        rm = v;
 
    } else  {
 
        rm = successorNode(v);
 
    }
 
 
 
    // Ak rm != v, presunie kluc uzla *rm do uzla *v.
 
    if (rm != v) {                                   
 
        v->data = rm->data;
 
    }
 
   
 
    // ak ma uzol rm dieta, jeho rodicom bude rodic rm
 
    node *child;                                     
 
    if (rm->left != NULL) {
 
        child = rm->left;
 
    } else {
 
        child = rm->right;
 
    }                 
 
    if (child != NULL) {
 
        child->parent = rm->parent;
 
    }
 
    if (rm->parent == NULL) {
 
        t.root = child;
 
    } else if (rm == rm->parent->left) {
 
        rm->parent->left = child;   
 
    } else if (rm == rm->parent->right) {
 
        rm->parent->right = child;
 
    }
 
    // rm uz nie je v strome, uvolnime jeho pamat
 
    delete rm;
 
}
 
</syntaxhighlight>
 
 
=== Zložitosť jednotlivých operácií ===
 
 
* Časová zložitosť operácií <tt>bstFind(t)</tt>, <tt>bstInsert(t)</tt> aj <tt>bstRemove(t)</tt> je úmerná výške stromu <tt>t</tt>, ktorú označíme <tt>h</tt>.
 
* Predminule sme ukázali, že pre strom s ''n'' uzlami máme log<sub>2</sub>''(n+1)-1 &le; h &le; n-1''.
 
* Zložitosť uvedených operácií je teda v najhoršom prípade lineárna od počtu uzlov stromu (tento prípad nastane, ak prvky vkladáme od najmenšieho po najväčší alebo naopak).
 
* Dá sa však ukázať, že ak sa prvky vkladajú v náhodnom poradí, výška stromu bude v priemere logaritmická od počtu uzlov.
 
* Na predmete ''Algoritmy a dátové štruktúry'' (druhý ročník) sa tieto tvrdenia dokazujú poriadne a preberajú sa tam aj varianty vyhľadávacích stromov, pre ktoré je zložitosť uvedených operácií logaritmická aj v najhoršom prípade.
 
  
 
== Lexikografické stromy ==
 
== Lexikografické stromy ==

Verzia zo dňa a času 20:25, 3. december 2022

Oznamy

Plán prednášok a cvičení na zvyšok semestra:

  • Dnes pokračujeme stromy.
  • V utorok 14.12. v rámci cvičení tréning na skúšku.
    • Na testovači už sú tréningové príklady na skúšku. Za niektoré budete môcť získať bonusový bod, ak ich vyriešite do 12.1. (ako tréning sa dajú riešiť aj neskôr). V utorok na cvičeniach pribudne ešte jeden tréningový príklad za 4 body. Ak prídete na cvičenia a odovzdáte na konci aspoň rozumne rozrobenú verziu programu, získate jeden bonusový bod, aj keď ho nestihnete dokončiť.
  • V stredu 15.12. ak treba dokončíme stromy, potom nepovinná prednáška o nepreberaných črtách jazykov C a C++ (táto nepovinná časť učiva nebude vyžadovaná na skúške, ale môžete ju použiť).
  • V piatok 17.12. od 12:00 predtermín skúšky, doplnkové cvičenia nebudú

Nezabudnite hlásiť čím skôr prípadné konflikty termínov skúšky s inými predmetmi.

Lexikografické stromy

Lexikografický strom reprezentujúci množinu reťazcov a, aj, ale, aleba, alebo, cez, na, nad.

Lexikografické stromy (niekde tiež prefixové stromy; angl. trie zo slova retrieval) sú dátová štruktúra na uchovávanie množiny reťazcov. Ide o stromy, ktoré nemusia byť binárne:

  • Uzol lexikografického stromu má najviac toľko detí, koľko je znakov v uvažovanej abecede. Každé dieťa je označené iným znakom abecedy. Graficky si môžeme predstaviť tento znak prislúchajúci k hrane spájajúcej rodiča a dieťa.
  • Koreň lexikografického stromu zodpovedá prázdnemu reťazcu.
  • Uzol v hĺbke k zodpovedá reťazcu dĺžky k, ktorý dostaneme prečítaním písmen na ceste z koreňa do daného uzla.
  • Každý uzol lexikografického stromu obsahuje logickú hodnotu vyjadrujúcu, či k nemu prislúchajúci reťazec patrí do množiny reprezentovanej týmto lexikografickým stromom.
  • V korektnom lexikografickom strome všetky listy zodpovedajú reťazcom z reprezentovanej množiny.
  • Vnútorné vrcholy môžu zodpovedať reťazcu z množiny alebo iba prefixu jedného alebo viacerých takých reťazcov.

Uzly lexikografickéeho stromu budeme reprezentovať šruktúrou node

  • Uzol obsahuje obsahuje booleovskú premennú isWord, v ktorej je uložená informácia o tom, či reťazec prislúchajúci k danému uzlu patrí alebo nepatrí do reprezentovanej množiny a pole children smerníkov na jednotlivé deti daného uzla.
  • Veľkosť alphSize tohto poľa je rovná veľkosti uvažovanej abecedy.
  • V ukážkovom programe uvažujeme abecedu 'a'..'z'.


const int alphSize = 'z' - 'a' + 1;

struct node {
    // pole smernikov na deti
    node *children[alphSize]; 
    // udava, ci uzol prislucha k slovu z reprezentovanej mnoziny 
    bool isWord;              
};

Samotný lexikografický strom je potom daný iba smerníkom na svoj koreň:

struct trie {
    node *root;      
};

Inicializácia a likvidácia lexikografického stromu

Nasledujúca funkcia inicializuje prázdny lexikografický strom t:

void trieInit(trie &t) {
    t.root = NULL; 
}

Uvoľnenie pamäte alokovanej pre podstrom zakorenený v uzle root realizujeme obdobne ako pri binárnych vyhľadávacích stromoch. Jediný rozdiel spočíva v potenciálne väčšom počte detí uzla root.

void destroySubtree(node *root) {
    if (root != NULL) {
        for (int i = 0; i < alphSize; i++) {
            destroySubtree(root->children[i]);
        }
        delete root;
    }
}

Nasledujúca funkcia potom zlikviduje celý lexikografický strom t:

void trieDestroy(trie &t) {
    destroySubtree(t.root);
}

Hľadanie v lexikografickom strome

Funkcia trieFind pre daný lexikografický strom t a reťazec word zistí, či slovo word patrí do množiny reprezentovanej stromom t.

  • Postupuje po písmenách reťazca word. Kým nedôjde na koniec slova, snaží sa ísť po hranách, ktoré zodpovedajú jednotlivým písmenám.
  • V prípade, že v niektorom bode narazí na NULL, slovo word sa v strome nenachádza.
  • V opačnom prípade toto slovo dočíta v nejakom uzle v. V takom prípade slovo word patrí do reprezentovanej množiny práve vtedy, keď v->isWord má hodnotu true.
bool trieFind(trie &t, const char *word) {
    node *v = t.root;
    if (v == NULL) {
        return false;
    }
    for (int i = 0; word[i] != 0; i++) {
        int c = word[i] - 'a';
        assert(c >= 0 && c < alphSize);
        v = v->children[c];
        if (v == NULL) {
            return false;
        }
    }
    return v->isWord;
}

Vkladanie do lexikografického stromu

Pri vkladaní reťazca do množiny realizovanej lexikografickým stromom často vznikne potreba vytvárať nové uzly tohto stromu. Túto podúlohu realizuje funkcia createNode, ktorá vytvorí nový uzol s hodnotou isWord danou jej argumentom a so všetkými smerníkmi na deti nastavenými na NULL.

node *createNode(bool isWord) {
    node *v = new node;
    for (int i = 0; i < alphSize; i++) {
        v->children[i] = NULL;
    }
    v->isWord = isWord;
    return v;
}

Vloženie reťazca word do lexikografického stromu t potom realizuje funkcia trieInsert, ktorá pracuje nasledovne:

  • Začne v koreni stromu, odkiaľ postupuje nižšie smerom k listom.
  • V každom uzle sa pozrie na ďalšie písmeno slova word. Ak danému uzlu chýba dieťa pre toto písmeno, vytvorí ho pomocou funkcie createNode. Následne sa presunie do tohto dieťaťa.
  • Ak v nejakom uzle v príde na koniec slova word, nastaví hodnotu v->isWord na true.
void trieInsert(trie &t, const char *word) {
    if (t.root == NULL) {
        t.root = createNode(false);
    }
    node *v = t.root;
    for (int i = 0; word[i] != 0; i++) {
        int c = word[i] - 'a';
        assert(c >= 0 && c < alphSize);
        if (v->children[c] == NULL) {
            v->children[c] = createNode(false);
        }
        v = v->children[c];
    }
    v->isWord = true;
}

Vymazávanie z lexikografického stromu

Vymazávanie slov z množiny reprezentovanej lexikografickým stromom budeme realizovať prostredníctvom pomocnej rekurzívnej funkcie removeFromSubtree.

  • Funkcia z podstromu zakorenenom v uzle root vymaže sufix reťazca word začínajúci na pozícii index.
  • Funkcia vráti booleovskú hodnotu podľa toho, či sa pri tomto vymazaní sufixu z daného podstromu vymazal jeho koreň root.
  • Ak sa slovo word v reprezentovanej množine nenachádza, funkcia removeFromSubtree vyhlási chybu pomocou funkcie assert.

Funkcia removeFromSubtree pracuje nasledovne:

  • Ak je sufix reťazca word začínajúci na indexe index prázdny, nastaví hodnotu root->isWord na false.
  • V opačnom prípade funkcia removeFromSubtree zavolá rekurzívne samú seba pre dieťa zodpovedajúce písmenu na pozícii index reťazca word. Ak toto volanie dané dieťa zmaže, prestaví smerník na toto dieťa na NULL.
  • V prípade, že po vykonaní jednej z predchádzajúcich dvoch operácií nemá uzol root žiadne dieťa a súčasne má root->isWord hodnotu false, uvoľní pamäť alokovanú pre uzol root a informáciu o jeho zmazaní vráti na výstupe.
bool removeFromSubtree(node *root, const char *word, int index) {
    assert(root != NULL);
    if (word[index] == 0) {
        assert(root->isWord);
        root->isWord = false;
    } else {
        int c = word[index] - 'a';
        bool deleted = removeFromSubtree(root->children[c], word, index + 1);
        if (deleted) {          
            root->children[c] = NULL;
        }
    }
    int numChildren = 0;                        
    for (int i = 0; i < alphSize; i++) {
        if (root->children[i] != NULL) {
            numChildren++;
        }
    }
    if (numChildren == 0 && !root->isWord) {
        delete root;
        return true;
    } else {
        return false;
    }
}

Samotné odstránenie reťazca word z množiny reprezentovanej stromom t potom realizuje funkcia trieRemove.

void trieRemove(trie &t, const char *word) {
    // zavolame rekurziu pre koren stromu
    bool rootRemoved = removeFromSubtree(t.root, word, 0);
    // ak bol koren odstraneny, nastavime t.root na NULL
    if (rootRemoved) {
        t.root = NULL;
    }
}

Výška lexikografického stromu

Nasledujúca funkcia vypočíta výšku podstromu zakoreneného v uzle root:

int subtreeHeight(node *root) {
    if (root == NULL) {
        return -1;
    }
    int maxHeight = -1;
    for (int i = 0; i < alphSize; i++) {
        int height = subtreeHeight(root->children[i]);
        if (height > maxHeight) {
            maxHeight = height;
        }
    }
    return maxHeight + 1;
}

Výšku samotného lexikografického stromu t potom spočíta nasledujúca funkcia:

int trieHeight(trie &t) {
    return subtreeHeight(t.root);
}

Vypisovanie slov reprezentovaných lexikografickým stromom

Nasledujúca funkcia printSubtree prehľadáva podstrom zakorenený v uzle root a v reťazci s postupne generuje všetky slová z reprezentovanej množiny, ktoré zároveň vypisuje na konzolu. V parametri index dostane hĺbku aktuálneho vrcholu, t.j. pozíciu, v reťazci, na ktorú pridáme ďalší znak.

void printSubtree(node *root, char *s, int index) {
    if (root == NULL) {
        return;
    }
    if (root->isWord) {
        s[index] = 0; // ukoncenie retazca pred vypisom
        printf("%s\n", s);
    }
    for (int i = 0; i < alphSize; i++) {
        s[index] = 'a' + i;
        printSubtree(root->children[i], s, index + 1);
    }
}

Funkcia triePrint vypisujúca všetky slová v množine reprezentovanej lexikografickým stromom t najprv spočíta výšku stromu t, ktorá je rovná dĺžke najdlšieho reťazca tejto množiny. Následne dynamicky alokuje reťazec dostatočnej dĺžky na uchovanie každého slova množiny a zavolá funkciu printSubtree pre koreň stromu t.

void triePrint(trie &t) {
    int height = trieHeight(t);
    if (height >= 0) { 
        char *s = new char[height + 1];
        printSubtree(t.root, s, 0);
        delete[] s;
    }
}

V akom poradí budú slová vypísané?

Ukážka programu s lexikografickým stromom

Na vstupe máme text pozostávajúci zo slov s malými písmenami a pre každé slovo v texte chceme spočítať, koľkokrát sa tam nachádza.

  • Jednotlivé slová uložíme pomocou lexikografického stromu a v každom uzle si pamätáme namiesto hodnoty isWord počítadlo count, ktoré udáva, koľkokrát sme príslušné slovo videli na vstupe.
  • Počítadlo má hodnotu nula pre prefixy vstupných slov, ktoré samé zatiaľ ako slovo na vstupe neboli.
  • Namiesto funkcie treeInsert máme funkciu treeIncrement, ktorá dostane slovo a zvýši jeho počítadlo, pričom ak slovo zatiaľ v strome nebolo, tak ho pridá.
  • Podobne by sme na tento účel vedeli upraviť aj implementáciu množiny pomocou binárneho vyhľadávacieho stromu, hašovacej tabuľky, poľa alebo zoznamu.
    • Pozor, ak sú kľúče reťazce, na ich porovnanie musíme v týchto implementáciách použiť strcmp, nie ==, < a pod.

Abstraktný dátový typ, ktorý si okrem množiny kľúčov ku každému kľúču pamätá aj ďalšie dáta, sa zvykne nazývať slovník (angl. dictionary, map).

  • Tu boli kľúče slová a ďalšie dáta počet výskytov.
  • Iný príklad je zoznam kontaktov, kde kľúčom je meno osoby a pre dané meno chceme vrátiť kontaktné údaje danej osoby (emailová adresa, telefón a pod.)


#include <cstdio>
#include <cassert>
#include <cstring>
using namespace std;

const int alphSize = 'z' - 'a' + 1;

// uzol lexikografickeho stromu
struct node {
    // pole smernikov na deti
    node *children[alphSize];
    // pocet vyskytov slova prisluchajuceho uzlu
    int count;
};

// cely lexikograficky strom 
struct trie {
    node *root;
};


// inicializacia prazdneho stormu
void trieInit(trie &t) {
    t.root = NULL;
}

// mazanie podstromu s korenom root
void destroySubtree(node *root) {
    if (root != NULL) {
        for (int i = 0; i < alphSize; i++) {
            destroySubtree(root->children[i]);
        }
        delete root;
    }
}

// uvolnenie pamate celeho stromu
void trieDestroy(trie &t) {
    destroySubtree(t.root);
}

// vytvorenie noveo uzlu bez deti a s nula vyskytmi
node *createNode() {
    node *v = new node;
    for (int i = 0; i < alphSize; i++) {
        v->children[i] = NULL;
    }
    v->count = 0;
    return v;
}

// zvysenie pocitadla pre slovo word
// ak slovo este nie je v strome, je pridane
void trieIncrement(trie &t, const char *word) {
    if (t.root == NULL) {
        t.root = createNode();
    }
    node *v = t.root;
    for (int i = 0; word[i] != 0; i++) {
        int c = word[i] - 'a';
        assert(c >= 0 && c < alphSize);
        if (v->children[c] == NULL) {
            v->children[c] = createNode();
        }
        v = v->children[c];
    }
    v->count++;
}

// vyska podstromu s korenom root
int subtreeHeight(node *root) {
    if (root == NULL) {
        return -1;
    }
    int maxHeight = -1;
    for (int i = 0; i < alphSize; i++) {
        int height = subtreeHeight(root->children[i]);
        if (height > maxHeight) {
            maxHeight = height;
        }
    }
    return maxHeight + 1;
}

// vyska stromu. t.j. dlzka najdlsieho slova
int trieHeight(trie &t) {
    return subtreeHeight(t.root);
}

// vypisanie slov v podstrome lexikografickeho stromu
void printSubtree(node *root, char *s, int index) {
    if (root == NULL) {
        return;
    }
    if (root->count > 0) {
        s[index] = 0; // ukoncenie retazca pred vypisom
        printf("%s %d\n", s, root->count);
    }
    for (int i = 0; i < alphSize; i++) {
        s[index] = 'a' + i;
        printSubtree(root->children[i], s, index + 1);
    }
}

// vypisanie slov lexikografickeho stromu
void triePrint(trie &t) {
    int height = trieHeight(t);
    if (height >= 0) {
        char *s = new char[height + 1];
        printSubtree(t.root, s, 0);
        delete[] s;
    }
}

int main() {
    // inicializacia stromu
    trie t;
    trieInit(t);
    // postupne nacitavanie slov
    char word[100];
    while (true) {
        int count = scanf("%99s", word);
        if (count < 1) { // koniec vstupu
            break;
        }
	// pridanie slova resp. zvysenie pocitadla
        trieIncrement(t, word);
    }
    // vypis a uvolnenie pamate
    triePrint(t);
    trieDestroy(t);
}

Sylaby predmetu

Základy

Konštrukcie jazyka C

  • premenné typov int, double, char, bool, konverzie medzi nimi
  • podmienky (if, else, switch), cykly (for, while)
  • funkcie (a parametre funkcií - odovzdávanie hodnotou, referenciou, smerníkom)
void f1(int x){}                                 //hodnotou
void f2(int &x){}                                //referenciou
void f3(int* x){}                                //smerníkom
void f(int a[], int n){}                         //polia bez & (ostanú zmeny)
void kresli(Turtle &t){}                         //korytnačky, SVGdraw a pod. s &

Polia, reťazce (char[])

int A[4]={3, 6, 8, 10}; 
int B[4];               
B[0]=3; B[1]=6; B[2]=8; B[3]=10;

char C[100] = "pes";
char D[100] = {'p', 'e', 's', 0};
  • funkcie strlen, strcpy, strcmp, strcat

Súbory, spracovanie vstupu

  • cin, cout alebo printf, scanf
  • fopen, fclose, feof
  • fprintf, fscanf
  • getc, putc, ungetc, fgets, fputs
  • spracovanie súboru po znakoch, po riadkoch, po číslach alebo slovách

Smerníky, dynamicky alokovaná pamäť, dvojrozmerné polia

int i;    // „klasická“ celočíselná premenná
int *p;   // ukazovateľ na celočíselnú premennú

p = &i;         // spravne
p = &(i + 3);   // zle i+3 nie je premenna
p = &15;        // zle konstanta nema adresu
i = *p;         // spravne ak p bol inicializovany

int * cislo = new int;  // alokovanie jednej premennej
*cislo = 50;
..
delete cislo;

int a[4];
int *b = a;  // a,b su teraz takmer rovnocenne premenne 

int *A = new int[n]; // alokovanie 1D pola danej dlzky
..
delete[] A;

int **a;       // alokovanie 2D matice
a = new int *[n];
for (int i = 0; i < n; i++) a[i] = new int[m];
..
for (int i = 0; i < n; i++) delete[] a[i];
delete[] a;

Abstraktné dátové typy

Abstraktný dátový typ dynamické pole (rastúce pole)

  • operácie init, add, get, set, length

Abstraktný dátový typ dynamická množina (set)

  • operácie init, contains, add, remove
  • implementácie pomocou
    • neutriedeného poľa
    • utriedeného poľa
    • spájaných zoznamov
    • hašovacej tabuľky
    • binárnych vyhľadávacích stromov
    • lexikografického stromu (ak kľúč je reťazec)

Abstraktné dátové typy rad a zásobník

  • operácie pre rad (frontu, queue): init, isEmpty, enqueue, dequeue, peek
  • operácie pre zásobník (stack): init, isEmpty, push, pop
  • implementácie: v poli alebo v spájanom zozname
  • využitie: ukladanie dát na spracovanie, odstránenie rekurzie
  • kontrola zátvoriek a vyhodnocovanie výrazov pomocou zásobníka

Dátové štruktúry

PROG-list.png

Spájané zoznamy

struct node {
    int data;
    node* next;
};
struct linkedList {
    node* first;
};
void insertFirst(linkedList &z, int d){
    /* do zoznamu z vlozi na zaciatok novy prvok s datami d */
    node* p = new node;   // vytvoríme nový prvok
    p->data = d;          // naplníme dáta
    p->next = z.first;    // uzol ukazuje na doterajší začiatok
    z.first = p;          // tento prvok je novým začiatkom
}
Strom pre výraz (65 – 3*5)/(2 + 3)

Binárne stromy

struct node {
    /* vrchol stromu  */
    dataType data;
    node * left;  /* lave dieta */
    node * right; /* prave dieta */
};

node * createNode(dataType data, node *left, node *right) {
    node *v = new node;
    v->data = data;
    v->left = left;
    v->right = right;
    return v;
}
  • prehľadávanie inorder, preorder, postorder
  • použitie na uloženie aritmetických výrazov
P22-BST.png

Binárne vyhľadávacie stromy

  • vrcholy vľavo od koreňa menší kľúč, vpravo od koreňa väčší
  • insert, find, remove v čase závisiacom od hĺbky stromu
Lexikografický strom reprezentujúci množinu reťazcov a, aj, ale, aleba, alebo, cez, na, nad.

Lexikografické stromy

  • ukladajú množinu reťazcov
  • nie sú binárne: vrchol môže mať veľa detí
  • insert, find, remove v čase závisiacom od dĺžky kľúča, ale nie od počtu kľúčov, ktoré už sú v strome
struct node { // uzol lexikografickeho stromu 
    bool isWord; // je tento uzol koncom slova?
    node* next[Abeceda]; // pole smernikov na deti    
};


Hašovanie

  • hašovacia tabuľka veľkosti m
  • kľúč k premietneme nejakou funkciou na index v poli (0,...,m-1}
  • každé políčko hašovacej tabuľky spájaný zoznam prvkov, ktoré sa tam zahašovali
  • v ideálnom prípade sa prvky rozhodia pomerne rovnomerne, zoznamy krátke, rýchle hľadanie, vkladenie, mazanie
  • v najhoršom prípade všetky prvky v jednom zozname, pomalé hľadanie a mazanie
int hash(int k, int m){ // veľmi jednoduchá hašovacia funkcia, v praxi väčšinou zložitejšie
    return abs(k) % m;
}
struct node {
    int data;
    node* next;
};

struct set {
    node** data;
    int m;
};

Algoritmy

Rekurzia

  • Rekurzívne funkcie
  • Vykresľovanie fraktálov
  • Prehľadávanie s návratom (backtracking)
  • Vyfarbovanie
  • Prehľadávanie stromov

Triedenia

  • nerekurzívne: Bubblesort, Selectionsort, Insertsort
  • rekurzívne: Mergesort, Quicksort
  • súvisiace algoritmy: binárne vyhľadávanie

Matematické úlohy

  • Euklidov algoritmus, Eratostenovo sito
  • Práca s aritmetickými výrazmi: vyhodnocovanie postfixovej formy, prevod z infixovej do postfixovej, reprezentácia vo forme stromu