Programovanie (2) v Jave
1-INF-166, letný semester 2023/24

Prednášky · Pravidlá · Softvér · Testovač
· Vyučujúcich predmetu možno kontaktovať mailom na adresách uvedených na hlavnej stránke. Hromadná mailová adresa zo zimného semestra v letnom semestri nefunguje.
· JavaFX: cesta k adresáru lib je v počítačových učebniach /usr/share/openjfx/lib.


Prednáška 21: Rozdiel medzi revíziami

Z Programovanie
Skočit na navigaci Skočit na vyhledávání
(9 medziľahlých úprav od rovnakého používateľa nie je zobrazených.)
Riadok 1: Riadok 1:
 
== Oznamy ==
 
== Oznamy ==
  
<!--
+
* Tretiu domácu úlohu odovzdávajte do dnes 22:00.
Plán prednášok a cvičení na zvyšok semestra:
+
 
* Dnes informácia o skúškach, [[Zimný semester, skúška|detaily skúšky z programovania]], pokračujeme v učive o stromoch
+
Prednášky
* Tento piatok 10.12. cez cvičenia [[Zimný semester, semestrálny test|semestrálny test]].
+
* V stredu v prvej polovici prednášky informácie k skúške a rady k skúškovému všeobecne, potom doberieme posledné učivo
* V pondelok 13.12. bude bežná prednáška, pokračujú stromy.
+
* Budúci pondelok nepovinná prednáška o nepreberaných črtách jazykov C a C++
* V stredu 15.12. dokončíme stromy, potom nepovinná prednáška o nepreberaných črtách jazykov C a C++ (táto nepovinná časť učiva nebude vyžadovaná na skúške, ale môžete ju použiť).
+
* Budúcu stredu 14.12. cez prednášku [[Zimný semester, semestrálny test|semestrálny test]]
* V utorok 14.12. v rámci cvičení tréning na skúšku.
+
 
** Už dnes po prednáške sa na testovači objavia tréningové príklady na skúšku. Za niektoré budete môcť získať bonusový bod, ak ich vyriešite do 12.1. (ako tréning sa dajú riešiť aj neskôr). V utorok na cvičeniach pribudne ešte jeden tréningový príklad za 4 body. Ak prídete na cvičenia a odovzdáte na konci aspoň rozumne rozrobenú verziu programu, získate jeden bonusový bod, aj keď ho nestihnete dokončiť.
+
Cvičenia
* V piatok 17.12. od 12:00 predtermín skúšky, doplnkové cvičenia nebudú
+
* Zajtra bude rozcvička na papieri, potom pokračujte riešením úloh na testovači
-->
+
* V piatok posledné doplnkové cvičenia
 +
* Budúci utorok v rámci cvičení tréning na skúšku
 +
* Na testovači už je niekoľko tréningových príkladov, za niektoré môžete dostať aj bonusový bod do cvičení, ešte dva príklady pribudnú neskôr
 +
* V piatok 16.12. od 13:00 predtermín skúšky, doplnkové cvičenia nebudú
 +
 
 +
Začneme dokončením učiva z [[Prednáška 20#Ak.C3.A1_m.C3.B4.C5.BEe_by.C5.A5_v.C3.BD.C5.A1ka_bin.C3.A1rneho_stromu.3F |predchádzajúcej prednášky]]
  
 
== Binárne vyhľadávacie stromy ==
 
== Binárne vyhľadávacie stromy ==
  
 
[[Image:P22-BST.png|200px|right|thumb|Príklad binárneho vyhľadávacieho stromu.]]
 
[[Image:P22-BST.png|200px|right|thumb|Príklad binárneho vyhľadávacieho stromu.]]
Stromy sa v informatike často používajú. Ďalším príkladom sú binárne vyhľadávacie stromy, ktoré slúžia na ukladanie množiny prvkov. Prvky množiny teda nemáme v poli, ani v spájanom zozname, ale vo vrcholoch binárneho stromu.
+
Stromy sa v informatike používajú na veľa účelov. Ďalším príkladom sú binárne vyhľadávacie stromy, ktoré môžu slúžiť na implementovanie abstraktného dátového typu dynamická množina, ktorý sme videli na [[Prednáška 14#Dynamick.C3.A1_mno.C5.BEina_2|prednáške 14]]. Prvky množiny nebudeme ukladať  do poľa, ani v spájaného zoznamu, ale do vrcholoch binárneho stromu.
* V binárnom vyhľadávacom strome má každý vrchol 0,1 alebo 2 deti
+
* V binárnom vyhľadávacom strome má každý vrchol 0, 1 alebo 2 deti
* V každom vrchole máme položku s dátami (pre jednoduchosť typu <tt>int</tt>)
+
* V každom vrchole máme položku s dátami (pre jednoduchosť typu <tt>int</tt>), tieto dáta niekedy voláme aj kľúč
 
* Pre každý vrchol ''v'' stromu platí:
 
* Pre každý vrchol ''v'' stromu platí:
 
** Každý vrchol v ľavom podstrome ''v'' má hodnotu <tt>data</tt> menšiu ako vrchol ''v''
 
** Každý vrchol v ľavom podstrome ''v'' má hodnotu <tt>data</tt> menšiu ako vrchol ''v''
Riadok 23: Riadok 28:
 
* Z toho vyplýva, že ak vypíšeme strom v inorder poradí, dostaneme prvky usporiadané
 
* Z toho vyplýva, že ak vypíšeme strom v inorder poradí, dostaneme prvky usporiadané
 
* Pre danú množinu kľúčov existuje veľa vyhľadávacích stromov
 
* Pre danú množinu kľúčov existuje veľa vyhľadávacích stromov
 
  
 
''Cvičenie'': nájdite všetky binárne vyhľadávacie stromy pozostávajúce z troch uzlov s kľúčmi ''1, 2, 3''.
 
''Cvičenie'': nájdite všetky binárne vyhľadávacie stromy pozostávajúce z troch uzlov s kľúčmi ''1, 2, 3''.
Riadok 37: Riadok 41:
 
struct node {
 
struct node {
 
     /* vrchol binárneho vyhľadávacieho stromu  */
 
     /* vrchol binárneho vyhľadávacieho stromu  */
     int data;      /* hodnota */
+
     int data;      /* hodnota uložená vo vrchole */
 
     node * parent;  /* rodič vrchola, NULL v koreni */
 
     node * parent;  /* rodič vrchola, NULL v koreni */
 
     node * left;    /* ľavé dieťa, NULL ak neexistuje */
 
     node * left;    /* ľavé dieťa, NULL ak neexistuje */
Riadok 43: Riadok 47:
 
};
 
};
  
/* Samotná štruktúra binárneho vyhľadávacieho stromu (obal pre používateľa). */
+
/* Samotná dynamická množina (obal pre používateľa). */
struct binarySearchTree {
+
struct set {
 
     node *root;  /* koreň stromu, NULL pre prázdny strom */
 
     node *root;  /* koreň stromu, NULL pre prázdny strom */
 
};
 
};
Riadok 51: Riadok 55:
 
Inicializácia prázdneho binárneho vyhľadávacieho stromu
 
Inicializácia prázdneho binárneho vyhľadávacieho stromu
 
<syntaxhighlight lang="C++">
 
<syntaxhighlight lang="C++">
/** Funkcia inicializuje prázdny binárny vyhľadávací strom */
+
/* Funkcia inicializuje prázdny binárny vyhľadávací strom */
void bstInit(binarySearchTree &t) {  
+
void init(set &s) {
     t.root = NULL;
+
     s.root = NULL;
 
}
 
}
 
</syntaxhighlight>
 
</syntaxhighlight>
Riadok 59: Riadok 63:
 
=== Likvidácia binárneho vyhľadávacieho stromu ===
 
=== Likvidácia binárneho vyhľadávacieho stromu ===
  
Likvidáciu podstromu zakoreneného v danom uzle <tt>root</tt> realizujeme funkciou <tt>destroy</tt>, obdobne ako pri všeobecných binárnych stromoch. Používateľovi navyše dáme k dispozícii aj funkciu <tt>bstDestroy</tt>, ktorá zlikviduje binárny vyhľadávací strom <tt>t</tt> tak, že zavolá funkciu <tt>destroy</tt> na jeho koreň.
+
Likvidáciu podstromu zakoreneného v danom uzle <tt>root</tt> realizujeme funkciou <tt>destroy</tt>, obdobne ako pri všeobecných binárnych stromoch. Používateľovi navyše dáme k dispozícii aj funkciu <tt>destroy</tt>, ktorá dostane množinu implementovanú ako strom a tento strom zlikviduje.
  
 
<syntaxhighlight lang="C++">
 
<syntaxhighlight lang="C++">
Riadok 71: Riadok 75:
 
}
 
}
  
/* Zlikviduje strom t (uvolni pamat). */
+
/* Zlikviduje množinu s (uvoľní pamäť). */
void bstDestroy(binarySearchTree &t) {
+
void destroy(set &s) {
     destroy(t.root);
+
     destroy(s.root);
 
}
 
}
 
</syntaxhighlight>
 
</syntaxhighlight>
Riadok 87: Riadok 91:
 
* Dá sa zapísať rekurzívne alebo cyklom, lebo vždy ideme iba do jedného podstromu
 
* Dá sa zapísať rekurzívne alebo cyklom, lebo vždy ideme iba do jedného podstromu
  
Funkcia <tt>bstFind</tt> zavolá funkciu <tt>findNode</tt> pre koreň daného binárneho vyhľadávacieho stromu <tt>t</tt> a pomocou nej zistí, či tento strom obsahuje uzol s kľúčom <tt>key</tt>.
+
Funkcia <tt>contains</tt> zavolá funkciu <tt>findNode</tt> pre koreň daného binárneho vyhľadávacieho stromu <tt>t</tt> a pomocou nej zistí, či tento strom obsahuje uzol s kľúčom <tt>key</tt>.
  
 
<syntaxhighlight lang="C++">
 
<syntaxhighlight lang="C++">
Riadok 104: Riadok 108:
 
}
 
}
  
/** Rekurzívna verzia */
+
/* Rekurzívna verzia */
 
node *findNodeR(node *root, int key) {
 
node *findNodeR(node *root, int key) {
 
     if (root == NULL || key == root->data) {
 
     if (root == NULL || key == root->data) {
Riadok 115: Riadok 119:
 
}
 
}
  
/* Zisti, ci strom t obsahuje uzol s klucom key. */
+
/* Zisti, ci strom reprezentujuci mnozinu s
bool bstFind(binarySearchTree &t, int key) {
+
* obsahuje uzol s klucom key. */
     return findNode(t.root, key) != NULL;
+
bool contains(set &s, int key) {
 +
     return findNode(s.root, key) != NULL;
 
}
 
}
 
</syntaxhighlight>
 
</syntaxhighlight>
  
 
Čas výpočtu je v najhoršom prípade úmerný výške stromu.
 
Čas výpočtu je v najhoršom prípade úmerný výške stromu.
 +
 +
 +
=== Vkladanie do binárneho vyhľadávacieho stromu ===
 +
 +
Nasledujúca funkcia <tt>insertNode</tt> vloží uzol <tt>*v</tt> na správne miesto podstromu zakoreneného v <tt>*root</tt> ako jeho list.
 +
* Predpokladáme, že prvok v strome nie je.
 +
* Putujeme po strome podobne ako pri vyhľadávaní prvku, až kým nenarazíme na nulový smerník.
 +
** Na tomto mieste by mal byť nový prvok, takže ho tam pridáme ako nový list
 +
** Uvádzame rekurzívnu verziu, ale dá sa aj cyklom, podobne ako pri hľadaní
 +
* Funkcia <tt>add</tt> vytvorí uzol s daným kľúčom <tt>key</tt> a pomocou funkcie <tt>insertNode</tt> ho vloží do binárneho vyhľadávacieho stromu.
 +
 +
<syntaxhighlight lang="C++">
 +
/* Vloží uzol v na správne miesto podstromu zakoreneného v root */
 +
void insertNode(node *root, node *v) {
 +
    assert(root != NULL && v != NULL);
 +
    if (v->data < root->data) {
 +
        if (root->left == NULL) {
 +
            root->left = v;
 +
            v->parent = root;
 +
        } else {
 +
            insertNode(root->left, v);
 +
        }
 +
    } else {
 +
        if (root->right == NULL) {
 +
            root->right = v;
 +
            v->parent = root;
 +
        } else {
 +
            insertNode(root->right, v);
 +
        }
 +
    }
 +
}
 +
 +
/* Vloží do stromu pre mnozinu s nový uzol s kľúčom key. */
 +
void add(set &s, int key) {
 +
    node *v = new node;
 +
    v->data = key;
 +
    v->left = NULL;
 +
    v->right = NULL;
 +
    v->parent = NULL;
 +
    if (s.root == NULL) {
 +
        // specialny pripad, ked vkladame prvy uzol
 +
        s.root = v;
 +
    } else {
 +
        insertNode(s.root, v);
 +
    }
 +
}
 +
</syntaxhighlight>
 +
 +
Čas vkladania je tiež v najhoršom prípade úmerný hĺbke stromu.
 +
 +
'''Cvičenia'''
 +
* Napíšte nerekurzívny variant funkcie <tt>insertNode</tt>.
 +
* Napíšte funkciu <tt>treeSort</tt>, ktorá z poľa celých čísel <tt>a</tt> pomocou volaní funkcie <tt>add</tt> vytvorí binárny vyhľadávací strom a následne pomocou prehľadávania tohto stromu v poradí ''inorder'' pole <tt>a</tt> utriedi.
 +
* Ako bude vyzerať strom po nasledujúcej postupnosti operácií?
 +
<pre>
 +
    set s;
 +
    init(s);
 +
    add(s, 2);
 +
    add(s, 5);
 +
    add(s, 3);
 +
    add(s, 10);
 +
    add(s, 7); 
 +
</pre>
 +
 +
===Minimum a následník===
 +
Uvedieme teraz dve funkcie, ktoré sa zídu pri mazaní prvku zo stromu, ale môžu sa zísť aj inokedy.
 +
 +
Prvá funkcia <tt>minNode</tt> nájde vo vyhľadávacom strome uzol, v ktorom je uložená najmenšia hodnota.
 +
* Všetky prvky menšie ako koreň sú v ľavom podstrome, bude tam zrejme aj minimum.
 +
* Tá istá úvaha platí pre koreň ľavého podstromu.
 +
* Ideme teda doľava kým sa dá, posledný vrchol vrátime (list alebo vrchol, ktorý má iba pravé dieťa).
 +
* Nie je treba teda prechádzať celý strom a nemusíme sa ani pozerať na položku data v uzloch.
 +
* Dá sa napísať cyklom aj rekurzívne.
 +
* Obalom pre používateľa bude funkcia <tt>min</tt>, ktorá pomocou funkcie <tt>minNode</tt> nájde minimálny kľúč v danej množine.
 +
 +
<syntaxhighlight lang="C++">
 +
/* Vrati uzol s minimalnou hodnotou data v podstrome s korenom v. */
 +
node *minNode(node *v) {
 +
    assert(v != NULL);
 +
    while (v->left != NULL) {
 +
        v = v->left;
 +
    }
 +
    return v;
 +
}
 +
 +
/* Vrati minimalnu hodnotu v mnozine s. */
 +
int min(set &s) {
 +
    assert(s.root != NULL);
 +
    return minNode(s.root)->data;
 +
}
 +
</syntaxhighlight>
 +
 +
''Cvičenia'':
 +
* Napíšte rekurzívny variant funkcie <tt>minNode</tt>.
 +
* Ako by bolo treba funkciu zmeniť, aby hľadala maximum?
 +
 +
 +
Funkcia <tt>successorNode</tt> nájde pre daný uzol <tt>v</tt> jeho ''následníka'' (angl. ''successor'') v binárnom vyhľadávacom strome, čiže uzol, ktorý vo vzostupnom poradí podľa kľúčov nasleduje bezprostredne za uzlom <tt>v</tt>.
 +
* Ak má uzol <tt>v</tt> pravé dieťa, následník uzla <tt>v</tt> bude vrchol s minimálnou hodnotou data v pravom podstrome
 +
* V opačnom prípade môže byť následníkom uzla <tt>v</tt> jeho rodič, ak <tt>v</tt> je jeho ľavé dieťa.
 +
* Ak je <tt>v</tt> pravým dieťaťom svojho rodiča, môže to byť jeho prarodič (ak je rodič uzla <tt>v</tt> ľavým dieťaťom tohto prarodiča), atď.
 +
* Vo všeobecnosti teda ide o najbližšieho predka uzla <tt>v</tt> takého, že <tt>v</tt> patrí do jeho ľavého podstromu.
 +
* V strome existuje práve jeden uzol bez následníka (najväčší prvok).
 +
** Ako presne sa bude funkcia nižšie pre tento prvok správať?
 +
 +
<syntaxhighlight lang="C++">
 +
/* Vrati uzol, ktory vo vzostupnom poradi uzlov podla
 +
* klucov nasleduje za v.
 +
* Ak taky uzol neexistuje, vrati NULL. */
 +
node *successorNode(node *v) {
 +
    assert(v != NULL);
 +
    if (v->right != NULL) {
 +
        return minNode(v->right);
 +
    }
 +
    while (v->parent != NULL && v == v->parent->right) {
 +
        v = v->parent;
 +
    }
 +
    return v->parent;
 +
}
 +
</syntaxhighlight>
 +
 +
=== Mazanie z binárneho vyhľadávacieho stromu ===
 +
 +
Nasledujúca funkcia <tt>remove</tt> zmaže z binárneho vyhľadávacieho stromu uzol s kľúčom <tt>key</tt> (ak sa taký uzol v strome vyskytuje).
 +
 +
* Najprv pomocou funkcie <tt>findNode</tt> nájde uzol <tt>v</tt> s kľúčom <tt>key</tt>.
 +
* Ak je ''v'' list, jednoducho ho zmažeme.
 +
* Ak má ''v'' jedno dieťa, toto dieťa prevesíme priamo pod rodiča ''v'' a ''v'' zmažeme.
 +
* Ak má ''v'' dve deti, nájdeme nasledovníka ''v'', t.j. minimum v pravom podstrome ''v''.
 +
* Tento nasledovník nemá ľavé dieťa, vieme ho teda zmazať.
 +
* Jeho údaje presunieme do vrcholu ''v''.
 +
* Tiež treba dať pozor na mazanie koreňa.
 +
 +
<syntaxhighlight lang="C++">
 +
/* Zmaze zo stromu pre mnozinu s uzol s klucom key, ak tam taky je. */
 +
void remove(set &s, int key) {
 +
    // Najde uzol s hodnotou, ktoru treba vymazat.
 +
    node *v = findNode(s.root, key);                 
 +
    if (v == NULL) {
 +
        // pozadovany uzol neexistuje
 +
        return;
 +
    }
 +
   
 +
    // Najde uzol *rm, ktory sa napokon realne zmaze. 
 +
    node *rm;                                         
 +
    if (v->left == NULL || v->right == NULL) {       
 +
        rm = v;
 +
    } else  {
 +
        rm = successorNode(v);
 +
    }
 +
 
 +
    // Ak rm != v, presunie kluc uzla *rm do uzla *v.
 +
    if (rm != v) {                                   
 +
        v->data = rm->data;
 +
    }
 +
   
 +
    // ak ma uzol rm dieta, jeho rodicom bude rodic rm
 +
    node *child;                                     
 +
    if (rm->left != NULL) {
 +
        child = rm->left;
 +
    } else {
 +
        child = rm->right;
 +
    }
 +
    if (child != NULL) {
 +
        child->parent = rm->parent;
 +
    }
 +
    if (rm->parent == NULL) {
 +
        s.root = child;
 +
    } else if (rm == rm->parent->left) {
 +
        rm->parent->left = child;   
 +
    } else if (rm == rm->parent->right) {
 +
        rm->parent->right = child;
 +
    }
 +
    // rm uz nie je v strome, uvolnime jeho pamat
 +
    delete rm;
 +
}
 +
</syntaxhighlight>
 +
 +
=== Zložitosť jednotlivých operácií ===
 +
 +
* Časová zložitosť operácií <tt>contains</tt>, <tt>add</tt> aj <tt>remove</tt> je úmerná výške stromu, ktorú označíme <tt>h</tt>.
 +
* Minule sme ukázali, že pre strom s ''n'' uzlami máme log<sub>2</sub>''(n+1)-1 &le; h &le; n-1''.
 +
* Zložitosť uvedených operácií je teda v najhoršom prípade lineárna od počtu uzlov stromu (tento prípad nastane, ak prvky vkladáme od najmenšieho po najväčší alebo naopak).
 +
* Dá sa však ukázať, že ak sa prvky vkladajú v náhodnom poradí, výška stromu bude v priemere logaritmická od počtu uzlov.
 +
* Na predmete ''Algoritmy a dátové štruktúry'' (druhý ročník) sa tieto tvrdenia dokazujú poriadne a preberajú sa tam aj varianty vyhľadávacích stromov, pre ktoré je zložitosť uvedených operácií logaritmická aj v najhoršom prípade.

Verzia zo dňa a času 22:19, 3. december 2022

Oznamy

  • Tretiu domácu úlohu odovzdávajte do dnes 22:00.

Prednášky

  • V stredu v prvej polovici prednášky informácie k skúške a rady k skúškovému všeobecne, potom doberieme posledné učivo
  • Budúci pondelok nepovinná prednáška o nepreberaných črtách jazykov C a C++
  • Budúcu stredu 14.12. cez prednášku semestrálny test

Cvičenia

  • Zajtra bude rozcvička na papieri, potom pokračujte riešením úloh na testovači
  • V piatok posledné doplnkové cvičenia
  • Budúci utorok v rámci cvičení tréning na skúšku
  • Na testovači už je niekoľko tréningových príkladov, za niektoré môžete dostať aj bonusový bod do cvičení, ešte dva príklady pribudnú neskôr
  • V piatok 16.12. od 13:00 predtermín skúšky, doplnkové cvičenia nebudú

Začneme dokončením učiva z predchádzajúcej prednášky

Binárne vyhľadávacie stromy

Príklad binárneho vyhľadávacieho stromu.

Stromy sa v informatike používajú na veľa účelov. Ďalším príkladom sú binárne vyhľadávacie stromy, ktoré môžu slúžiť na implementovanie abstraktného dátového typu dynamická množina, ktorý sme videli na prednáške 14. Prvky množiny nebudeme ukladať do poľa, ani v spájaného zoznamu, ale do vrcholoch binárneho stromu.

  • V binárnom vyhľadávacom strome má každý vrchol 0, 1 alebo 2 deti
  • V každom vrchole máme položku s dátami (pre jednoduchosť typu int), tieto dáta niekedy voláme aj kľúč
  • Pre každý vrchol v stromu platí:
    • Každý vrchol v ľavom podstrome v má hodnotu data menšiu ako vrchol v
    • Každý vrchol v pravom podstrome v má hodnotu data väčšiu ako vrchol v
  • Z toho vyplýva, že ak vypíšeme strom v inorder poradí, dostaneme prvky usporiadané
  • Pre danú množinu kľúčov existuje veľa vyhľadávacích stromov

Cvičenie: nájdite všetky binárne vyhľadávacie stromy pozostávajúce z troch uzlov s kľúčmi 1, 2, 3.

Definícia dátových štruktúr

Vrchol typu node

  • Položka data typu int
  • Smerník na ľavé a pravé dieťa
  • Na niektoré úlohy (napr. mazanie vrcholu) sa hodí aj smerník na rodiča (ten má hodnotu NULL v koreni)

Celý strom je štruktúra obsahujúca iba smerník na koreň

  • Pre prázdny strom je to NULL.
struct node {
    /* vrchol binárneho vyhľadávacieho stromu  */
    int data;       /* hodnota uložená vo vrchole */
    node * parent;  /* rodič vrchola, NULL v koreni */
    node * left;    /* ľavé dieťa, NULL ak neexistuje */
    node * right;   /* pravé dieťa, NULL ak neexistuje */
};

/* Samotná dynamická množina (obal pre používateľa). */
struct set {
    node *root;  /* koreň stromu, NULL pre prázdny strom */
};

Inicializácia prázdneho binárneho vyhľadávacieho stromu

/* Funkcia inicializuje prázdny binárny vyhľadávací strom */
void init(set &s) {
    s.root = NULL;
}

Likvidácia binárneho vyhľadávacieho stromu

Likvidáciu podstromu zakoreneného v danom uzle root realizujeme funkciou destroy, obdobne ako pri všeobecných binárnych stromoch. Používateľovi navyše dáme k dispozícii aj funkciu destroy, ktorá dostane množinu implementovanú ako strom a tento strom zlikviduje.

/* Uvolni pamat pre podstrom s korenom *root. */
void destroy(node *root) {
    if (root != NULL) {
        destroy(root->left);
        destroy(root->right);
        delete root;
    }
}

/* Zlikviduje množinu s (uvoľní pamäť). */
void destroy(set &s) {
    destroy(s.root);
}

Hľadanie v binárnom vyhľadávacom strome

Funkcia findNode v podstrome s koreňom root hľadá uzol, ktorého položka dáta obsahuje hľadaný kľúč key. Vráti takýto uzol alebo NULL ak neexistuje

  • Najskôr porovná hľadaný kľúč s dátami v koreni
    • Ak sa rovnajú, končíme (našli sme, čo hľadáme)
    • Ak je hľadaná hodnota menšia ako dáta v koreni, musí byť v ľavom podstrome, ak je väčšia v pravom
  • V príslušnom podstrome sa rozhodujeme podľa tých istých pravidiel
  • Keď narazíme na prázdny podstrom, dáta sa v strome nenachádzajú
  • Dá sa zapísať rekurzívne alebo cyklom, lebo vždy ideme iba do jedného podstromu

Funkcia contains zavolá funkciu findNode pre koreň daného binárneho vyhľadávacieho stromu t a pomocou nej zistí, či tento strom obsahuje uzol s kľúčom key.

/* Ak v strome s korenom root existuje uzol s klucom key, 
 * vrati ho na vystupe. Inak vrati NULL. */
node * findNode(node *root, int key) {
    node * v = root;
    while (v != NULL && v->data != key) {
        if (key < v->data) {
            v = v->left;
        } else {
            v = v->right;
        }
    }
    return v;
}

/* Rekurzívna verzia */
node *findNodeR(node *root, int key) {
    if (root == NULL || key == root->data) {
        return root;
    } else if (key < root->data) {
        return findNodeR(root->left, key);
    } else {  // key > root->data
        return findNodeR(root->right, key);
    }
}

/* Zisti, ci strom reprezentujuci mnozinu s 
 * obsahuje uzol s klucom key. */
bool contains(set &s, int key) {
    return findNode(s.root, key) != NULL;
}

Čas výpočtu je v najhoršom prípade úmerný výške stromu.


Vkladanie do binárneho vyhľadávacieho stromu

Nasledujúca funkcia insertNode vloží uzol *v na správne miesto podstromu zakoreneného v *root ako jeho list.

  • Predpokladáme, že prvok v strome nie je.
  • Putujeme po strome podobne ako pri vyhľadávaní prvku, až kým nenarazíme na nulový smerník.
    • Na tomto mieste by mal byť nový prvok, takže ho tam pridáme ako nový list
    • Uvádzame rekurzívnu verziu, ale dá sa aj cyklom, podobne ako pri hľadaní
  • Funkcia add vytvorí uzol s daným kľúčom key a pomocou funkcie insertNode ho vloží do binárneho vyhľadávacieho stromu.
/* Vloží uzol v na správne miesto podstromu zakoreneného v root */
void insertNode(node *root, node *v) {
    assert(root != NULL && v != NULL);
    if (v->data < root->data) {
        if (root->left == NULL) {
            root->left = v;
            v->parent = root;
        } else {
            insertNode(root->left, v);
        }
    } else {
        if (root->right == NULL) {
            root->right = v;
            v->parent = root;
        } else {
            insertNode(root->right, v);
        }
    }
}

/* Vloží do stromu pre mnozinu s nový uzol s kľúčom key. */
void add(set &s, int key) {
    node *v = new node;
    v->data = key;
    v->left = NULL;
    v->right = NULL;
    v->parent = NULL;
    if (s.root == NULL) {
        // specialny pripad, ked vkladame prvy uzol
        s.root = v;
    } else {
        insertNode(s.root, v);
    }
}

Čas vkladania je tiež v najhoršom prípade úmerný hĺbke stromu.

Cvičenia

  • Napíšte nerekurzívny variant funkcie insertNode.
  • Napíšte funkciu treeSort, ktorá z poľa celých čísel a pomocou volaní funkcie add vytvorí binárny vyhľadávací strom a následne pomocou prehľadávania tohto stromu v poradí inorder pole a utriedi.
  • Ako bude vyzerať strom po nasledujúcej postupnosti operácií?
    set s;
    init(s);
    add(s, 2);
    add(s, 5);
    add(s, 3);
    add(s, 10);
    add(s, 7);  

Minimum a následník

Uvedieme teraz dve funkcie, ktoré sa zídu pri mazaní prvku zo stromu, ale môžu sa zísť aj inokedy.

Prvá funkcia minNode nájde vo vyhľadávacom strome uzol, v ktorom je uložená najmenšia hodnota.

  • Všetky prvky menšie ako koreň sú v ľavom podstrome, bude tam zrejme aj minimum.
  • Tá istá úvaha platí pre koreň ľavého podstromu.
  • Ideme teda doľava kým sa dá, posledný vrchol vrátime (list alebo vrchol, ktorý má iba pravé dieťa).
  • Nie je treba teda prechádzať celý strom a nemusíme sa ani pozerať na položku data v uzloch.
  • Dá sa napísať cyklom aj rekurzívne.
  • Obalom pre používateľa bude funkcia min, ktorá pomocou funkcie minNode nájde minimálny kľúč v danej množine.
/* Vrati uzol s minimalnou hodnotou data v podstrome s korenom v. */
node *minNode(node *v) {
    assert(v != NULL);
    while (v->left != NULL) {
        v = v->left;
    }
    return v;
}

/* Vrati minimalnu hodnotu v mnozine s. */
int min(set &s) {
    assert(s.root != NULL);
    return minNode(s.root)->data; 
}

Cvičenia:

  • Napíšte rekurzívny variant funkcie minNode.
  • Ako by bolo treba funkciu zmeniť, aby hľadala maximum?


Funkcia successorNode nájde pre daný uzol v jeho následníka (angl. successor) v binárnom vyhľadávacom strome, čiže uzol, ktorý vo vzostupnom poradí podľa kľúčov nasleduje bezprostredne za uzlom v.

  • Ak má uzol v pravé dieťa, následník uzla v bude vrchol s minimálnou hodnotou data v pravom podstrome
  • V opačnom prípade môže byť následníkom uzla v jeho rodič, ak v je jeho ľavé dieťa.
  • Ak je v pravým dieťaťom svojho rodiča, môže to byť jeho prarodič (ak je rodič uzla v ľavým dieťaťom tohto prarodiča), atď.
  • Vo všeobecnosti teda ide o najbližšieho predka uzla v takého, že v patrí do jeho ľavého podstromu.
  • V strome existuje práve jeden uzol bez následníka (najväčší prvok).
    • Ako presne sa bude funkcia nižšie pre tento prvok správať?
/* Vrati uzol, ktory vo vzostupnom poradi uzlov podla 
 * klucov nasleduje za v. 
 * Ak taky uzol neexistuje, vrati NULL. */
node *successorNode(node *v) {
    assert(v != NULL);
    if (v->right != NULL) {
        return minNode(v->right);
    }
    while (v->parent != NULL && v == v->parent->right) {
        v = v->parent;
    }
    return v->parent;
}

Mazanie z binárneho vyhľadávacieho stromu

Nasledujúca funkcia remove zmaže z binárneho vyhľadávacieho stromu uzol s kľúčom key (ak sa taký uzol v strome vyskytuje).

  • Najprv pomocou funkcie findNode nájde uzol v s kľúčom key.
  • Ak je v list, jednoducho ho zmažeme.
  • Ak má v jedno dieťa, toto dieťa prevesíme priamo pod rodiča v a v zmažeme.
  • Ak má v dve deti, nájdeme nasledovníka v, t.j. minimum v pravom podstrome v.
  • Tento nasledovník nemá ľavé dieťa, vieme ho teda zmazať.
  • Jeho údaje presunieme do vrcholu v.
  • Tiež treba dať pozor na mazanie koreňa.
/* Zmaze zo stromu pre mnozinu s uzol s klucom key, ak tam taky je. */
void remove(set &s, int key) {
    // Najde uzol s hodnotou, ktoru treba vymazat.
    node *v = findNode(s.root, key);                   
    if (v == NULL) {
        // pozadovany uzol neexistuje
        return;
    }
    
    // Najde uzol *rm, ktory sa napokon realne zmaze.   
    node *rm;                                          
    if (v->left == NULL || v->right == NULL) {         
        rm = v;
    } else  {
        rm = successorNode(v);
    }
   
    // Ak rm != v, presunie kluc uzla *rm do uzla *v. 
    if (rm != v) {                                     
        v->data = rm->data;
    }
    
    // ak ma uzol rm dieta, jeho rodicom bude rodic rm
    node *child;                                      
    if (rm->left != NULL) {
        child = rm->left;
    } else {
        child = rm->right;
    }
    if (child != NULL) {
        child->parent = rm->parent;
    }
    if (rm->parent == NULL) {
        s.root = child;
    } else if (rm == rm->parent->left) {
        rm->parent->left = child;    
    } else if (rm == rm->parent->right) {
        rm->parent->right = child;
    }
    // rm uz nie je v strome, uvolnime jeho pamat
    delete rm;
}

Zložitosť jednotlivých operácií

  • Časová zložitosť operácií contains, add aj remove je úmerná výške stromu, ktorú označíme h.
  • Minule sme ukázali, že pre strom s n uzlami máme log2(n+1)-1 ≤ h ≤ n-1.
  • Zložitosť uvedených operácií je teda v najhoršom prípade lineárna od počtu uzlov stromu (tento prípad nastane, ak prvky vkladáme od najmenšieho po najväčší alebo naopak).
  • Dá sa však ukázať, že ak sa prvky vkladajú v náhodnom poradí, výška stromu bude v priemere logaritmická od počtu uzlov.
  • Na predmete Algoritmy a dátové štruktúry (druhý ročník) sa tieto tvrdenia dokazujú poriadne a preberajú sa tam aj varianty vyhľadávacích stromov, pre ktoré je zložitosť uvedených operácií logaritmická aj v najhoršom prípade.