Týždeň absolventov matfyzu 2006

Abstrakty - Informatika

Technológie sémantického webu v malých organizáciách
Michal Laclavik, Slovenská akadémia vied
Utorok, 19. decembra 2006, 9:30-10:00 (Informatika I.: Strojové učenie a world-wide web)

Semanticky web je dnes popularnou oblastou vyskumu v informatike. Sucasny web je vhodny pre ludi ale nie pre automaticke spracovanie. Semanticky web sa snazi o to aby pomocou technologii ako ontologie (RDF, OWL) boli formalne opisane zdroje dostupne na internete. Toto vsak zatiall naraza na mnohe prekazky a vizia o automatickych systemoch, ktore zbieraju, vyhodnocuju, spracuvaju informacie a ktore sa autonomne rozhoduju sa zatial nenaplnila. Naproti tomu sa tieto technologie javia ako velmi dobre pouzitelne v aplikaciach v ramci roznych organizacii. V organizaciach je najvacsim problemom vyhladavanie informacii a znalosti, ktore sa da riesit a vylepsit pomocou technologii ako semanticka anotacia, detekcia kontextu, vyhladavanie informacii na zaklade kontextu a dalsich. V ramci prispevku ukazeme moznosti tychto technologii a niektore projekty a aplikacie riesene na Ustave Informatiky SAV v danej oblasti.

Michal Laclavik absolvoval magisterske studium fyziky a informatiky na FMFI v roku 1999. V sucasnosti pracuje ako vyskumny pracovnik na Ustave Informatiky Slovenskej akademie vied, kde tento rok ukoncil PhD studium. Jeho zaujmy su inteligentne a znalostne orientovane technologie, agentove systemy, manazment informacii a semanticky web.

Aproximácia hodnotovej funkcie pre Markovovské rozhodovacie procesy
Marek Petrík, University of Massachusets Amherst
Utorok, 19. decembra 2006, 10:00-10:30 (Informatika I.: Strojové učenie a world-wide web)

MDP umoznuju modelovat nahodne procesy ktore su ciastocne kontrolovatelne. Napriek tomu ze najdenie optimalnej kontroly takehoto procesu je mozne v polynomialnom case, v mnohych pripadoch je toto prilis pomale v zhladom na velkost problemu. Priblizne metody su zvacsa zalozene na linearnej aproximacii value funkcie, a vacsinou predpokladaju ze baza tejto aproximacie je vytvorena rucne. Nedavno, Mahadevan (ICML 2005) publikoval metodu na automaticke vytvorenie bazy pouzitim eigenvectorov graph Laplacian-u procesu. V tomto prispevku uvadzam alternativne vysvetlenie tejto metody ktore lepsie definuje podmienky za ktorych je tato metoda aplikovatelna. Navyse toto vysvetlenie vytvara spojenie s numerickou analyzou, a vedie k moznym zlepseniam.

Marek Petrik vystudoval informatiku na FMFI UK v rokoch 2000-2005. Od roku 2005 je doktorantom na University of Massachusetts Amherst. Jeho hlavne zaujmy su decentralizovana a priblizna optimalizacia (decentralized and approximate optimization), a vypoctova teoria hier (computational game theory).

Koľko energie spotrebujú webovské aplikácie?
Peter Bodík, University of California, Berkeley
Utorok, 19. decembra 2006, 10:30-11:00 (Informatika I.: Strojové učenie a world-wide web)

Popularne webovske aplikacie od firiem ako Google, Yahoo alebo Amazon bezia na desiatkach tisic servrov -- posledny odhad pre Google je okolo pol miliona servrov. Este donedavna boli hlavnymi problemami tychto firiem rychlost procesorov a velkost servrov (procesory boli prilis pomale a tisice servrov zaberali prilis vela miesta). Dnes sa vsak hlavnym problemom stava spotreba energie; servre su dostatocne rychle a male, ale spotrebuju obrovske mnozstvo elektriny. Pocet ludi pouzivajucich tieto stranky sa pocas 24 hodin drasticky meni -- v noci je ich casto aj 10x menej ako cez den -- a priemerne vyuzitie servrov sa pohybuje na urovni 10-20%. Napriek tomu su vsak vsetky servre zapnute bez prestavky a v noci spotrebuju rovnako vela energie ako cez den. Cielom tohto rozbiehajuceho sa projektu je vyvinut metody, ktore umoznia vypinat a zapinat servre pocas dna a presuvat aplikacie medzi servrami tak, aby sa minimalizovala spotreba energie a zaroven sa zabezpecila dostatocne rychla odozva tychto webovskych aplikacii. Hlavnym nastrojom budu metody z umelej inteligencie a strojoveho ucenia: statisticke modely budu pouzite na modelovanie zavislosti medzi poctom servrov, poctom pouzivatelov a odozvou webovskej aplikacie. V tejto prednaske blizsie vysvetlim tento problem a popisem vysledky z uvodnych experimentov.

Nove trendy v elektroencefalografii
Roman Rosipal, Austrian Research Institute for Artificial Intelligence
Utorok, 19. decembra 2006, 14:00-14:30 (Informatika II: Biologicke a medicinske aplikacie)

V prispevku sa budem venovat niekolkym vybranym aplikaciam vyuzitia elektroencefalogramu (EEG) nie len pre klinicku prax ale v blizkej buducnosti mozno aj pre bezny zivot. Jedna sa o problemy monitorovania kognitivnej zataze, hlbky anestezie, pozornosti alebo spanku. Specialnu pozornost budem venovat pilotnemu studiu vyuzitia mozgovo-pocitacoveho rozhrania (brain-computer interface) pre rozsirenie kognicie (augmented cognition) ludi vystavenym zvysenim narokom na pozornost spojenym s extremnou fyzickou alebo psychickou zatazou. V technickej casti prispevku popisem niekolko metod z oblasti matematickej statistiky a tzv. strojoveho ucenia (machine learning), ktore boli v spominanych aplikaciach uspesne pouzite. Pozornost budem venovat metode parcialnych najmensich stvorcov (partial least squares) a jej nelinearnej jadrovej verzii. Zdoraznim pouzitie tejto metody v nelinearnej regresii a klasifikacii.

Roman Rosipal študoval na MFF UK v odbore matematická štatisitka v rokoch 1994-1999. V rokoch 1998-2001 bol PhD študentom na University of Paisley, UK. Od roku 2001 pôsobil ako post-doktorand v NASA Ames Research Center, CA. Od roku 2004 pracuje v Austrian Research Center for Artificial Intelligence vo Viedni. Zaujíma sa tvorbou a aplikáciami metód štatistickej analýzy a strojového učenia v oblasti neurofyziológie.

Stochasticke modelovanie konformacnych zmien v proteinoch
Peter Majek, Cornell University
Utorok, 19. decembra 2006, 14:30-15:00 (Informatika II: Biologicke a medicinske aplikacie)

Väcsina proteinov ma jednoznacne definovanú funkcnú tercialnu struktúru. Avsak biologicka funkcia niektorých enzýmov, transporterov ci receptorov je realizovaná vdaka dynamickým prechodom ich tercialnej struktúry medzi rôznymi funkcnými konformáciami. Experimentálne dáta nam poskytujú informácie o jednotlivých metastabilných konformáciach, no trajektorie prechodov medzi nimi a ich biofyzikálny mechanizmus je vo vacsine pripadov neznámy, kedze standartne metódy molekulárnych simulácii nie su schopne popísat tieto procesy prebiehajúce v casovom rozsahu niekolkých mikro az milisekúnd. Alternatívou k diferencialnym simulaciam sú integrálne métody ako napr. Stochastic Differential Equation in Length (SDEL), no pri proteinoch s niekolko sto aminokyslinami sú tieto tiez výpoctovo neefektívne. Potencialne riesenie problemu je dosiahnutelné predpocítaním aproximatívnych trajektorií pomocou integrálnych metód v znacne zjednodusenóm fyzikálnom modeli a následne upresnenie vypocitaných trajektorií v úplnom modeli pomocou SDEL. Aproximatívne trajektorie su predpocítane na modeli definovanóm iba na C_{/alpha} atómami pri kvadratickej relaxacii energetickej funkcie. Pomocou metody simulovaného zihania je najdená trajektoria s maximalnou pravdepodobnostou odvodenóu na základe Langrevinovej dynamiky.

Peter Majek studoval informatiku na FMFI v rokoch 2000-2005. Od roku 2005 je PhD studentom v odbore Computational Biology and Medicine na Cornell University v spolupraci s Rockefeller University a Memorial Sloane Kettering Cancer Center.

O hladani genov
Brona Brejova, Cornell University
Utorok, 19. decembra 2006, 15:00-15:30 (Informatika II: Biologicke a medicinske aplikacie)

Moderne technologie na sekvenovanie genomov umoznili vedcom v poslednych rokoch ziskavat DNA sekvencie mnohych organizmov. Jedna zo zakladnych informacii, ktore mozeme z DNA sekvencie ziskat je katalog vsetkych genov a ich produktov - proteinov. Predstavime nas program ExonHunter na hladanie genov, ktory na zlepsenie presnosti vysledkov spaja tradicne pravdepodobnostne modely DNA sekvencie, udaje z biologickych experimentov a podobnost s uz znamymi genmi. Hladanie genov vyzaduje najdenie kompromisu medzi presnymi statistickymi modelmi na jednej strane a efektivnostou vypoctov a dostupnostou trenovacich dat na strane druhej. Nas program sme pouzili v spolupraci s genomovym centrom v Sanghaji na analyzu novo sekvenovaneho genomu parazita Schistosoma japonicum. Spoluautori Dan Brown, Ming Li, Tomas Vinar

Brona Brejova ukoncila magisterske studium informatiky na FMFI UK v roku 1999. Doktorandske studium absolvovala na University of Waterloo v Kanade, kde sa venovala bioinformatike, hlavne hladaniu genov a podobnosti v DNA sekvenciach. Od augusta 2006 posobi ako postdoc na Cornell University.

O komunikacii medzi paralelnymi procesmi
Tomas Plachetka, Univerzita Komenskeho
Utorok, 19. decembra 2006, 15:45-16:15 (Informatika III: Teoreticka informatika)

Existuje vela teoretickych modelov, ktore definuju komunikaciu medzi paralelnymi procesmi. Avsak priamo pouzit tieto modely na analyzu sucasnych softwarovych systemov sa zda byt tazke. V tomto kratkom prispevku definujeme teoreticky model, ktory takuto analyzu ulahcuje. Da sa dokazat nevelmi prekvapive tvrdenie, ze nas model je ekvivalentny asynchronnemu kanalovemu modelu (a tym padom dalsim teoretickym modelom). Prekvapivejsi vysledok je, ze sucasne softwarove standardy su vypoctovo slabsie ako nas model, a teda slabsie ako jednoduchy kanalovy model. Inak povedane, prakticke standardy su striktne slabsie ako fundamentalne teoreticke modely. Formalny dokaz je urobeny pre MPI (Message Passing Interface), da sa vsak aplikovat aj na dalsie prakticke standardy. Pre tych, ktori maju radi analogie: rozdiel medzi praktickym a teoretickym paralelnym programovanim je zhruba taky, ako medzi programovanim konecnych automatov a programovanim Turingovych strojov.

Automaticka verifikacia bezpecnosti programov a protokolov
Pavol Cerny, University of Pennsylvania
Utorok, 19. decembra 2006, 16:15-16:45 (Informatika III: Teoreticka informatika)

Automaticka verifikacia bezpecnosti programov a protokolov. Kratky abstrakt (jeden odstavec, nemusi byt finalna verzia): Dolezitou vlastnostou systemov je ich bezpecnost. Nepovolany uzivatel by napriklad nemal ziskat hesla alebo cisla kreditnych kariet, aj ak moze monitorovat komunikaciu na sieti. Takisto by nemal mat moznost ovplyvnit chod systemu nedovolenym sposobom. Specifikacie tohto typu, ktore hovoria o informacnych tokoch, sa nedaju vyjadrit v standardnych temporalnych logikach. Ukazeme ako sa tempooralne logiky daju rozsirit tak, aby sa tieto specifikacie vyjadrit dali, a predstavime algoritmy na ich verifikaciu.

Pavol Cerny studoval informatiku na FMFI UK v rokoch 1998-2000 a na ENS v Parizi v rokoch 2000-2003. Od roku 2003 je doktorandom na University of Pennsylvania, kde sa zaoberá algoritmickou verifikáciou.