1-DAV-202 Data Management 2023/24
Previously 2-INF-185 Data Source Integration

Materials · Introduction · Rules · Contact
· Grades from marked homeworks are on the server in file /grades/userid.txt


Difference between revisions of "Rules"

From MAD
Jump to navigation Jump to search
 
(37 intermediate revisions by 2 users not shown)
Line 1: Line 1:
==Známkovanie==
+
==Grading==
  
* Domáce úlohy: 55%
+
* Homeworks: 45%
* Návrh projektu: 5%
+
* Project proposal: 5%
* Projekt: 40%  
+
* Project: 40%
 +
* Oral exam: 10%
  
Stupnica:
+
Grades:
* A: 90 a viac, B:80...89, C: 70...79, D: 60...69, E: 50...59,  FX: menej ako 50%
+
* A: 90 and more, B: 80...89, C: 70...79, D: 60...69, E: 50...59,  FX: less than 50%
  
==Formát predmetu==
+
You will get Fx if your oral exam is not satisfactory, even if you have sufficient points from other activities.
* Každý týždeň 3 vyučovacie hodiny, z toho cca prvá je prednáška a na ďalšie dve cvičenia. Na cvičeniach samostatne riešite príklady, ktoré doma dokončíte ako domácu úlohu.
 
* Cez skúškové obdobie budete odovzdávať projekt. Po odovzdaní projektov sa bude konať ešte diskusia o projekte s vyučujúcimi, ktorá môže ovplyvniť vaše body z projektu.
 
* Budete mať konto na Linuxovom serveri určenom pre tento predmet. Toto konto používajte len na účely tohto predmetu a snažte sa server príliš svojou aktivitou nepreťažiť, aby slúžil všetkým študentom. Akékoľvek pokusy úmyselne narušiť chod servera budú považované za vážne porušenie pravidiel predmetu.
 
  
==Domáce úlohy==
+
==Course format==
* Termín DÚ týkajúcej sa aktuálnej prednášky je vždy do 9:00 v deň nasledujúcej prednášky (t.j. väčšinou o necelý týždeň od zadania).
 
* Domácu úlohu odporúčame začať robiť na cvičení, kde vám môžeme prípadne poradiť. Ak máte otázky neskôr, pýtajte sa vyučujúcich emailom.
 
* Domácu úlohu môžete robiť na ľubovoľnom počítači, pokiaľ možno pod Linuxom. Odovzdaný kód alebo príkazy by však mali byť spustiteľné na serveri pre tento predmet, nepoužívajte teda špeciálny softvér alebo nastavenia vášho počítača.
 
* Domáca úloha sa odovzdáva nakopírovaním požadovaných súborov do požadovaného adresára na serveri. Konkrétne požiadavky budú spresnené v zadaní.
 
* Ak sú mená súborov špecifikované v zadaní, dodržujte ich. Ak ich vymýšľate sami, nazvite ich rozumne. V prípade potreby si spravte aj podadresáre, napr. na jednotlivé príklady.
 
* Dbajte na prehľadnosť odovzdaného zdrojového kódu (odsadzovanie, rozumné názvy premenných, podľa potreby komentáre)
 
  
===Protokoly===
+
* Every Thursday three-hour class, we start with a short lecture. Then you start solving assigned tasks, which you complete as a homework assignment.
* Väčšinou bude požadovanou súčasťou úlohy textový dokument nazvaný protokol.
+
* We highly recommend doing the homework during class, as we can help you as needed. We really encourage you to ask questions during this time. At other times, ask your questions via email, but you may have to wait longer for the answer.
* Protokol môže byť vo formáte .txt alebo .pdf a jeho meno má byť '''protocol.pdf''' alebo '''protocol.txt''' (nakopírujte ho do odovzdaného adresára)
+
* If you '''attend''' the whole 3-hour class, you are allowed to work on the homework in a '''pair''' with one of your classmates. You can then also finish the homework together after the class and submit just one homework listing both your names.
* Protokol môže byť po slovensky alebo po anglicky.
+
** During work, occasionally exchange roles (driver who is typing the program or commands and navigator who is advising the driver). Both students should completely understand all parts of the submitted homework.
* V prípade použitia txt formátu a diakritiky ju kódujte v UTF8, ale pre jednoduchosť môžete protokoly písať aj bez diakritiky. Ak je protocol v pdf formáte, mali by sa v ňom dať selektovať texty.  
+
** If you do not attend the class (or only a part of it), you have to do the homework individually.
* Vo väčšine úloh dostanete kostru protokolu, dodržujte ju.
+
* Some weeks will have a separate material for Bioinformatics program and separately for others. If you would like to do a homework other than the one intended for you, you must obtain a prior consent of the instructors.
 +
* You will submit a project during the exam period. Afterwards there will be an oral exam concentrating on the project and submitted homework.
 +
* You will have an account on a Linux server dedicated to this course. Use this account only for the purposes of this course and try not to overload the server so that it serves all students. Any attempts to disrupt the operation of the server will be considered a serious violation of the course rules.
  
'''Hlavička protokolu, vyhodnotenie'''
+
==Homework==
* Na vrchu protokolu uveďte meno, číslo domácej úluhy a vaše vyhodnotenie toho, ako sa vám úlohu podarilo vyriešiť. Vyhodnotenie je prehľadný zoznam všetkých príkladov zo zadania, ktoré ste aspoň začali riešiť a kódov označujúcich ich stupeň dokončenia:
+
* The deadline for each homework is 9:00 of the day of the next lecture, i.e. usually almost one week from when the homework was published.
** kód HOTOVO uveďte, ak si myslíte, že tento príklad máte úplne a správne vyriešený
+
* You can work on your homework on any computer, preferably under Linux. However, the submitted code or commands should be executable on the course server, so do not use special software or settings on your computer.
** kód ČASŤ uveďte, ak ste nevyriešili príklad celý a do poznámky za kód stručne uveďte, čo máte hotové a čo nie, prípadne ktorými časťami si nie ste istí.
+
* The homework is submitted by copying the required files to the required directory on the server. Details will be specified in the assignment.
** kód MOŽNO uveďte, ak príklad máte celý, ale nie ste si istí, či správne. Opäť v poznámke uveďte, čím si nie ste istí.
+
* Follow any filenames specified in the assignment and use reasonable filenames for additional files.
** kód NIČ uveďte, ak ste príklad ani nezačali riešiť
+
* Make sure the submitted source code is easy to read (indentation, reasonable variable names, comments as needed)
* Vaše vyhodnotenie je pre nás pomôckou pri bodovaní. Príklady označené HOTOVO budeme kontrolovať námatkovo, k príkladom označeným MOŽNO sa vám pokúsime dať nejakú spätnú väzbu, takisto aj k príkladom označeným ČASŤ, kde v poznámke vyjadríte, že ste mali nejaké problémy.
 
* Pri vyhodnotení sa pokúste čo najlepšie posúdiť správnosť vašich riešení, pričom kvalita vášho seba-hodnotenia môže vplývať na celkový počet bodov.
 
  
'''Obsah protokolu'''
+
===Protocols===
* Ak nie je v zadaní určené inak, protokol by mal obsahovať nasledovné údaje:
 
** '''Zoznam odovzdaných súborov:''' o každom súbore uveďte jeho význam a či ste ho vyrobili ručne, získali z externých zdrojov alebo vypočítali nejakým programom. Ak máte väčšie množstvo súborov so systematickým pomenovaním, stačí vysvetliť schému názvov všeobecne. Súbory, ktorých mená sú špecifikované v zadaní, nemusíte v zozname uvádzať.
 
** '''Postupnosť všetkých spustených príkazov,''' prípadne iných krokov, ktorými ste dospeli k získaným výsledkom. Tu uvádzajte príkazy na spracovanie dát a spúšťanie vašich či iných programov. Netreba uvádzať príkazy súvisiace so samotným programovaním (spúšťanie editora, nastavenie práv na spustenie a pod.), s kopírovaním úlohy na server a pod. Uveďte aj stručné '''komentáre''', čo bolo účelom určitého príkazu alebo skupiny príkazov.
 
** '''Zoznam zdrojov:''' (webstránky a pod., ktoré ste pri riešení úlohy použili. Nemusíte uvádzať webstránku predmetu a zdroje odporučené priamo v zadaní.
 
Celkovo by protokol mal umožniť čitateľovi zorientovať sa vo vašich súboroch a tiež v prípade záujmu vykonať rovnaké výpočty, akými ste dospeli vy k výsledku. Nemusíte písať slohy, stačia zrozumiteľné a prehľadné heslovité poznámky.
 
  
==Projekty==
+
* Usually, a document called a protocol will be a required part of the homework.
 +
* Write the protocol in txt format and name the file '''protocol.txt''' (copy it to the upload directory)
 +
* The protocol can be in Slovak or English.
 +
* If you write with diacritics, use UTF8 encoding, but feel free to omit diacritics in protocols.
 +
* In most homeworks, you get a protocol outline, follow it and do not change our headings.
  
Cieľom projektu je vyskúšať si naučené zručnosti na konkrétnom projekte spracovania dát. Vašou úlohou je zohnať si dáta, tieto dáta analyzovať niektorými technikami z prednášok, prípadne aj inými technológiami a získané výsledky zobraziť v prehľadných grafoch a tabuľkách. Ideálne je, ak sa vám podarí prísť k zaujímavým alebo užitočným záverom, ale hodnotiť budeme hlavne voľbu vhodného postupu a jeho technickú náročnosť. Rozsah samotného programovania alebo analýzy dát by mal zodpovedať zhruba dvom domácim úlohám, ale celkovo bude projekt náročnejší, lebo na rozdiel od úloh nemáte postup a dáta vopred určené, ale musíte si ich vymyslieť sami a nie vždy sa prvý nápad ukáže ako správny. V projekte môžete využiť aj existujúce nástroje a knižnice, ale pokiaľ možno používajte nástroje spúšťané na príkazovom riadku.  
+
'''Self-assessment'''
 +
* At the top of the protocol, fill in the names of the authors of the homework. This is very important if you work in a pair.
 +
* Below fill in a self-assessment which for every task should contain one of the following codes.
 +
** Use code DONE if you think the task is completely and correctly solved.
 +
** Use code PART if you have completed only a part of the task. After the code briefly state, which part was completed and potentially if you had problem with something.
 +
** Use code UNSURE, if you have completed the task but are not sure about something. Again briefly explain what are you unsure of.
 +
** Use code NOTHING, if you have not even started to do the task.
 +
* Your self-assessment will guide us in grading. Tasks marked as DONE will be checked briefly, but we will try to give you feedback to tasks marked UNSURE or PART, particularly if you note down what was causing you problems.
 +
* Try to fill in self-assessment the best you can. It can influence your grade.
  
Zhruba v dvoch tretinách semestra budete odovzdávať '''návrh projektu''' (formát txt alebo pdf, rozsah 0.5-1 strana). V tomto návrhu uveďte, aké dáta budete spracovávať, ako ich zoženiete, čo je cieľom analýzy a aké technológie plánujete použiť. Ciele a technológie môžete počas práce na projekte mierne pozmeniť podľa okolností, mali by ste však mať počiatočnú predstavu. K návrhu vám dáme spätnú väzbu, pričom v niektorých prípadoch môže byť potrebné tému mierne alebo úplne zmeniť. Za načas odovzdaný vhodný návrh projektu získate 5% z celkovej známky. Návrh odporúčame pred odovzdaním konzultovať s vyučujúcimi.
+
'''Protocol contents'''
 +
* Unless specified otherwise, the protocol should contain the following information:
 +
** '''List of submitted files:''' usually already filled in, add any other files you submit with a brief explanation of their meaning.
 +
** '''The sequence of commands used,''' or other steps you took to get the results. Include commands to process data and run your or other programs. It is not necessary to specify commands related to the programming itself (starting the editor, setting file permissions), copying the files to the server, etc. For more complex commands, also provide brief '''comments''' explaining the purpose of a particular command or group of commands.
 +
** '''Observations''' the results required by the tasks and any discussion of these results.
 +
** '''Resources:''' websites and other sources that you used to solve the task. You do not have to list the course website and resources recommended directly in the assignment.
 +
Overall, the protocol should allow the reader to understand your files and also, in case of interest, to perform the same calculations as you used to obtain the result. You do not have write to a formal text, only clear and brief notes.
  
Cez skúškové obdobie bude určený termín '''odovzdania projektu'''.  Podobne ako pri domácich úlohách odovzdávajte adresár s požadovanými súbormi:
+
==Project==
* Vaše '''programy a súbory s dátami''' (veľmi veľké dátové súbory vynechajte)
 
* '''Protokol''' podobne ako pri domácich úlohách
 
** formát txt alebo pdf, stručné heslovité poznámky
 
** obsahuje zoznam súborov, podrobný postup pri analýze dát (spustené príkazy), ako aj použité zdroje (dáta, programy, dokumentácia a iná literatúra atď)
 
* '''Správu k projektu''' vo formáte pdf. Na rozdiel od menej formálneho protokolu by správu mal tvoriť súvislý text v odbornom štýle, podobne ako napr. záverečné práce. Môžete písať po slovensky alebo po anglicky, ale pokiaľ možno gramaticky správne. Správa by mala mať tieto časti:
 
** úvod, v ktorom vysvetlíte ciele projektu, prípadne potrebné poznatky zo skúmanej oblasti a aké dáta ste mali k dispozícii
 
** stručný popis metód, v ktorom neuvádzajte detailne jednotlivé kroky, skôr prehľad použitého prístupu a jeho zdôvodnenie
 
** výsledky analýzy (tabuľky, grafy a pod.) a popis týchto výsledkov, prípadne aké závery sa z nich dajú spraviť (nezabudnite vysvetliť, čo znamenajú údaje v tabuľkách, osi grafov a pod.). Okrem finálnych výsledkov analýzy uveďte aj čiastkové výsledky, ktorými ste sa snažili overovať, že pôvodné dáta a jednotlivé časti vášho postupu sa správajú rozumne.
 
** diskusiu, v ktorej uvediete, ktoré časti projektu boli náročné a na aké problémy ste narazili, kde sa vám naopak podarilo nájsť spôsob, ako problém vyriešiť jednoducho, ktoré časti projektu by ste spätne odporúčali robiť iným než vašim postupom, čo ste sa na projekte naučili a podobne
 
  
Projekty môžete robiť aj vo '''dvojici''', vtedy však vyžadujeme rozsiahlejší projekt a každý člen by mal byť primárne zodpovedný za určitú časť projektu, čo uveďte aj v správe. Dvojice odovzdávajú jednu správu, ale po odovzdaní projektu majú stretnutie s vyučujúcimi individuálne.
+
The aim of the project is to extend your skills on a data processing project. Your task is to obtain data, analyze this data with some techniques from the lectures and display the results in graphs and tables.
  
Ako nájsť tému projektu:
+
* In about two thirds of the semester, you will submit a short project proposal
* Môžete spracovať nejaké dáta, ktoré potrebujete do bakalárskej alebo diplomovej práce, prípadne aj dáta, ktoré potrebujte na iný predmet (v tom prípade uveďte v správe, o aký predmet ide a takisto upovedomte aj druhého vyučujúceho, že ste použili spracovanie dát ako projekt pre tento predmet). Obzvlášť pre BIN študentov môže byť tento predmet vhodnou príležitosťou nájsť si tému bakalárskej práce a začať na nej pracovať.
+
* A deadline for submitting the project (including the written report) will be during the exam period
* Môžete skúsiť zopakovať analýzu spravenú v nejakom vedeckom článku a overiť, že dostanete tie isté výsledky. Vhodné je tiež skúsiť analýzu aj mierne obmeniť (spustiť na iné dáta, zmeniť nejaké nastavenia, zostaviť aj iný typ grafu a pod.)
+
* You can also do projects in pairs, but then we require a larger project and each member should be primarily responsible for a certain part of the project
* Môžete skúsiť nájsť niekoho, kto má dáta, ktoré by potreboval spracovať, ale nevie ako na to (môže ísť o biológov, vedcov z iných oblastí, ale aj neziskové organizácie a pod.) V prípade, že takýmto spôsobom kontaktujete tretie osoby, bolo by vhodné pracovať na projekte obzvlášť zodpovedne, aby ste nerobili zlé meno našej fakulte.
 
* V projekte môžete porovnávať niekoľko programov na tú istú úlohu z hľadiska ich rýchlosti či presnosti výsledkov. Obsahom projektu bude príprava dát, na ktorých budete programy bežať, samotné spúšťanie (vhodne zoskriptované) ako aj vyhodnotenie výsledkov.
 
* A samozrejme môžete niekde na internete vyhrabať zaujímavé dáta a snažiť sa z nich niečo vydolovať.
 
  
==Opisovanie==
+
More detailed information on projects is on [[Project| a separate page]].
  
* Máte povolené sa so spolužiakmi a ďalšími osobami rozprávať o domácich úlohách resp. projektoch a stratégiách na ich riešenie. Kód, získané výsledky aj text, ktorý odovzdáte, musí však byť vaša samostatná práca. Je zakázané ukazovať svoj kód alebo texty spolužiakom.  
+
==Oral exam==
 +
* During the oral exam, we will give you our feedback to your project and ask related questions.
 +
* We can also ask you about some of the homeworks you have submitted during the semester.
 +
* You should be able to explain your code and do small modifications in it.
  
* Pri riešení domácej úlohy a projektu očakávame, že budete využívať internetové zdroje, najmä rôzne manuály a diskusné fóra k preberaným technológiám. Nesnažte sa však nájsť hotové riešenia zadaných úloh. Všetky použité zdroje uveďte v domácich úlohách a projektoch.
+
==Academic integrity==
  
* Ak nájdeme prípady opisovania alebo nepovolených pomôcok, všetci zúčastnení študenti získajú za príslušnú domácu úlohu, projekt a pod. nula bodov (t.j. aj tí, ktorí dali spolužiakom odpísať) a prípad ďalej podstúpime na riešenie disciplinárnej komisii fakulty.
+
* You are allowed to talk to classmates and other people about homework and projects and general strategies to solve them. However, the code, the results obtained, and the text you submit must be '''your own work'''. It is forbidden to show your code or texts to the classmates.
  
==Zverejňovanie==
+
* When working on the homework and the project, we expect you to use Internet resources, especially various manuals and discussion forums on the used technologies. However, do not try to find ready-made solutions to the given tasks. List all resources used in a homework or a project.
  
Zadania a materiály k predmetu sú voľne prístupné na tejto stránke. Prosím vás ale, aby ste nezverejňovali ani inak nešírili vaše riešenia domácich úloh, ak nie je v zadaní povedané inak. Vaše projekty môžete zverejniť, pokiaľ to nie je v rozpore s vašou dohodou so zadávateľom projektu a poskytovateľom dát.
+
* Do not use AI chatbots or AI code generation in your editor (such as Github copilot and similar) for solving homeworks (you do not learn anything that way!). Some use of AI code generation is permitted on the final projects, see [[Project|project rules]].
 +
 
 +
* If we find cases of plagiarism or unauthorized aids, all participating students will receive zero points for the relevant homework or project (including the students who provided their solutions to others to copy). Violations of academic integrity will be also referred to the faculty disciplinary committee.
 +
 
 +
==Sharing materials==
 +
 
 +
Assignments and materials for the course are freely available on this webpage. However, do not publish or otherwise share your homework solutions as they closely follow the outline given by us. You can publish your projects if you wish, as long as it does not conflict with your agreement with the provider of your data.

Latest revision as of 13:06, 22 February 2024

Grading

  • Homeworks: 45%
  • Project proposal: 5%
  • Project: 40%
  • Oral exam: 10%

Grades:

  • A: 90 and more, B: 80...89, C: 70...79, D: 60...69, E: 50...59, FX: less than 50%

You will get Fx if your oral exam is not satisfactory, even if you have sufficient points from other activities.

Course format

  • Every Thursday three-hour class, we start with a short lecture. Then you start solving assigned tasks, which you complete as a homework assignment.
  • We highly recommend doing the homework during class, as we can help you as needed. We really encourage you to ask questions during this time. At other times, ask your questions via email, but you may have to wait longer for the answer.
  • If you attend the whole 3-hour class, you are allowed to work on the homework in a pair with one of your classmates. You can then also finish the homework together after the class and submit just one homework listing both your names.
    • During work, occasionally exchange roles (driver who is typing the program or commands and navigator who is advising the driver). Both students should completely understand all parts of the submitted homework.
    • If you do not attend the class (or only a part of it), you have to do the homework individually.
  • Some weeks will have a separate material for Bioinformatics program and separately for others. If you would like to do a homework other than the one intended for you, you must obtain a prior consent of the instructors.
  • You will submit a project during the exam period. Afterwards there will be an oral exam concentrating on the project and submitted homework.
  • You will have an account on a Linux server dedicated to this course. Use this account only for the purposes of this course and try not to overload the server so that it serves all students. Any attempts to disrupt the operation of the server will be considered a serious violation of the course rules.

Homework

  • The deadline for each homework is 9:00 of the day of the next lecture, i.e. usually almost one week from when the homework was published.
  • You can work on your homework on any computer, preferably under Linux. However, the submitted code or commands should be executable on the course server, so do not use special software or settings on your computer.
  • The homework is submitted by copying the required files to the required directory on the server. Details will be specified in the assignment.
  • Follow any filenames specified in the assignment and use reasonable filenames for additional files.
  • Make sure the submitted source code is easy to read (indentation, reasonable variable names, comments as needed)

Protocols

  • Usually, a document called a protocol will be a required part of the homework.
  • Write the protocol in txt format and name the file protocol.txt (copy it to the upload directory)
  • The protocol can be in Slovak or English.
  • If you write with diacritics, use UTF8 encoding, but feel free to omit diacritics in protocols.
  • In most homeworks, you get a protocol outline, follow it and do not change our headings.

Self-assessment

  • At the top of the protocol, fill in the names of the authors of the homework. This is very important if you work in a pair.
  • Below fill in a self-assessment which for every task should contain one of the following codes.
    • Use code DONE if you think the task is completely and correctly solved.
    • Use code PART if you have completed only a part of the task. After the code briefly state, which part was completed and potentially if you had problem with something.
    • Use code UNSURE, if you have completed the task but are not sure about something. Again briefly explain what are you unsure of.
    • Use code NOTHING, if you have not even started to do the task.
  • Your self-assessment will guide us in grading. Tasks marked as DONE will be checked briefly, but we will try to give you feedback to tasks marked UNSURE or PART, particularly if you note down what was causing you problems.
  • Try to fill in self-assessment the best you can. It can influence your grade.

Protocol contents

  • Unless specified otherwise, the protocol should contain the following information:
    • List of submitted files: usually already filled in, add any other files you submit with a brief explanation of their meaning.
    • The sequence of commands used, or other steps you took to get the results. Include commands to process data and run your or other programs. It is not necessary to specify commands related to the programming itself (starting the editor, setting file permissions), copying the files to the server, etc. For more complex commands, also provide brief comments explaining the purpose of a particular command or group of commands.
    • Observations the results required by the tasks and any discussion of these results.
    • Resources: websites and other sources that you used to solve the task. You do not have to list the course website and resources recommended directly in the assignment.

Overall, the protocol should allow the reader to understand your files and also, in case of interest, to perform the same calculations as you used to obtain the result. You do not have write to a formal text, only clear and brief notes.

Project

The aim of the project is to extend your skills on a data processing project. Your task is to obtain data, analyze this data with some techniques from the lectures and display the results in graphs and tables.

  • In about two thirds of the semester, you will submit a short project proposal
  • A deadline for submitting the project (including the written report) will be during the exam period
  • You can also do projects in pairs, but then we require a larger project and each member should be primarily responsible for a certain part of the project

More detailed information on projects is on a separate page.

Oral exam

  • During the oral exam, we will give you our feedback to your project and ask related questions.
  • We can also ask you about some of the homeworks you have submitted during the semester.
  • You should be able to explain your code and do small modifications in it.

Academic integrity

  • You are allowed to talk to classmates and other people about homework and projects and general strategies to solve them. However, the code, the results obtained, and the text you submit must be your own work. It is forbidden to show your code or texts to the classmates.
  • When working on the homework and the project, we expect you to use Internet resources, especially various manuals and discussion forums on the used technologies. However, do not try to find ready-made solutions to the given tasks. List all resources used in a homework or a project.
  • Do not use AI chatbots or AI code generation in your editor (such as Github copilot and similar) for solving homeworks (you do not learn anything that way!). Some use of AI code generation is permitted on the final projects, see project rules.
  • If we find cases of plagiarism or unauthorized aids, all participating students will receive zero points for the relevant homework or project (including the students who provided their solutions to others to copy). Violations of academic integrity will be also referred to the faculty disciplinary committee.

Sharing materials

Assignments and materials for the course are freely available on this webpage. However, do not publish or otherwise share your homework solutions as they closely follow the outline given by us. You can publish your projects if you wish, as long as it does not conflict with your agreement with the provider of your data.