Fakultet tehničkih nauka

Predmet: Big Data sistemi i analitika (17.EAI552)

Osnovne informacije:
 
Kategorija Teorijsko-metodološki
Uža naučna oblast Telekomunikacije i obrada signala
ESPB 6

Upoznavanje studenata sa računarskom i mrežnom infrastrukturom za skladištenje velikih količina podataka, velike heterogenosti i velikih brzina pristizanja. Sticanje znanja i savladavanje praktičnih veština uprimeni različitih algoritama za analizu velikim skupovima podataka (Big Data).

Student je osposobljen da koristi savremene tehnologije za skladištenje i distribuiranu organizaciju velikih količina podataka kako u fizičkim tako i virtuelnim računarskim sistemima. Ume da primeni alate za upravljanje velikim podacima, i prilagodi algoritam za distribuiranu obradu podataka. Student može da osmisli, prilagodi i implementira određenim softverskim alatima razne algoritme analize velikih količina podataka.

Skladištenje podataka. Distribuirani fajl sistemi ( Hadoop, Spark ). Virtuelna skladišta i komunikacije. Virtuelizacija baza podataka. Upravljanje velikim bazama podataka na cloud-u. MapReduce. programski model za distribuiranu obradu podataka. Pretrage podataka (slični uzorci, frekventni skupovi uzoraka). Podaci u obliku grafova, analiza linkova, lokalni i globalni topološki atributi. Algoritmi mašinskog učenja na velikim podacima. Vizuelizacije podataka. Praktičan rad sa studentima podrazumeva instalaciju i upoznavanje distribuiranih fajl sistema, praktičnu realizaciju virtuelizacije baza podataka i komunikacije. Primena MapReduce algoritma na odabranim problemima, kao i implementaciju algoritama za analizu podataka na dostupnim velikim bazama podataka. Domaći zadaci i studentski projekat imaju za cilj proveru sposobnosti studenta da poveže i implementira znanja. Studentski projekat može da se uradi i u laboratorijama FTN, kroz rešavanje problema ove vrste na naučnim projektima, naučnim izazovima i studentskim takmičenjima Ova vrsta aktivnog učenja može biti realizovana i kroz studentske prakse u kompanijama koje se bave implementacijom fizičkih i virtuelnih računarskih sistema za distribuirano skladištenje velikih količina podataka i razvojem i primenom Big Data analitike.

Predavanja se izvode uz prezentacije dostupne studentima koji se oslanjaju na navedenu literaturu. Praćena su računarskim i laboratorijskim vežbama koja imaju za cilj da studentima daju neposrednu mogućnost da implementiraju naučeno. Studentski projekat treba da obuhvati neposredan rad sa distribuiranim fajl sistemima, softverima za upravljanje podacima i implementaciju adekvatnih analitičkih metoda nad podacima velikog obima. Predispitne obaveze činiće na vreme urađeni domaći zadaci, kao i završen i uspešno odbranjen samostalni studentski projekat

Autori Naziv Godina Izdavač Jezik
Greg Schulz Software-Defined Data Infrastructure Essentials: Cloud, Converged, and Virtual Fundamental Server Storage I/O Tradecraft 2017 CRC Press Engleski
J. Leskovac, A. Rajaraman, J. D. Ullman Mining of Massive Datasets, 3rd Ed 2020 Cambridge University Press Engleski
Tam Sel Apache Spark and Hadoop for beginners 2020 Kindle Direct Publishing Engleski
Ž.Bojović, J. Šuh, P. Bojović Softverske tehnologije u računarskim mrežama sa velikim podacima 2021 Fakultet tehničkih nauka, Novi Sad Srpski jezik
Predmetna aktivnost Predispitna Obavezna Broj poena
Predmetna aktivnost
Domaći zadatak
Predispitna
Da
Obavezna
Da
Broj poena
5.00
Predmetna aktivnost
Predmetni projekat
Predispitna
Da
Obavezna
Da
Broj poena
50.00
Predmetna aktivnost
Domaći zadatak
Predispitna
Da
Obavezna
Da
Broj poena
5.00
Predmetna aktivnost
Domaći zadatak
Predispitna
Da
Obavezna
Da
Broj poena
5.00
Predmetna aktivnost
Domaći zadatak
Predispitna
Da
Obavezna
Da
Broj poena
5.00
Predmetna aktivnost
Teorijski deo ispita
Predispitna
Ne
Obavezna
Da
Broj poena
30.00
Predavanja
Predavanja
Računarske vežbe
Računarske vežbe