Univerzitet u Novom Sadu

Predmet: Sistemi velikih količina podataka (17.IZMI04)

Osnovne informacije:
 
Kategorija Stručno-aplikativni
Uža naučna oblast
  • Primenjene računarske nauke i informatika
  • Inženjerstvo informacionih sistema
  • Informaciono-komunikacioni sistemi
ESPB 4

Obrazovni cilj predmeta je da studentima omogući da razumeju, primenjuju i razvijaju sisteme za analizu i upravljanje velikim količinama podataka (engl. Big Data). Studenti će razumeti probleme i izazove vezane za upravljanje i analizu velikih količina podataka. Biće upoznati sa različitim istraživačkim pristupima u ovoj oblasti koji bi, u budućnosti, mogli da rezultuju rešenjima nekih od prezentovanih problema.

Studenti će po završetku kursa imati znanja i veštine koje će im omogućiti da na efikasan način i koriste savremene sisteme za čuvanje, pristup, analizu i istraživanje velikih struktuiranih i nestruktuiranih kolekcija podataka. Pored toga steći će praktične veštine korišćenja i razvoja sistema za čuvanje i obradu velikih količina podataka baziranih na tehnologijama Hadoop, High Performance Computing Platform (HPCC).

Problemi skladištenja, skalabilnosti i raspoloživosti velikih količina podataka. CAP teorema, ACID vs. BASE osobine baza podataka. Alternativni sistemi baza podataka (NoSQL). Osobine, prednosti i nedostaci NoSQL baza podataka. Baze podataka (bp) tipa ključ-vrednost, kolonski orijentisane bp, bp orijentisane ka grafovima, bp orijentisane ka dokumentima, temporalne bp. Osnovni koncepti istraživanja podataka. MapReduce i HPCC pristup paralelnoj i distribiranoj obradi podataka. Analiza tokova podataka, analiza veza u podacima, grupisanje i primene u sistemima preporučivanja, analiza grafova socijalnih mreža, tehnike smanjenja dimenzionalnosti, tehnike mašinskog učenja na osnovu velikih količina podataka. Teorijsku nastavu će pratiti praktična obuka iz analize velikih količina podataka primenom distribuiranih sistema zasnovanih na Hadoop i HPCC tehnologijama.

Predavanja; studijsko-istraživački rad; konsultacije; samostalna izrada obaveznih zadataka. Tokom celokupnog procesa izvođenja nastave, studenti se podstiču na intenzivnu komunikaciju, kritičko rezonovanje, samostalni rad i aktivan odnos prema procesu nastave.

Autori Naziv Godina Izdavač Jezik
Anand Rajaraman, Jure Leskovec, Jerey D. Ullman Mining of Massive Datasets 2011 Cambridge University Press Engleski
Ćulibrk, D. Otkrivanje znanja iz podataka : odabrana poglavlja 2012 Create Space, Fortlauderdale Srpski jezik
Sadalage J. P., Fowler M. NoSQL Distilled A Brief Guide to the Emerging World of Polyglot Persistence 2013 Pearson Education, Inc. Srpski jezik
Shashank Tiwari Profesisonal NoSQL 2011 John Wiley & Sons, Inc. Engleski
Elmasri R, Navathe S. B, Fundamentals of Database Systems, 7th Edition 2015 Pearson Education Limited Engleski
Eric Redmond, Jim R. Wilson Seven Databases in Seven Weeks: A Guide to Modern Databases and the NoSQL Movement 2012 The pragmatic Bookshelf Engleski
Sharda, R., Delen, D., Turban, E. Business Intelligence, Analytics and Data Science - A Managed Perspective 2017 Pearson, New York Engleski
Predmetna aktivnost Predispitna Obavezna Broj poena
Predmetna aktivnost
Usmeni deo ispita
Predispitna
Ne
Obavezna
Da
Broj poena
30.00
Predmetna aktivnost
Složeni oblici vežbi
Predispitna
Da
Obavezna
Da
Broj poena
20.00
Predmetna aktivnost
Test
Predispitna
Da
Obavezna
Da
Broj poena
10.00
Predmetna aktivnost
Test
Predispitna
Da
Obavezna
Da
Broj poena
10.00
Predmetna aktivnost
Predmetni projekat
Predispitna
Da
Obavezna
Da
Broj poena
30.00
Predavanja
Predavanja