×
Универзитет у Новом Саду

Предмет: Big Data системи и аналитика (17.EAI552)

Основне информације:
 
Категорија Теоријско-методолошки
Ужа научна област Телекомуникације и обрада сигнала
ЕСПБ 6

Упознавање студената са рачунарском и мрежном инфраструктуром за складиштење великих количина података, велике хетерогености и великих брзина пристизања. Стицање знања и савладавање практичних вештина упримени различитих алгоритама за анализу великим скуповима података (Big Data).

Студент је оспособљен да користи савремене технологије за складиштење и дистрибуирану организацију великих количина података како у физичким тако и виртуелним рачунарским системима. Уме да примени алате за управљање великим подацима, и прилагоди алгоритам за дистрибуирану обраду података. Студент може да осмисли, прилагоди и имплементира одређеним софтверским алатима разне алгоритме анализе великих количина података.

Складиштење података. Дистрибуирани фајл системи ( Hadoop, Spark ). Виртуелна складишта и комуникације. Виртуелизација база података. Управљање великим базама података на cloud-u. MapReduce. програмски модел за дистрибуирану обраду података. Претраге података (слични узорци, фреквентни скупови узорака). Подаци у облику графова, анализа линкова, локални и глобални тополошки атрибути. Алгоритми машинског учења на великим подацима. Визуелизације података. Практичан рад са студентима подразумева инсталацију и упознавање дистрибуираних фајл система, практичну реализацију виртуелизације база података и комуникације. Примена MapReduce алгоритма на одабраним проблемима, као и имплементацију алгоритама за анализу података на доступним великим базама података. Домаћи задаци и студентски пројекат имају за циљ проверу способности студента да повеже и имплементира знања. Студентски пројекат може да се уради и у лабораторијама ФТН, кроз решавање проблема ове врсте на научним пројектима, научним изазовима и студентским такмичењима Ова врста активног учења може бити реализована и кроз студентске праксе у компанијама које се баве имплементацијом физичких и виртуелних рачунарских система за дистрибуирано складиштење великих количина података и развојем и применом Big Data аналитике.

Предавања се изводе уз презентације доступне студентима који се ослањају на наведену литературу. Праћена су рачунарским и лабораторијским вежбама која имају за циљ да студентима дају непосредну могућност да имплементирају научено. Студентски пројекат треба да обухвати непосредан рад са дистрибуираним фајл системима, софтверима за управљање подацима и имплементацију адекватних аналитичких метода над подацима великог обима. Предиспитне обавезе чиниће на време урађени домаћи задаци, као и завршен и успешно одбрањен самостални студентски пројекат

Аутори Назив Година Издавач Језик
Tam Sel Apache Spark and Hadoop for beginners 2020 Kindle Direct Publishing Енглески
J. Leskovac, A. Rajaraman, J. D. Ullman Mining of Massive Datasets, 3rd Ed 2020 Cambridge University Press Енглески
Greg Schulz Software-Defined Data Infrastructure Essentials: Cloud, Converged, and Virtual Fundamental Server Storage I/O Tradecraft 2017 CRC Press Енглески
Ж.Бојовић, Ј. Шух, П. Бојовић Софтверске технологије у рачунарским мрежама са великим подацима 2021 Факултет техничких наука, Нови Сад Српски језик
Предметна активност Предиспитна Обавезна Број поена
Предметна активност
Домаћи задатак
Предиспитна
Да
Обавезна
Да
Број поена
5.00
Предметна активност
Домаћи задатак
Предиспитна
Да
Обавезна
Да
Број поена
5.00
Предметна активност
Предметни пројекат
Предиспитна
Да
Обавезна
Да
Број поена
50.00
Предметна активност
Домаћи задатак
Предиспитна
Да
Обавезна
Да
Број поена
5.00
Предметна активност
Теоријски део испита
Предиспитна
Не
Обавезна
Да
Број поена
30.00
Предметна активност
Домаћи задатак
Предиспитна
Да
Обавезна
Да
Број поена
5.00

Предавања

Предавања

Рачунарске вежбе

Рачунарске вежбе