Fakultet tehničkih nauka

Predmet: Računarska analiza teksta (17.E2524)

Osnovne informacije:
 
Kategorija Teorijsko-metodološki
Uža naučna oblast Primenjene računarske nauke i informatika
ESPB 6

Upoznavanje studentata sa konceptima i tehnikama računarske analize teksta (Text Mining, TM) i ekstrakcije informacija (Information Extraction, IE). Osposobljavanje studenata za primenu tehnika, metoda i alata iz oblasti računarske analize teksta i ekstrakcije informacija.

Poznavanje koncepata, tehnika i alata za analizu i istraživanje teksta. Student je obučen da vrši obradu i pred-procesiranje nestrukturiranih tekstualnih podataka; primenjuje osnovne tehnike obrade prirodnih jezika; kreira modele za klasfikaciju teksta i ekstrakciju informacija; projektuje i održava text mining sisteme.

Osnovni koncepti i pregled oblasti računarske analize teksta i ekstrakcije informacija. Pred-procesiranje teksta. Leksička, sintaksna i semantička analiza. Upotreba metoda mašinskog učenja u analizi teksta: klasifikacija i klasterovanje tekstulanih dokumenata. Probabilistički modeli za ekstrakciju informacija: modeli maksimalne entropije (Maximum Entropy Models, ME), skriveni modeli Markova (Hidden Markov Models, HMM), uslovna slučajna polja (Conditional Random Fields, CRF). Metode ekstrakcije informacija zasnovne na pravilima (rule-based information extraction). Automatska ekstrakcija termina. Automatska ekstrakcija i semantička anotacija imenovanih entieta iz teksta. Automatska sažimanje tekska. Sistemi za za automatsko odgovaranje na pitanja. Vizualizacija tekstualnih podataka. Ekstrakcija informacija iz poslovnih izveštaja. Automatsko prepoznavanje stavova i emocija iz teksta (opinion and sentiment mining). Ekstrakcija informacija u biologiji i medicini.

Oblici izvođenja nastave su: predavanja, računarske vežbe, izrada domaćih zadataka, i konsultacije. Na predavanjima se, korišćenjem potrebnih didaktičkih sredstava, izlažu sadržaji predmeta i stimuliše se aktivno učešće studenata postavljanjem pitanja. Praktični deo gradiva studenti savladavaju na računarskim vežbama kroz zadatke koje rešavaju uz pomoć asistenta ili samostalno i kroz samostalnu izradu domaćih zadataka

Autori Naziv Godina Izdavač Jezik
Benjamin Bengfort, Rebecca Bilbro, Tony Ojed Applied Text Analysis with Python: Enabling Language-Aware Data Products with Machine 2018 O'Reilly Media Engleski
Sholom M. Weiss, Nitin Indurkhya, Tong Zhang, Fred Damerau Text Mining: Predictive Methods for Analyzing Unstructured Information 2004 Springer Engleski
Ronen Feldman, James Sanger The Text Mining Handbook: Advanced Approaches in Analyzing Unstructured Data 2006 Cambridge University Press Engleski
Li Deng, Yang Liu Deep Learning in Natural Language Processing 2018 Springer Engleski
Yoav Goldberg Neural Network Methods in Natural Language Processing 2017 Morgan & Claypool Publishers Engleski
Predmetna aktivnost Predispitna Obavezna Broj poena
Predmetna aktivnost
Usmeni deo ispita
Predispitna
Ne
Obavezna
Da
Broj poena
50.00
Predmetna aktivnost
Predmetni projekat
Predispitna
Da
Obavezna
Da
Broj poena
50.00
Predavanja
Računarske vežbe